新闻资讯
你的位置:开云官网kaiyun切尔西赞助商 (中国)官方网站 登录入口 > 新闻资讯 > 开云体育(中国)官方网站另一方是袁进辉过甚创立的硅基流动-开云官网kaiyun切尔西赞助商 (中国)官方网站 登录入口
开云体育(中国)官方网站另一方是袁进辉过甚创立的硅基流动-开云官网kaiyun切尔西赞助商 (中国)官方网站 登录入口
发布日期:2025-03-13 16:14    点击次数:105

开云体育(中国)官方网站另一方是袁进辉过甚创立的硅基流动-开云官网kaiyun切尔西赞助商 (中国)官方网站 登录入口

3 月 1 日,在贯串五天开源日之后,DeepSeek 又来了一个" One More Thing ",并扔下一枚"核弹"——在共享了其基础门径里极为重要的 EP(多各人并行)组件代码的同期,也初次公开了它的利润率。凭证 DeepSeek 公开的信息盘算,它表面上一天的总收入为 562027 好意思元,老本利润率高达 545%。

这是 DeepSeek 对它的"盈利才气"的最径直的一次文书。自从 DeepSeek R1 成了现象级的话题后,对它模子才气的质疑徐徐湮灭,但对它的高性价比和模子背后的老本,以及由此带来的"烧钱"问题,依然有不少质疑。有硅谷从业者称,这次公布的数据会再次让英伟达们一夜难眠,让从业者驱动新的反想。

而在国内 AI 鸿沟,这次蹙迫的开源带来的影响则以另一种愈加重烈的花式呈现了出来——它激勉了一场两家中国 AI Infra 公司之间的"血案"。

尤洋与袁进辉的争论

事件的两个主角,一方是尤洋过甚创办的潞晨科技,另一方是袁进辉过甚创立的硅基流动。

先是 DeepSeek 的这篇时期共享在知乎发布后,不少用户驱动 @尤洋,让他点评。这是因为此前在 DeepSeek 被各家作事商争相部署的飞扬里,他是最积极的反对声息之一。此前尤洋曾在酬酢平台上盘算过部署 DeepSeek 的老本和收益,并得出论断,部署 DeepSeek 并提供作事的 AI Infra 公司,齐是在亏钱,况且是"月亏四亿"。

他提到:短期内,中国的 MaaS(模子即作事)模式可能是最差的营业模式,大厂互相卷廉价和免费,满血版 DeepSeek R1 每百万 token(输出)只收 16 元。如果逐日输出 1000 亿 token,基于 DeepSeek 的作事每月的机器老本是 4.5 亿元,失掉 4 亿元;用 AMD 芯片月收入 4500 万元,月机器老本 2.7 亿元,这意味着失掉也跨越 2 亿元。

这次 DeepSeek 的开源周并非要文书某个具体质疑,但其公布的利润率之高,显著与这个盘算实足违犯。东谈主们率先意象了尤洋。尤洋也在四个小时后发文文书,称 DeepSeek 官方这一盘算模范不行用于 MaaS 盈亏评估。在诠释注解中,他赓续了"基于大模子的 Mass 作事不收获"的态度。

紧接着,他的潞晨科技告示将在一周后停供 DeepSeek API。

而另一家 AI Infra 公司硅基流动的首创东谈主袁进辉也在商讨中被许多东谈主提到。在 DeepSeek 春节时代绝对出圈走红后,硅基流动是国内最早一批活动起来提供部署作事,联络住 DeepSeek 带来的需求的公司之一。而流量之大,让这家公司不仅进展出圈,也在经由中出现一些争议,包括它此前提供的保举"反佣"式的优惠被快速薅羊毛,收费作事与免费作事的转换等。但骨子上,袁进辉和硅基流动是治服快速跟进并提供 DeepSeek 的 MaaS 作事是此刻最正确的决策。

因此尤洋当初的品评也就指向了这家同业公司。彼时,袁进辉与尤洋就如故有过一轮"交锋",前者合计失掉 4 亿的盘算模范有误,因为使用了谬妄的架构进行忖度。而尤洋径直文书:"弄 400 台机器,望望逐日能否输出 1000 亿满血 DeepSeek R1 token,让我望望。"

而这次 DeepSeek 官方径直"让东谈主看到"了这是可行的。袁进辉也在 DeepSeek 著作发布一小时后就火速指摘谈,"又颠覆了许多东谈主的证据",他合计"许多供应商作念不到这个水平"," MaaS 能否凯旋,重要在于时期实力和用户基础。"

"谁作念不到,谁即是技不如东谈主"的含义,尽在不言中。

而紧接着更戏剧化的隔空对决驱动了。尤洋随后径直发了一篇径直品评硅基流动这家公司的著作。《坑东谈主的硅基流动》(现已删除)一文将炮火从时期争论转向径直对对方的袭击。此时话题中枢也从 DeepSeek 的利润,转向了两家公司之间的恩仇情仇。袁进辉也第一时候文书,一方面强调了硅基流动一系列动作背后的想路,另一方面径直抖出"潞晨代码抄袭"的旧案。但这两个显得齐有些冲动的争论,后齐已删除。

这些争论也在知乎等时期东谈主员连合的平台上激勉了世俗的延展商讨,AI Infra 公司贫困的我方酿成了行业热议话题的主角。

到底谁算的对?

在这场争论中,到底奈何盘算,以及由不同盘算模范而得出的 AI Infra 是否是巨亏的生意,是第一个中枢议题。

在上周的贯串五天,DeepSeek 刚刚发布了五项中枢时期,涵盖盘算优化、通讯加快和存储架构等鸿沟,简直将我方的中枢 AI Infra 时期全部公布开来,大幅缓助了大模子训推硬件后果。而在 DeepSeek 的这篇《DeepSeek-V3/R1 推理系统概览》著作里,又进一步揭示了这些时期和部分是奈何拼装联系在一齐的,十分于一个串联式的追想内容。据先容,DeepSeek 使用了大限制跨节点各人并行(EP)的模范,并通过一系列时期计谋,最猛进度地优化了大模子推理系统,结束了惊东谈主的性能和后果。

在著作的末尾,DeepSeek 以表面老本和利润盘作为为句号,为这次以开源降本为中枢方针的开源周,画下了一个无缺的句号:假设 GPU 租借老本为 2 好意思元 / 小时,总老本为 87072 好意思元 / 天;如果统统 tokens 全部按照 DeepSeek R1 的订价盘算,表面上一天的总收入为 562027 好意思元 / 天,老本利润率为 545%。

其中,DeepSeek 的盘算方式如下:

这里 DeepSeek 说的很知道:

一老本只核算了等量租用 GPU 的用度,硬盘、存储、内存 CPU、东谈主力运维齐被莫得被盘算;

二收入却将 APP、网页、API 破费的统统 Token(to C 和 to B 的总破费量)加在了一齐,均按照 API(to B)的价钱盘算,表面上一天老本利润率是 545%。

事实上,这真是是一个典型的量化格调的"最大可能性"推算,咱们齐知谈,DeepSeek 的 APP 和网页是实足免费的,同期也并不保证调换的用户体验。然则假如 DeepSeek 向用户按照 API 的价钱收费,他的收入后劲不错达到上述金额。

也即是说,DeepSeek 盘算的是"我作为一个大模子厂商,我若是想,我不错赚到这样钱。"

是以,从这个角度来看,自后尤洋合计"这篇著作中的数据对盘算 MaaS 老本莫得任何参考价值",也不不测旨。

毕竟 MaaS 是典型的企业作事,而企业的第一准求并不是性能而是雄厚,而为了保证雄厚性,云厂商的特色即是弹性伸缩、按需取用,是以必须准备实足大冗余。

DeepSeek 算的是一笔"昔时的账",而 MaaS 平台如果要保证异日的雄厚,尤洋也给出了谈论比例,必须时时刻刻有 5 倍的机器迥殊为了餍足客户的需求,这里咱们需要研讨一朝部署的集群过大、使用后果、运脚、用电的老本将指数级的高潮。

尤其在如今各家 MaaS 平台用户的使用数目齐珍稀,莫得方针作念到削峰填谷资源高效愚弄的前提下,MaaS 厂商是很有可能亏本的。

追想一下,表面上(相称遐想化,一东谈主吃饱全家不饿的前提下),DeepSeek 的利润率不错达到,但研讨到实践的使用情况和大限制之后的优化老本,就很有可能亏钱了。

那么问题又来了,为什么部署 DeepSeek 亏本,而 DeepSeek 我方的推理却收获?

这个问题的谜底藏在袁进辉的回复中:目下许多供应商作念不到这个水平,主若是 V3/R1 架构和其他主流模子的离别太大了,MaaS 厂商需要按照 DeepSeek 的文书调,才能达到最佳的后果。

这里需要补充一个前提是,昔时的云厂商所缔造的 IaaS 层是以 CPU 为中枢的作事器集群,而高效的推理需要以 GPU 为中枢完成并行盘算。原来的 MaaS 用来生成问题不大,但 R1/V3 所吸收的疏淡架构,对云来说是一个新的挑战,需要特调以进行适配。

MaaS 厂商们低估了 DeepSeek 模子架构的复杂性,用老一套来复古新模子,显著出现了性能不及的阵痛。而大模子一体机由于不错径直转变到硬件层,大略凭证 DeepSeek 来迥殊定制型号,因此比 MaaS 提供的模子的性能和雄厚性齐更高,近期,硅基流动也与华为昆仑伸开了融合,推出 DeepSeek 一体机,尝试处置推感性能不及的问题。

但 DeepSeek 不仅深谙我方的模子架构,作念了软件算法层的调优,以至将算力压缩到了优化芯片层,以"榨干"每一滴性能。

幸而在刚刚昔时的开源周里,DeepSeek 开源了奈何提高推理后果的 5 个模块,表面上惟有随着作念,接下来其他 MaaS 厂商也能复现出来。

是以,AI Infra 公司们的异日在那儿?

这些争论背后,AI Infra 公司们再次被群众真贵到。作为提供底层基础门径作事的公司,它们此前从来不是外界见原的焦点,但 DeepSeek 后,由于海量的需求无法由 DeepSeek 我方来餍足,AI Infra 公司获得了一次径直面向海量世俗用户的契机,也因此出圈。

但随着 DeepSeek 在它我方 AI Infra 估量上的贯串开源,许多东谈主深切到,寂然的 AI Infra 公司似乎再次遭遇了严重的"存在感危险"。

当 DeepSeek 不仅造出了最强的模子,同期也有最强的基础门径时期时,它似乎就酿成了一个新的规章制定者:如果寂然的公司想要提供部署 DeepSeek 模子的 AI Infra 生意,你就要使用 DeepSeek 的时期决议,不仅需要卷到极致,来快速复现 DeepSeek 作念出的东西,还要在此基础上,去作念些 DeepSeek 不作念的诸如匡助开采者、匡助企业一双一的作念落地作事等,进而来承载它作事不到,或目下莫得作为重心去作事的用户们,从中尽可能的作念大用户限制,来摊薄老本,让我方的利润率也无尽接近 DeepSeek 官方算出来的那天花板的比例,这才有可能"存活"下去。

这种" DeepSeek 吃肉,其他全球比赛谁能作念喝到最多汤的那一个"的花式是否即是 AI Infra 的异日?这可能才是这场争论背后对行业确切蹙迫的话题。

袁进辉也就此话题回复了硅星东谈主,他合计这样的异日是否会发生,重要的一个变量即是开源。"如果模子一家独大,而模子厂商又想吃这块蛋糕,真是其它各方就有压力,尤其如果模子是闭源的,就像 OpenAI 这样,就会更是如斯。"他说。

"但当模子开源后,就要看外界有莫得契机把 infra 或芯片的才气作念的跨越模子厂。"

而另一个变量则是这个剧烈变革的时期周期自身,它事实上让也曾单干比拟澄莹的不同时期扮装的公司,竞争界限变得拖沓。从 DeepSeek 的部署飞扬里就能体会到——从 AI Infra 公司,到模子公司再到芯片公司,齐参与了进来,提供着相似的作事,抢夺不异的市集。

"今天模子,芯片,infra 其实齐是半制品,相互的关系是又融合又竞争,最终全球齐要角逐访佛 cloud 的位置。"袁进辉对硅星东谈主说。

在这场竞争里,AI Infra 不是最有上风的那一个,但另一方面,它事实上也领有了一次从莫得过的契机,从一个不太被真贵的边缘终于酿成了焦点。在今天这个节点,是否压上"身家性命"和对我方时期工程才气的信心去赌一把异日"下一代云"的契机,会酿成永诀这些公司的重要决定。

硅星东谈主也向尤洋提议对于 AI Infra 的异日走向的问题开云体育(中国)官方网站,他回复称,目下先不接受访谈了。