(原标题:如何用GPU挣更多的钱?)
若是您但愿可以频繁碰面,接待标星储藏哦~
起原:内容来自the nextplatform,谢谢。
无特有偶,2023 年从 Nvidia 得到最多 “Hopper ”H100 分派的公司亦然超大限制公司和云磋商构建商,它们在很厚情况下齐身兼两职,既有酷爱出租 GPU 容量供他东说念主构建东说念主工智能模子,也有酷爱在大型说话模子开发方面进行调动。
清爽,Nvidia 相等但愿在竞争敌手启动蚕食其在 LLM 加快磋商方面的近乎掌握地位之前,大约在生成式东说念主工智能海浪中榨取每一分钱。2022 年夏天,OpenAI 的 ChatGPT 动作 API 推出,改变了数据中心磋商的实质。
然则,GenAI 彩虹止境的聚宝盆并莫得因为 Nvidia 而适度。跟着这些 GPU 的容量被出租,雨后春笋的企业正试图得到 GPU 时钟周期来覆按我方的模子,并但愿以此来改变我方的业务,因此,钱袋子还在不停增多。其中包括微软Azure(15万)、Meta Platforms(15万)、亚马逊汇聚管事(5万)、谷歌云(5万)、甲骨文云基础架构(5万)、腾讯(5万)、百度(3万)和阿里巴巴(2.5万)创建的大限制GPU详细体,凭据Omdia的数据,这些详细体是凭据它们的Nvidia H100分派来名次的,但其中也包括像CoreWeave(4万)和Lambda(2万)这么的纯GPU云玩家。此外,还有两张外卡:ByteDance(2 万)和 Tesla(1.5 万),它们是我方的东西,正在作念我方的 LLM。
就分内析而言,CoreWeave 和 Lambda(前身为 Lambda Labs)是最意旨的两家公司,因为它们在 GPU 分派和如何筹集风险本钱方面大作念著述。华尔街也但愿它们能在本年或来岁进行两次大限制的初次公开募股。
咱们雄厚系数的喧嚣,但咱们怀疑华尔街是否照旧磋商了了。至于这些初次公开募股前公司的估值是否合理,咱们留给你们我方去磋商。咱们以为,从基本面来看,人人股市合座估值过高,而且几十年来估值越来越高。但咱们不会因此而影响咱们的分析,因为价值是一个相对而非十足的主义。任何领有 401(k) 账户的东说念主齐需要这些热气来解说我方的真不二价值。(等等,也包括咱们)。
咱们来找点乐子。咱们一直保存着这张迷东说念主的图表,它被埋藏在 2023 年 10 月的肃清份财务敷陈中,其中包括 Nvidia 的阶梯图,咱们对其进行了剪辑,使其愈加准确,以备备而无谓。至少从 Nvidia 高层的角度来看,它解释了 GPU 骗局的经济学旨趣:
左边的饼图很容易雄厚。若是你想成为 GPU 云磋商规模的杰出人物,那么就从 10 亿好意思元启动吧。有了这笔钱,你就可以花 4 亿好意思元购买所有 16,000 台 H100 的东说念主工智能管事器,再花 1 亿好意思元购买 Nvidia 的 InfiniBand 汇聚将它们畅通起来。在这四年里,你还需要浮滥 5 亿好意思元来建造一个数据中心,并对其进交运营、供电和制冷。Nvidia 莫得对数据中心的成本或其中的铁件进行折旧,但清爽你会这么作念。
咱们不知说念 Nvidia 是如何磋商出 GPU 磋商价钱的,但按照 Nvidia 八路 DGX H100 的克隆版建树 GPU 管事器最低 40 万好意思元傍边的价钱磋商,2000 台管事器的成本便是 8 亿好意思元,而不是 4 亿好意思元。咱们以为,琢磨到对 H100 的庞杂需求,超大限制用户和云磋商构建者不会得到 46.7% 的扣头。
目下,请看右边。Nvidia 涌现,以每 GPU 小时 4 好意思元磋商,四年内的房钱契机约为 25 亿好意思元。咱们必须融会一定的巫术智商得出这个数字,底下咱们就来解释一下。
最初,若是以 16,000 个 GPU 为例,乘以四年内每小时 4 好意思元(按每年 365.25 天,每天 24 小时磋商),那么房钱收入流为 22.4 亿好意思元。而不是 25 亿好意思元。右边的饼图似乎示意,通过使用更不菲的 InfiniBand 汇聚而不所以太网,可以将 GPU 的欺骗率提高 15%,四年内价值 3.5 亿好意思元,并将 GPU 集群的笼统量提高 25%,价值 6 亿好意思元。若是假定总性能提高 43.8%,意味着只需要 11,130 个 H100 GPU,而不是 16,000 个,再乘以 11,130 个 GPU 四年内每 GPU 小时 4 好意思元的成本,就可以得到 25.1 亿好意思元的房钱收入。
啊,然则等等,通过分析亚马逊汇聚管事的 p5 GPU 实例价钱(咱们在前年七月作念了珍重分析),咱们知说念八路 H100 系统实例的按需实例价钱为每小时 98.32 好意思元,即每 GPU 小时 12.29 好意思元。咱们忖度保留一年的实例价钱为每小时 57.63 好意思元,即每 GPU 小时 7.20 好意思元,咱们知说念保留三年的实例公布价钱为 43.16 好意思元,即每 GPU 小时 5.40 好意思元。
咱们以为 GPU 房钱不会因为使用 InfiniBand 带来的性能擢升或欺骗率提高而改变。(咱们知说念 AWS 在这些 p5 实例中使用的不是 InfiniBand,而是其我方的 400 Gb/sec 以太网 EFAv2 竣事)。因此,万生优配,北京万生优配情况是这么的:若是您有 16,000 个 GPU,况且您有按需实例(50%)、一年实例(30%)和三年实例(20%)的夹杂平均值,那么四年的 GPU 房钱收入为 52.7 亿好意思元,H100 GPU 的平均成本为每小时 9.40 好意思元。使用 InfiniBand 提高了成果,这意味着云磋商可以更快地让更多客户使用这些 GPU,但这并不会改变每小时的租借成本。这仅仅意味着客户可以更快地完成使命,更多客户可以使用它,但一年惟有 35,064 个小时,365.25 天。
因此,假定 H100 GPU 的价钱更准确,InfiniBand 升级到 800 Gb/秒,AWS 上的 p5 实例要求组合订价更准确,咱们将如何剪辑 Nvidia 制作的图表:
你需要知说念:你为 Nvidia GPU 干涉 8 亿好意思元,为数据中心和汇聚再干涉 7 亿好意思元,若是你领有按需和预留实例客户的合理组合,你将再次得到 5270 好意思元的收入。
咱们以为,AWS、微软 Azure 和谷歌云基础架构之间的数字不会有太大辞别,而且咱们怀疑,只须 GPU 仍然稀缺,CoreWeave 或 Lambda 等公司的 GPU 价钱(以及收入)最终会不会低得多。
一些值得想考的问题:始终租用较少数目的 GPU 总比短期租用较多数目的 GPU 便宜,这必须与任何给定例模的 LLM 的 GPU 内存容量和 GPU 内存带宽需求比拟较。客户可能需要无数的 GPU 来存储,而不是磋商,但岂论如何,他们齐要为磋商付费。
恰是琢磨到这少许,咱们才琢磨了最近对 CoreWeave 和 Lambda 的投资。
CoreWeave 是一家比特币挖矿公司,缔造于纽约市郊区的新泽西州罗斯兰德(Roseland),目下已转向东说念主工智能处置规模,该公司今天秘书得到了来自 Coatue 的 11 亿好意思元 C 轮融资,Magnetar(领投 B 轮融资)以及 Altimeter Capital、Fidelity Management 和 Lykos Global Management 也参与了本轮融资。2023 年 12 月的 B 轮融资达到了 6.42 亿好意思元,而在此之前,2023 年 4 月的 A 轮融资也达到了 4.2 亿好意思元。前年 8 月,CoreWeave 还从 Magnetar 和黑石集团得到了 23 亿好意思元的债务融资。恰是这笔资金让 CoreWeave 在当年一年里从三个数据中心发展到十四个数据中心。这便是 21.6 亿好意思元的风险投资和 23 亿好意思元的贷款,算计 44.6 亿好意思元。这听起来似乎好多,直到你意志到这是数据中心和 GPU 系统的成本,而这些数据中心和 GPU 系统所有领有约 47,600 个 GPU。这听起来似乎好多。
但意旨的是。若是将这个 GPU 数目与咱们上头的对比进行磋商,四年的房钱收入将达到 156.8 亿好意思元。也便是说,44.6 亿好意思元的干涉,换回了 156.8 亿好意思元的收入。
假定 CoreWeave 大约从其基础形态中得到 65% 至 70% 的买卖收入,就像咱们以为 AWS 多年来大约从其 GPU 实例中得到的收入同样,然后再支付销售、营销和其他用度,那么这可能是一项十分可以的投资业务。了然于目的是,在 GPU 分派方面,组织的限制和速率对 Nvidia 来说相等伏击,因为 Nvidia 但愿尽快将 GPU 周期交到东说念主们手中,以便将 Jensen Way 传播得更远更广。
CoreWeave 发现我方可以成为一个利基阛阓的参与者,但要与超大限制企业和最大的云磋商开拓者竞争,就必须作念大。CoreWeave 的估值从上一轮融资到本轮融资的 190 亿好意思元增多了两倍,你必须我方判断 CoreWeave 的估值是否合理。还有一个等式:44.6 亿好意思元进账,190 亿好意思元或更多 IPO 出账。CoreWeave 独创东说念主发家了,每个东说念主齐有不同的形势赶上 Nvidia 海浪。
在这里,Lambda 不得不奋发图强。前年 12 月,Lambda 得到了 3.2 亿好意思元的注资,在 2017 年到 2023 年技术,Lambda 在种子前、种子轮、风险轮和债务融资方面共得到了 9.322 亿好意思元的融资。Lambda 以管事 AI 使命负载的云起家,转型成为 AI 系统制造商,目下更专注于作念 GPU 云。
再说一遍:CoreWeave 和 Lambda 齐在说,它们能以比大型云更低的成本提供 GPU 打听,但仔细想想,这只会毁伤它们的功绩。在 GPU 容量稀缺的情况下,他们应该尝试收取和 AWS 同样高的价钱,直到无法收取为止,或者是 AWS 的价钱减去 SageMaker 和 Bedrock 带来的系数价值。毕竟,你不会看到 AMD 赈济其 MI300 GPU;它对每单元磋商和每单元内存的收费与 Nvidia 对 H100 和 H200 的收费差未几。云磋商公司莫得事理以低于 AWS 的价钱出售 GPU 容量,至少目下还莫得。当 GPU 容量实足时,情况就会不同了--届时,天下上的高性能磋商中心就能蜂拥而至,以便宜的价钱完成无数科学使命。也许吧。
https://www.nextplatform.com/2024/05/02/how-to-make-more-money-renting-a-gpu-than-nvidia-makes-selling-it/
点这里加平和,锁定更多原创内容
*免责声明:本文由作家原创。著述内容系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或相沿,若是有任何异议,接待关联半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3754期内容,接待平和。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的内容就点“在看”共享给小伙伴哦现货白银交易