这一战,谷歌准备了十年
吃瓜电子官网最新热点:这一战,谷歌准备了十年
更新时间: 浏览次数:1982
文 | 半导体产业纵横,作者 | 俊熹 文 | 半导体🙌产业纵横,作者 | 俊熹 9月3日,一则消息在科技圈引😎起了轩然大波:谷歌开始对外出售TPU了。 据报道,谷歌🙄近期已在接触那些主要租赁英伟达芯片的小型云服务提供商,敦促他🤯们在其数据中心也托管谷歌自家的AI处理器,也就是TPU。 😊 谷歌已与至少一家云服务提供商——总部位于伦敦的Fluid😘stack——达成协议,将在纽约的一个数据中心部署其TPU。🤔 谷歌的努力不止于此。据报道,该公司还向其他以英伟达为🌟核心的服务商寻求类似的合作,其中包括正在为OpenAI建造数🙄据中心的Crusoe,以及向微软租赁芯片并与OpenAI签有❤️供应合同的英伟达“亲儿子”CoreWeave。 9月9🤩日,花旗分析师因TPU竞争加剧将英伟达目标价下调至200美元😀,预计2026年GPU销售额将因此减少约120亿美元。 🤔 明眼人都能看出来的是,谷歌和英伟达之间的大战,已经开始了。😉而它们争夺的,将是AI计算这个真正的万亿美元市场。 然😴而,谷歌对这一战的准备,其实比我们想象的都要久。 TP😴U,AI计算的最优解? 早在2006年,谷歌的内部就讨😜论过在自家的数据中心中部署GPU、FPGA或ASIC的可能性💯。不过,当时只有少数应用程序能够在这些特殊硬件上运行,而谷歌😡大型数据中心的过剩算力也完全够它们使用了。因此,部署特殊硬件😁的计划被搁置。 然而,到了2013年,谷歌的研究人员发🥳现:如果人们每天使用语音搜索并通过深度神经网络进行3分钟的语🌟音识别,那么当时谷歌的数据中心需要双倍的算力才能满足日益增长😎的计算需求。 而如果仅通过扩大数据中心规模来满足算力需😀求,不但耗时,而且成本高昂。于是,在这个背景下,谷歌开始了T😆PU的设计。 谷歌的TPU是为AI计算而生的ASIC芯🌟片,它专注于实现两个核心目标:极高的矩阵乘法吞吐量与卓越的能🎉效。 为了实现高吞吐量,TPU在硬件层面采用了“脉动阵🎉列”(Systolic Array)架构。该架构由大量简单的😉处理单元(PE)构成网格。数据流从阵列的边缘输入,在每个时钟😅周期同步地、一步步地流经相邻的处理单元。每个单元执行一次乘法👏累加运算,并将中间结果直接传递给下一个。 这种设计使得🙌数据在阵列内部被高度复用,最大限度地减少了对高延迟、高功耗主😜内存的访问,从而实现了惊人的处理速度。 而其卓越能效的👏秘诀,则在于软硬件协同的“提前编译”(Ahead-of-Ti😍me Compilation)策略。传统的通用芯片需要高能耗🔥的缓存来应对多样的、不可预测的数据访问。TPU则不同,它的编😜译器在程序运行前就完整规划好了所有数据路径,这种确定性使其无🙌需复杂的缓存机制,从而大幅降低了能耗。 展开全文 🤗 在TPU的设计上,谷歌主导整体架构与功能定义,博通Broa🎉dcom参与了部分芯片的中后端设计工作,目前,Google 😡TPU主要由台积电代工生产。 随着大语言模型参数的急剧😍扩张,AI计算任务正在从“训练”走向“推理”。这时,作为通用🤗算力单元的GPU,开始显露出成本以及功耗过高的问题。 😴而TPU从设计之初就专门瞄准了AI计算,具有很高的性价比优势😀。据报道,谷歌TPU算力成本仅为OpenAI使用GPU成本的😡1/5,性能功耗比更是优于同代GPU。 因此,为了抓住👏市场,谷歌围绕着自己的TPU架构,打造了一系列产品与生态。 😢 谷歌造芯这十年 谷歌第一代TPU (v1) 于2🙄015年推出,通过高度简化的专用设计,实现了超越同期CPU与😂GPU的能效比,并在AlphaGo等项目中展示了其高效能,从🤗而验证了AI ASIC的技术路径。 随着研发深入,训练🙌环节的算力瓶颈日益凸显,促使TPU的设计方向转向系统级解决方😉案。2017年发布的TPU v2为此引入了BF16数据格式以🌟支持模型训练,并配置了高带宽内存(HBM)。 更为关键😎的是,v2通过定制的高速网络将256个芯片单元互联,首次构建🙌了TPU Pod系统。随后的TPU v3通过增加计算单元数量😎和引入大规模液冷技术,实现了性能的显著提升。 TPU 😴v4的发布带来了互联技术的重大革新,其核心是采用了光学电路交⭐换(OCS)技术,实现了TPU Pod内部网络拓扑的动态重构⭐,从而提升了大规模训练任务的容错能力与执行效率。进入v5与v😘6 (Trillium) 阶段,TPU产品线呈现出分化策略,👍形成了分别侧重于极致性能的'p'系列与能效比的'e'系列,以🥳适应多样化的AI应用场景。 2025年Google T😂PU的全年出货量预计为250万片。v5系列总出货量预计为19😘0万⽚,其中v5e占⽐约120万⽚,v5p占⽐约70万⽚, 😁v6系列预计总出货量为60万⽚,⽬前仅v6e在市场上销售,⽽🤗v6p将在第四季度上市,约10-20万⽚左右。预计到2026😜年,总体TPU销量将超过300万片。 在今年的谷歌云大🎉会上,谷歌发布了第七代TPU,代号“Ironwood”。 ⭐ Ironwood是谷歌迄今为止性能最强、能效最高且最节能🌟的TPU芯片,其峰值算力达到4614 TFLOPs,内存容量😡为192GB,带宽高达7.2 Tbps,每瓦峰值算力为29.🤩3 TFLOPs。此外,Ironwood首次支持FP8计算格👍式,并在张量核和矩阵数学单元中实现这一功能,这使得其在处理大👍规模推理任务时更加高效。 Ironwood最高配集群可🥳拥有9216个液冷芯片,峰值算力可达42.5 ExaFLOP😎S,是世界上最大的超级计算机El Capitan的24倍以上🤗。其支持大规模并行处理和高效内存访问,适用于复杂的推理任务如⭐大型语言模型和混合专家模型。 事实上,Ironwood🤗的整体性能已经十分接近英伟达B200,甚至在一些方面还有所超😜越。 当然,英伟达的统治力不仅在于其硬件性能,更在于整🤯个CUDA生态。谷歌深知这一点,因此,它也构建了JAX这样的😁,能在TPU上运行的高性能计算Python库。 谷歌还⭐发布了其模型流水线解决方案“Pathway”,用于向外部开发😘者训练大型语言模型(LLM)。将其作为训练模型的必备手册,研😡究人员无需重新设计模型即可开发Gemini等LLM。 😎有了上述的一整个“军火库“,谷歌终于可以和英伟达掰掰手腕了。😡 谷歌vs英伟达 投资银行D.A. Davids😢on分析师Gil Luria在最新报告中指出,过去一年以来谷😆歌母公司Alphabet大幅缩小与英伟达的差距,如今已成为“😎最好的英伟达替代方案”。 报告显示,过去半年,围绕Go😆ogle Cloud TPU的开发者活跃度激增了约96%。 😀 Gil Luria与前沿AI实验室的研究人员和工程师交🤗流后发现,业内普遍看好谷歌TPU。因此Luria认为,若谷歌⭐将TPU业务与DeepMind部门合并并将它们分拆上市,估值⭐或将高达9000亿美元。 AI独角兽Anthropic👍此前使用亚马逊的Trainium芯片来训练模型,最近,该公司👏被发现正在招聘TPU内核工程师;马斯克旗下的人工智能公司xA🤔I也对采购TPU表现出兴趣。这一切都说明了业界对于TPU的认🤯可。 而谷歌自身也在积极行动。首先,谷歌有意在公司内部🙌进行从英伟达GPU到自研TPU的迭代。Omdia数据显示,2😜024年估计谷歌订购16.9万台Hopper 架构GPU,在🔥五大云厂商中排名最后,约为微软的三分之一。同时,谷歌内部已部👍署了约150万颗TPU。 谷歌的对外战略,就是文章开头🎉提到的,对那些使用英伟达芯片的数据中心供应TPU。据报道,为🙄了与Floydstack达成合作,谷歌将提供最高32亿美元的😎备选担保支持,若Fluidstack无力支付纽约新数据中心的😘租赁费用,谷歌将补足差额。 根据野村证券最新报告,预计😉到2026年,ASIC总出货量很可能会第一次超过GPU。而T🚀PU正是目前最成熟的ASIC。 英伟达需要紧张起来了。😀 结语 市场对谷歌TPU的积极接受,反映出越来越🌟多的公司想摆脱英伟达“一卡难求“的困境,寻求更高的性价比和更⭐多元、稳定的供应链。 而借此机会挑战英伟达的,也不只有😴谷歌一家公司。供应链数据显示,Meta将于2025年第四季度🤔推出其首款ASIC芯片MTIA T-V1。它由博通设计,具有🤩复杂的主板架构,并采用液冷和风冷混合技术。 到2026😍年年中,MTIA T-V1.5将进行进一步升级,芯片面积将翻🤗倍,超过英伟达下一代GPU Rubin的规格,其计算密度将直⭐接接近英伟达的 GB200 系统。2027年的MTIA T-🤩V2可能会带来更大规模的CoWoS封装和高功率机架设计。 🙄 报告指出,根据供应链估计,Meta的目标是到2025年底🤩至2026年实现100万至150万件ASIC出货量。 😴微软、亚马逊同样有自研的ASIC芯片,正在对这片被GPU霸占😍的市场虎视眈眈。 对此,英伟达也有自己的反击手段。今年🚀5月,英伟达正式发布NVLink Fusion。NVLink😜 Fusion允许数据中心将英伟达GPU与第三方CPU或定制😜化AI加速器混合使用,标志着英伟达正式打破硬件生态壁垒。 ⭐ 近日,英伟达执行副总裁暨首席财务官Colette Kre😢ss在高盛组织的会议上谈及了对于AISC芯片所带来的竞争看法😎,称英伟达GPU更具性价比。 一场大戏已经拉开了帷幕。😀无论是万亿美元的市场规模,还是未来AI时代硬件结构的定义权,😍都值得几大巨头为之疯狂。 这一战,谁都有不能输的理由。😉返回搜狐,查看更多
北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)
天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)
河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)
唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)
秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)
邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)
邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)
保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)
张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)
承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)
沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)
文 | 穆胜 文 | 穆胜 “人效”的全称是“人😉力资源效能”,对应的英文是“HR Efficiency”,而😀“Efficiency”,是投产比、效率的意思。这就产生了一😎个非常明显但鲜有人提及的问题——为什么不直译为“人力资源效率😘”,而要翻译为“人力资源效能”? 我算是国内几个最早研😴究“人力资源效能”的人,这里,我给出一个解释。 01 ⭐主打防守的模式 人效是个投产比,分母是“人力资源投入”🤗,分子是“财务或业务产出”。从数学逻辑上看,要提升人效,显然😍有两种模式: 第一种模式主打防守,主张减少分母,即“降😍低人力资源投入”。 具体做法是,精简机构、压缩编制、裁🤔撤人员。考虑一般的企业里多多少少都有组织冗余,这样的做法显然👍是立竿见影。但问题是,一方面,这种做法不可持续,组织规模不可😂能无限缩小;另一方面,如果没有理解组织的运作机制,盲目压缩组😆织,很有可能导致业务流程和组织氛围被破坏,进而影响产出(分子⭐),最终得不偿失。 事实上,大多企业就是在这条错误的道😊路上“砥砺前行”。2015年左右,我为国内一家年营收千亿的企⭐业担任人力资源顾问,当时我就为他们引入了最先进的人效管理理念💯。也就是说,很多现在才流行起来的概念,我在十年前就给他们讲过😜了。当时现场的反馈很有意思,相当一部分HR认为:“穆老师,您🌟这理念很好,但现实中,HR能够控制的只有分母,要提升人效,我😎们只能动刀砍人、砍组织。” 道理我都讲透了,但他们看到🙌的只是分母,所以,人效管理的理念并没有在这家企业落地生根。不😘能不说,这是一种遗憾,规模如此庞大的企业,但凡找一两个试点,😜尝试探索人效管理,形成成本端的竞争力和经营者的效能意识,他们❤️现在的江湖地位,就不会如此憋屈了。 02 主打进攻的模🔥式 第二种模式是主打进攻,主张增加分子,即“增加财务或💯业务产出”。 有一部分企业,的确能够只管业绩增长,不管🤔人力投入。甚至他们在人力资源投入上豪掷千金,还会被认为是“有😜格局”“有眼界”“战略性储备”。 说白了,如果业绩保持👏高速增长,人力资源这点投入,还不是九牛一毛?老板们进而就可以🚀上价值——“人才是最宝贵的资源,好的人才决定了企业的未来,找😜人才,不应该看价格。” 眼看着这些企业在人力资源投入上🔥的“大手笔”,其他企业的HR就开始泛酸——“看看人家的老板,💯看看人家的企业,看看人家的HR!我们就没打过这么富裕的仗!”😂 其实,这种“全力进攻(分子),不管防守(分母)”逻辑💯,还是因为企业有业绩增长的势能。老板们大可以把这种势能归结于😀自己在人才上的全力投入,甚至可以举出个别人才改变竞争格局的个🚀例,但说到底,这种势能还是来自于宏观经济和行业的红利,显然是😊倒果为因嘛。但舆论就是慕强的,当你业绩好了,你说什么别人都会🌟认为全是对的。 展开全文 我从来不相信那种豪掷投👏入,然后赌不确定性产出的投资模式,这种模式赌性太大,不靠谱。🚀这就好比有的头部投资机构,宣传自己的理念是“投赛道”,也就是🤗哪个赛道上出现机会的时候,就投这个赛道上几乎所有的头部项目。👍他们形容为,一把飞镖扔出去,总有一个落在靶盘上。但现实却在打😊脸,经济红利期过去了,进入寒冬了,他们的这种投资模式就不灵了🥳。所以,不要把“蒙对了”说得这么清丽脱俗嘛。 03 防😎守反击的模式 不考虑经济周期,人力资源的投资,也不能是🤔只管防守(分母)的“龟缩”;如果考虑现在是经济寒冬期,人力资😡源的投资,就不能是只管进攻(分子)的“豪赌”。 进一步😎看,即使现在经济再回归上行期,依赖“豪赌”模式的HR们价值就😴会被认可,就有前途吗?显然也不是呀。他们所谓的专业成功,在老🚀板和业务部门眼中,不过是蝇附马尾,企业要不要干掉HR,全凭老🌟板心情。 两种模式本质的问题,都是割裂了进攻(分子)与🎉防守(分母)之间的关系。奉行两种模式的企业,都不清楚人力资源😜投入是如何产生业绩的,他们只能“抓一头”。 我主张的人😴效管理,是防守反击的模式,是把有限的人力资源筹码进行合理配置😡,最大程度确保企业的确定性增长。直观来说,即使一个企业人力资👏源总投入不变,我认为,通过优化配置方式,也能明显提升人效。因🙄为大多企业的人力资源配置方式,实在有点像是“蒙眼放筹码”“菜😉市场议价定编制”,造成的局部冗员那可不是一点点。把冗员挤出来😊,放到一些真正需要人力投入的领域里,再辅以若干的人效赋能手段🙌(选用育留等),业绩增长自然就来了。 如果考虑我的这种🥳理念,人力资源效能,应该就有两层意思:一是“效”,即效率;二🎉是“能”,即产出。这个概念本身就有导向性,它表面是防守反击,😀其实是一种精实增长的进攻理念,它坚信人力资源投入和业绩产出之🤯间的强联系,认为通过人力资源职能的各种工具能够推动经营。有没🤗有发现?这个概念本身就是人力资源专业的革命,野心还挺大的! 🚀 这样看来,中文博大精深,“人力资源效能”的翻译,实在是🤯妙!返回搜狐,查看更多
推荐阅读
吏部尚书、兵部尚书、户部尚书,谁的地位高?结果跟你想的不一样
5558
刘娥:差点成为第二位武则天,但她自己选择放弃称帝,究竟为什么
3540
一地下党被上级叫去碰头,相谈不久突然发现,眼前的领导有问题
8313
1969年,朝鲜不经警告,直接击落美国预警机,美国为何忍气吞声
3190
2019年,南京夫妻砸95万代孕生下龙凤胎,孩子出生后却麻烦不断
7551
缅北大捷,6名将军携5700人投降,汉人部队赢得36年来最大胜利
5045
丈夫纨绔子弟,她孤身养育4个中央委员,临死尚不知爱子死讯
7403
1995年,北京出租车司机王宏业迎娶德国女明星,后来怎么样了?
2546
陈赓大将三次去往朝鲜,一美军长官战后感叹:他是来建地下长城的
7152
成吉思汗的奇葩爱好:细看他的后宫,就会发现传言不是“传言”
9215
滕海清中将的两位“伯乐”:倪志亮救了他的命,彭雪枫成就了他
6380
西湖大学校长施一公的爷爷施平,112岁老革命,曾当面怒怼蒋介石
2322
潘文华起义前才知,他的七姨太竟然是军统,不舍杀,给钱打发了事
6850
“蹦床公主”未婚先孕,怀孕7个月办婚礼,深陷婆家娘家矛盾漩涡
3331
32岁的皇后嫁给7岁“曾孙”,生下了8个孩子,至今被百姓崇拜
4201
武则天古稀之年豢养男宠,狄仁杰劝其戒色,武则天:看我口里面
7292
万爱花最后日子:曾下过两次病危通知书,只想听日本政府一句道歉
5726
王耀武被俘,家中搜出2辆美式拖拉机,陈毅诧异:你藏这个干什么
4028
没想到她竟潜伏了27年!江西一幼儿园老师被捕,家长无不后背发凉
1855
鄂西鏖战,陈诚只料到日军抢米却没料到抢船,若非74军,堪称完败
2706
国民党在城市留下一个最棘手的问题,中国共产党是如何解决的?
6821