Claude断供风波后,是什么让中国企业躲过一劫?
吃瓜电子官网最新热点:Claude断供风波后,是什么让中国企业躲过一劫?
更新时间: 浏览次数:3171
当Anthropic一纸禁令让无数中国企业的AI梦碎了一地,😆AWS却在两周后扔出了一颗重磅炸弹——上架中国最强开源模型。❤️这不是雪中送炭,这是一场精心布局的商业智慧展示。 一夜😢之间,Claude说再见了 2025年9月5日,对许多🥳中国科技企业来说,是个黑色星期四。 Anthropic🤯突然宣布:立即停止向多数股权由中国资本持有的公司提供Clau😆de服务。消息一出,整个中国AI圈炸了锅。要知道,Claud😂e凭借其卓越的编程能力,几乎成了国内企业构建AI Codin😂g工具栈的标配,甚至是某些公司的唯一选择。 这就像你正🙌在高速公路上飙车,突然发现发动机被远程锁死了。那些把全部筹码😜押在Claude上的企业,瞬间陷入了进退两难的境地——正在推⭐进的AI项目要不要继续?已经部署的系统怎么办?客户的合同如何😴履行? 这一刀,切得又快又狠。 AWS的“反常”😢操作:把竞争对手的模型都搬上架 就在业界还在为Clau🚀de断供事件震惊时,9月19日,AWS宣布在亚马逊Bedro😀ck上线阿里巴巴的Qwen3系列和DeepSeek V3.1🤩。 这个操作,说它“反常”一点都不为过。 要知道🤩,AWS和阿里云在全球云计算市场可是实打实的竞争对手。在中国🚀乃至整个亚太市场,两家更是明里暗里较劲多年。现在AWS居然把😎阿里巴巴开源的最新一代通义千问模型搬上了自家平台,这操作着实🔥让人看不懂。 但如果你了解AWS的历史,就会发现这其实💯是他们的一贯作风。今年8月,AWS就已经上架了OpenAI的😢两款开源模型。按理说,OpenAI是微软重金投资的,而微软A😘zure是AWS最大的竞争对手;更讽刺的是,OpenAI还是😘AWS投资的Anthropic的直接竞争对手。但AWS照样把😂OpenAI的模型搬上了架。 这种看似“没有立场”的做🌟法,背后其实藏着AWS的核心哲学:Choice Matter❤️s(选择很重要)。 从“断供惊魂”到“王炸矩阵” 😢 Claude事件给所有人上了生动的一课:在AI时代,把所有😉筹码押在一个模型上,无异于把命运交到别人手里。 AWS😢 CEO Matt Garman在最近的采访中明确表示:“我🤗们不认为会有一个模型能适应所有场景。”这句话在Claude断💯供事件后显得格外有先见之明。 看看这次上架的模型阵容就😅知道AWS的野心有多大: Qwen3-Coder-48😊0B,总参数量480B,专为复杂软件工程设计,能处理高达25🤯6K的上下文窗口,用外推方法甚至能达到100万个token。🚀这意味着它能在单个任务中处理整个代码库。 De😀epSeek V3.1,号称"迈向Agentic AI时代的🚀第一步",支持思考模式和非思考模式的自由切换,在工具调用和智😂能体任务中表现卓越。 展开全文 Qw💯en3-Coder-480B,总参数量480B,专为复杂软件😡工程设计,能处理高达256K的上下文窗口,用外推方法甚至能达💯到100万个token。这意味着它能在单个任务中处理整个代码👍库。 DeepSeek V3.1,号称"迈向Agent😴ic AI时代的第一步",支持思考模式和非思考模式的自由切换🌟,在工具调用和智能体任务中表现卓越。 更关键的是价格。😎根据实测数据,Qwen3 Coder 480B的input 😘Token价格比第三方平台Fireworks低50%以上。在🙌推理速度上,每秒输出Token数和首Token时延等核心指标😊在业界领先。默认配额高达10K RPM及100M TPM,客🙄户无需为配额提升而烦恼。 这不是简单的模型堆砌,而是一💯个完整的生态矩阵:最强多模态混合推理基模Claude(是的,😎它还在)、超高性价比自研模型Nova、最受关注的开源模型GP😊T系列、DeepSeek、Qwen等,覆盖高端和低延时等各类🙄场景,成本涵盖高、中、低不同档位。 当选择权决定生死 ❤️ AI可能会成为几十年来发展最快的技术,这种创新将持续1😅0年、20年甚至30年。在这样的长周期里,任何单一依赖都可能😡成为致命弱点。 AWS的多模型战略,在平时看起来像是资😂源浪费——为什么要同时支持这么多相互竞争的模型?但在Clau😉de断供这样的黑天鹅事件面前,这种策略的价值立刻凸显出来。 ❤️ 那些在Bedrock上构建AI应用的中国企业,可以在几🥳小时内完成模型切换。而那些依赖单一模型供应商的企业,可能需要😉数周甚至数月来重构他们的系统。在AI军备竞赛中,这样的时间差🚀可能就是生与死的距离。 商业的本质:没有永远的敌人 🤯 AWS上架竞争对手的模型,表面上看是在“资敌”,实际上却🚀是在构建一个更强大的护城河。 当客户知道在AWS上可以😅找到市面上几乎所有主流模型时,他们为什么还要费力去对接多个平😢台?当切换模型变得像换个API密钥一样简单时,企业的AI战略😡就有了真正的灵活性。 这种开放策略也让AWS成为了事实🙄上的"AI基础设施层"。而阿里巴巴成为Bedrock第13个🙌模型提供商,正标志着中国AI开源生态与国际云计算平台的深度融🤩合。返回搜狐,查看更多
北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)
天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)
河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)
唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)
秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)
邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)
邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)
保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)
张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)
承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)
沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)
中国大模型,首登Nature封面。 9月17日,在最新😍一期的国际权威期刊Nature(自然)中,DeepSeek-😊R1推理模型研究论文登上了封面。该论文由DeepSeek团队😅共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发👏大模型推理能力的重要研究成果。这是中国大模型研究首次登上Na💯ture封面,也是全球首个经过完整同行评审并发表于权威期刊的🙄主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认🎉可。 Nature在其社论中评价道:“几乎所有主流的大🤔模型都还没有经过独立同行评审,这一空白终于被DeepSeek😆打破。” 中国AI大模型的“Nature时刻” 😆自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终😘缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡😅有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。🚀 DeepSeek以其公开性和透明性打破了这一局面。D🥳eepSeek-R1模型的研究论文最早于今年年初发布在预印本⭐平台arXiv上。自今年2月14日向Nature投递论文至今😀,历经半年,8位外部专家参与了同行评审,DeepSeek-R🙄1推理模型研究论文终获发表,完成了从预印本到Nature封面🙄的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方❤️法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度😀和可重复性的可喜一步。 因此,Nature也对Deep⭐Seek的开放模式给予高度评价,在其社论中评价道:“几乎所有😀主流的大模型都还没有经过独立同行评审,这一空白终于被Deep⭐Seek打破。”全球知名开源社区Hugging Face机器😡学习工程师Lewis Tunstall也是DeepSeek论😊文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这🤔种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的🤗潜在风险。” 据了解,DeepSeek本次在Natur🤯e上发表的论文较今年年初的初版论文有较大的改动,全文64页,🙌不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细🎉节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,😂提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行🤩了全面评估。 其中,在训练成本方面,R1-Zero和R🥳1都使用了512张H800GPU,分别训练了198个小时和8💯0个小时,以H800每GPU小时2美元的租赁价格换算,R1的😂总训练成本为29.4万美元(约合人民币209万元)。不到30👏万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可💯谓实现了极大的降本。 关于R1发布最初时所受到的“蒸馏💯”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽😂然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门😅的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型🎉输出的结果,作为监督信号再去训练另外一个模型。R1发布时,O💯penAI称它发现DeepSeek使用了OpenAI专有模型😂来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。 🤩 R2何时问世引发关注 自今年年初发布R1以来,D😆eepSeek在全球树立了开源模型的典范,但过去数月,外界对⭐于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2🙄的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有😆关。 展开全文 值得注意的是,今年8月21日,D🙌eepSeek正式发布DeepSeek-V3.1,称其为“迈🎉向Agent(智能体)时代的第一步”。据DeepSeek介绍🤩,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同😆时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短🤩时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新🤯模型在工具使用与智能体任务中的表现有较大提升。 由于R😢1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路😘上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek🙌强调DeepSeek-V3.1使用了UE8M0 FP8 Sc😊ale的参数精度,而UE8M0 FP8是针对即将发布的下一代💯国产芯片设计。这也表明未来基于DeepSeek模型的训练与推😅理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表🙌态一度带动国产芯片算力股股价飙升。 中国银河证券研报指💯出,DeepSeek从V3版本就开始采用FP8参数精度验证了🤯其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟💯制程(12-28nm)上接近先进制程英伟达GPU的算力精度,🥳DeepSeek-V3.1使用UE8M0 FP8 Scale❤️参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”😜的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多😊拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同😎换取数量级性能的提升,国产算力芯片将迎来变革。 责编:😉万健祎 校对:王朝全 版权声明 " Typ😁e="normal"@@--> 证券时报各平台所有原创😡内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关😀行为主体法律责任的权利。 转载与合作可联系证券时报小助😉理,微信ID:SecuritiesTimes " Ty🤔pe="normal"@@-->返回搜狐,查看更多
推荐阅读
国际油价26日上涨
3632
纽约股市三大股指26日上涨
1030
伦敦股市26日上涨
1526
美元指数26日下跌
5074
我国成功发射风云三号08星
8274
品质之城 智慧河西 河西区推动经济社会高质量发展
5706
北方年度最大车展月底在津启幕
8830
宝坻区牛道口镇第三届农民丰收节启幕
1790
市纪委监委发出通知强调 锲而不舍落实中央八项规定精神 做好中秋、国庆期间正风肃纪工作
7742
天津通报5起违反中央八项规定精神典型问题
6993
市领导深入东丽区走访调研
1895
天津发布国庆中秋假期交通预测 “两节”期间跨区域人员总流动量预计达5200余万人次
9983
“游园会”里话合作 —— “外资商会走进河西活动”侧记
4750
京唐城际铁路北京城市副中心段联调联试
9693
创新“源”动力 天大“硬”担当 ——一所百卅高等学府与一座历史文化名城的同频共进
4481
“汉语桥”系列活动圆满落幕 搭建语言之桥 共创友谊未来
3024
民企“拳头产品”名录发布
7059
京津冀制造业数字营销产教融合共同体成立
3873
今日有小雨!周日起晴天回归 适宜出行及户外活动
5863
科技成果转化再添“天津方案” “先使用后付费”机制激发创新活力
8413
智“付”连接全球 智慧畅享未来
1891