DeepSeek,打破历史!中国AI的“Nature时刻”

吃瓜电子官网最新热点:DeepSeek,打破历史!中国AI的“Nature时刻”

更新时间: 浏览次数:8656

中国大模型,首登Nature封面。 9月17日,在最新🤩一期的国际权威期刊Nature(自然)中,DeepSeek-😆R1推理模型研究论文登上了封面。该论文由DeepSeek团队😘共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发🙌大模型推理能力的重要研究成果。这是中国大模型研究首次登上Na😅ture封面,也是全球首个经过完整同行评审并发表于权威期刊的🤯主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认🎉可。 Nature在其社论中评价道:“几乎所有主流的大🤔模型都还没有经过独立同行评审,这一空白终于被DeepSeek😉打破。” 中国AI大模型的“Nature时刻” 😘自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终😅缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡🌟有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。😢 DeepSeek以其公开性和透明性打破了这一局面。D🤯eepSeek-R1模型的研究论文最早于今年年初发布在预印本🤯平台arXiv上。自今年2月14日向Nature投递论文至今🙄,历经半年,8位外部专家参与了同行评审,DeepSeek-R💯1推理模型研究论文终获发表,完成了从预印本到Nature封面😁的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方🙄法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度😜和可重复性的可喜一步。 因此,Nature也对Deep😍Seek的开放模式给予高度评价,在其社论中评价道:“几乎所有😂主流的大模型都还没有经过独立同行评审,这一空白终于被Deep💯Seek打破。”全球知名开源社区Hugging Face机器😂学习工程师Lewis Tunstall也是DeepSeek论😎文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这❤️种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的🚀潜在风险。” 据了解,DeepSeek本次在Natur🙌e上发表的论文较今年年初的初版论文有较大的改动,全文64页,🔥不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细😉节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,🔥提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行💯了全面评估。 其中,在训练成本方面,R1-Zero和R🤗1都使用了512张H800GPU,分别训练了198个小时和8💯0个小时,以H800每GPU小时2美元的租赁价格换算,R1的🙌总训练成本为29.4万美元(约合人民币209万元)。不到30😡万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可😜谓实现了极大的降本。 关于R1发布最初时所受到的“蒸馏😡”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽😁然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门😜的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型💯输出的结果,作为监督信号再去训练另外一个模型。R1发布时,O🤔penAI称它发现DeepSeek使用了OpenAI专有模型😆来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。 😉 R2何时问世引发关注 自今年年初发布R1以来,D🎉eepSeek在全球树立了开源模型的典范,但过去数月,外界对🥳于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2🤩的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有😀关。 展开全文 值得注意的是,今年8月21日,D😁eepSeek正式发布DeepSeek-V3.1,称其为“迈😴向Agent(智能体)时代的第一步”。据DeepSeek介绍😅,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同🙌时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短😢时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新😉模型在工具使用与智能体任务中的表现有较大提升。 由于R🚀1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路😍上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek👏强调DeepSeek-V3.1使用了UE8M0 FP8 Sc🤗ale的参数精度,而UE8M0 FP8是针对即将发布的下一代😢国产芯片设计。这也表明未来基于DeepSeek模型的训练与推🎉理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表😜态一度带动国产芯片算力股股价飙升。 中国银河证券研报指😂出,DeepSeek从V3版本就开始采用FP8参数精度验证了🥳其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟😂制程(12-28nm)上接近先进制程英伟达GPU的算力精度,🥳DeepSeek-V3.1使用UE8M0 FP8 Scale🚀参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”😎的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多🤩拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同😍换取数量级性能的提升,国产算力芯片将迎来变革。 责编:😡万健祎 校对:王朝全 版权声明 " Typ😀e="normal"@@--> 证券时报各平台所有原创😆内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关🙄行为主体法律责任的权利。 转载与合作可联系证券时报小助😴理,微信ID:SecuritiesTimes " Ty🙄pe="normal"@@-->返回搜狐,查看更多

北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)

天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)

河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)

唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)

秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)

邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)

邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)

保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)

张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)

承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)

沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)

第一财经 不同硬件、不同大脑,不同机器人厂商进入不同场🌟景,在多方变量的加持下,机器人的规模化落地似乎遥遥无期。 😎 9月17日,第一财经记者在采访第三方部署方、机器人本体厂🤗商和场景落地方时发现,一个行业新角色正在出现。一个类似于安卓🤗操作系统的中间算法层正在承担屏蔽硬件差异、兼容不同大脑架构的🔥功能,为机器人在真实场景中的规模化落地提供可能。 如今😁,这一产业角色已经吸引了谷歌、智元、富临精工(300432.❤️SZ)、格力博(301260.SZ)、东土科技(300353😴.SZ)、巨星新材料等企业押注。但在硬件厂商坚持自家体系、大🤗模型企业追逐通用智能的格局下,行业的“安卓时刻”何时到来,仍😂有待市场与现实工况的双重检验。 机器人涌入场景,跨本体🎉训练遇阻 当机器人厂商涌向场景方,新的问题正在出现。 🥳 “这个月至少有两家机器人公司正在和我们谈合作。”Kel🤩vin是长三角一家物流上市公司的技术负责人,他告诉记者,为了😢和人形机器人厂商进行合作,自己不得不拨出一个八人左右的团队和😢不同机器人企业进行对接。“我们需要开放不同的数据接口,提供一😁个专门的实验场景,还需要根据各家机器人的要求不断调整流程和测😊试参数”。 在大量的人力和物力投入之外,Kelvin坦❤️言自己算不过来ROI(Return on Investmen💯t,投资回报率)。“机器的工作效率不稳定,且运维需要大量后续😁的费用。”他向第一财经记者透露,物流企业马上就会备战“双11🤩”时间,在此期间是否继续让机器人上岗,他还在犹豫。 更😂大的问题是,由于不同厂商的机器人算法不兼容、硬件各自封闭,导🌟致一个场景的成功经验难以迁移到另一个场景。“有的时候我们的流😁水线哪怕是多一个弯折,机器人都需要重新走一轮POC(Proo⭐f of Concept,概念验证)。” “厂商觉得我🙌们不够开放,我们觉得机器人厂商要得太多。”Kelvin说,这🎉是产业上下游之间对接存在的普遍问题。第一财经记者了解到,一些👍“中间人”的角色正在产业链中诞生。前上汽自动驾驶域控制器算法😘负责人,安努智能工程算法总监杨曾告诉记者,团队正在研发的一套⭐中间件算法平台,希望像手机里的操作系统一样,把不同厂商的机器🔥人纳入统一的兼容框架。 就像手机的操作系统让不同软件在💯同一套规则下运转一样,中间件希望能够通过屏蔽底层硬件差异,使😉一套算法能够迁移到不同厂商的机器人上。“如果每遇到一个新的硬🙄件,就要重新训练,机器人在实际场景部署的速度就会非常慢。”重🌟庆大学助理教授,人工智能及多模态实验室具身智能负责人,安努智🤗能首席科学家胡喆告诉第一财经记者,想要提高机器人的通用化,跨😅本体是必须跨过的门槛。 在不改动模型本身的前提下,兼容🤩不同机器人的大脑,成为中间件的挑战。“虽然主流的模型是VLA🤔模型(Vision-Language-Action Mode😢l,视觉-语言-动作模型),但其中的架构仍然不同,有端到端,🥳也有分层式。”胡喆说,中间件在机器人大脑和机器人作业的实际场💯景中充当一个“翻译官”的角色。在他的设想里,输出的指令会先被😆中间件被转化为统一的目标和约束,再交由各家机器人自身的规划控😊制器执行。 “这样我们就不必为每一个新厂商重新训练模型🤔,只需要向每一个机器人的规划控制器下达指令,就能让中间件跑通🤗整个流程。”胡喆说。 展开全文 物理规律难仿真,🎉机器人“干中学” “我们曾经试过,在实验室里跑通了所有😴算法,结果到实际场景中发现完全不是一回事儿。”钛维云创的创始🤯人张磊告诉记者,当自己试图让机器人处理布料这样的柔性物体时,🚀由于布料材质、厚薄、摩擦力不同,实验室的环境并不能完全满足操😆作需要。 张磊透露,像布料、不规则包裹等物体,POC周😜期“很长,且难以给出确切的时间”,“因为我们需要提前磨合算法🙄、下线采集数据、再拿到实验室反复训练,才能勉强适配场景”。 🎉 工厂中的物料、工艺成千上万,换一条生产线、换一个工位,😅都可能带来完全不同的情况。 “离线的强化学习不可能把所🙄有真实场景一网打尽。”胡喆告诉第一财经记者,机器人不仅需要根😎据场景反复调试算法,还往往要重新采集数据回到实验室做离线训练😂,这让整个周期被拉长,时间和人力都被大量消耗。 边做边🚀改,或许才是机器人进行学习的关键。 胡喆透露,他正在尝😴试利用实时的在线学习算法,允许机器人在实际作业过程中一边操作😜一边采集数据,并实时更新模型。这种方式只需在现场额外增加几秒👏钟运行和100个数据量,“我们会根据模型出来的结果选择数据,😉让机器人在不断学习的过程中遗忘无用的数据,保持数据的精简,也😀不会对算力提出过多的要求”。 机器人“干中学”的另一边🙄,团队也在尝试利用仿真等手段降低机器人的学习成本。“现在大部🎉分机器人仿真环境离现实工况还有很大差距,因为仿真环境中缺乏物🔥理定律的支撑。”美国肯塔基大学空气动力实验室仿真负责人、安努❤️智能联席科学家付博直言,大部分仿真平台依赖数据驱动,却缺乏物😴理定律的支撑。 “如果只是换个环境光影、物体形状等表层🔥变量,那在这种仿真里能跑通的算法,一旦放到现实中,往往会失效😀。”付博说。 让虚拟环境逼近真实世界,并不是一件容易的🔥事。“摩擦力、空气流动等连续变化的环境很难被拆成可以极端的小👏单元。”付博解释,以机器人搬箱子举例,这个场景涉及了力学、刚😡体运动学与工程力学等基本的物理规律。付博说,加入这些规律的仿🤔真能够模拟不同重量箱子堆叠时的微小形变,计算箱内散落零件导致😡的重心偏移,并让机器人理解物体变化对抓取稳定性的影响,以及机🤩器人发力点与物体形变的关联。 他坦言,将这些物理定律的😢融入仿真环境是一个“正在进行的过程”,需逐步攻克计算量庞大的🙄技术难题。付博认为,只有当机器人在仿真环境中充分理解并内化这🤩些物理规律,才能在真实场景中更好地应对突发情况,实现泛化能力🎉的提升。“模型永远无法完全替代实验,但我们希望通过极致的物理😀仿真,让真实实验只需做一次就能验证可行性。” 谷歌提前⭐布局,中间件或成规模化关键 从机器人本体和大脑厂商到最😉终的应用企业,中间还需要大量复杂的部署工作——包括接口打通、😂场景适配、算法迁移等环节。对整个产业链而言,这是一块颇具吸引🤩力的“肥肉”,盯上的远不止安努智能一家企业。 今年6月🤗,银河通用和博世中国成立合资公司博银合创。根据双方披露内容,😀合资公司将聚焦复杂装配、智能质检等高精度制造场景,并且构建标😂准化、模块化、可复制的训练与部署体系,支撑机器人产品的快速迭🤔代与规模化部署。 今年年初,富临精工宣布公司与智元机器⭐人等相关方签署了《人形机器人应用项目投资合作协议》,各方共同😂投资设立合资公司实施人形机器人项目。当前,富临精工、智元、巨😢星新材料均为安努智能股东。就在9月,专注于北美市场的产业股东🤩格力博、聚焦机器人操作系统的东土科技也宣布增资安努智能。 👏 在海外,Google(谷歌)的母公司Alphabet孵化😎的Intrinsic也在扮演类似的角色。Intrinsic试🤩图通过通用算法和工具链降低机器人系统的集成成本,让不同厂商的😆机器人在同一套兼容框架下运行。 通过一个类似操作系统的😂中间件来对接不同机器人厂商和场景,这是安努智能董事长文宏杰提😍出的解题思路。虽然路径各异,但上述三家兼具机器人和产业方背景🙄的第三方部署商,它们的共同点都是试图在碎片化的产业格局中,寻👏找一套能跨越厂商和场景的兼容方式。 不过,机器人产业是👏否会像手机产业那样,最终走向由统一“操作系统”支撑的格局,仍😢充满疑问。一位由数码3C行业转至机器人产业的工程师告诉第一财😆经记者。与手机产业面临的问题不同,机器人领域的情况更为复杂,😅硬件厂商坚持各自的体系,而大模型企业则瞄准通用智能,“屁股决😊定脑袋,大家想的未必是同一个目标”。 多方角力之下,第😊三方部署商设想的中间件是否能够建立起产业上下游的桥梁,还需要😴进一步观察。“模型如果停留在实验室、本体如果只会跳几支舞,那😜最终只是一个故事。”文宏杰认为,在当下的机器人产业,关键不是😆讲模型和本体的“故事”,而是扎进具体场景,通过部署获取真机数🥳据和工程化经验,将商业化的流程拉通、沉淀。 在他看来,🔥这些工程化的经验和数据才能汇聚成类似“操作系统”的底座,真正🔥支撑机器人跨厂商、跨场景的落地。“如果中间件能够像安卓这样的🚀操作系统一样稳定通用、开放兼容,任何厂商都能接入,机器人产业😜的规模化会越来越近。” (本文来自第一财经)返回搜狐,😊查看更多

发布于:雷波县
评论
全部
还没有人评论过,快来抢首评
抢首评

推荐阅读

前TVB御用奸人过70岁大寿!被黄日华用刀架脖子上!原来曾合演过《射雕》

金羊网 2025-11-11 01:06:00 7529

TVB前花旦晒与大34岁男星合照!头依偎在肩膀上像个小女孩!网友直呼回忆杀!

金羊网 2025-11-11 02:47:56 6601

甄子丹为小18岁太太庆生!又亲又抱堪称宠妻狂魔!离过两次婚,与前妻还有一子

金羊网 2025-11-11 05:27:33 2423

TVB性感小花北京登长城!贴身小背心大晒凹凸有致身材!自爆在TVB机会突然变少

金羊网 2025-11-11 00:59:52 8628

京东外卖,刘强东送红包!浪费可惜!速领!

金羊网 2025-11-11 04:02:42 1048

33岁“翻版唐诗咏”疑似闪婚!大晒4克拉巨钻!曾被前男友坑背负巨债!由嫩模转行保险业!

金羊网 2025-11-11 00:43:49 3541

74岁TVB男星李龙基自爆未婚妻在狱中地位出众!还吃胖了不少!直呼:我也挺高兴的

金羊网 2025-11-11 04:22:20 1024

TVB力捧花旦被撮合和视帝儿子搞对象!穿婚纱性感亮相!坦言不介意姐弟恋

金羊网 2025-11-11 05:29:43 8079

本周大结局!《夺命提示》幕后大Boss究竟是谁?网友列举这几个嫌疑最大!

金羊网 2025-11-11 04:06:51 6124

TVB前花旦内地新剧演第三者,收视火爆获网友大赞演技!现身北京时欢呼一片!

金羊网 2025-11-11 05:48:22 1544

古天乐自爆拍《寻秦记》高烧41度,连续发烧7天!因此决定离开TVB!

金羊网 2025-11-11 05:33:38 7215

香港著名填词人卢国沾设灵!罗嘉良、张学友送花牌!女儿爆父亲最不放心两人

金羊网 2025-11-11 04:52:37 4786

TVB前女星患癌停止化疗一个月!被紧急叫回医院打针!自称不觉有问题

金羊网 2025-11-11 05:08:12 6638

曾志伟儿媳新剧将播!朱敏瀚和她演情侣,直呼是最想合作女艺人!

金羊网 2025-11-11 00:43:17 3919

内娱最「狠」的真人秀,杀疯了

金羊网 2025-11-11 02:44:19 5206

他塌房前的最后一部片,解禁了

金羊网 2025-11-11 01:59:46 4610

暑期档第一大片,彻底凉了

金羊网 2025-11-11 00:53:21 6593

连爆华语顶流大瓜,他被骂惨了

金羊网 2025-11-11 02:25:50 6330

消失3年的国民男神,复出了

金羊网 2025-11-11 01:05:46 3438

春节档后的票房冠军,居然是她

金羊网 2025-11-11 02:01:18 2284

塌房两年后,他一复出又爆了

金羊网 2025-11-11 05:57:55 9933
为您推荐中
暂时没有更多内容了……