DeepSeek,打破历史!中国AI的“Nature时刻”
吃瓜电子官网最新热点:DeepSeek,打破历史!中国AI的“Nature时刻”
更新时间: 浏览次数:5754
中国大模型,首登Nature封面。 9月17日,在最新😘一期的国际权威期刊Nature(自然)中,DeepSeek-🤔R1推理模型研究论文登上了封面。该论文由DeepSeek团队😁共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发💯大模型推理能力的重要研究成果。这是中国大模型研究首次登上Na🤗ture封面,也是全球首个经过完整同行评审并发表于权威期刊的👍主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认💯可。 Nature在其社论中评价道:“几乎所有主流的大🤩模型都还没有经过独立同行评审,这一空白终于被DeepSeek🤩打破。” 中国AI大模型的“Nature时刻” 😆自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终😉缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡💯有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。😴 DeepSeek以其公开性和透明性打破了这一局面。D🥳eepSeek-R1模型的研究论文最早于今年年初发布在预印本😎平台arXiv上。自今年2月14日向Nature投递论文至今🥳,历经半年,8位外部专家参与了同行评审,DeepSeek-R😍1推理模型研究论文终获发表,完成了从预印本到Nature封面🤗的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方😘法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度❤️和可重复性的可喜一步。 因此,Nature也对Deep🤗Seek的开放模式给予高度评价,在其社论中评价道:“几乎所有😜主流的大模型都还没有经过独立同行评审,这一空白终于被Deep😀Seek打破。”全球知名开源社区Hugging Face机器😉学习工程师Lewis Tunstall也是DeepSeek论❤️文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这😅种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的😀潜在风险。” 据了解,DeepSeek本次在Natur😀e上发表的论文较今年年初的初版论文有较大的改动,全文64页,😉不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细💯节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,🤗提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行🌟了全面评估。 其中,在训练成本方面,R1-Zero和R🙄1都使用了512张H800GPU,分别训练了198个小时和8😴0个小时,以H800每GPU小时2美元的租赁价格换算,R1的👏总训练成本为29.4万美元(约合人民币209万元)。不到30🚀万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可😴谓实现了极大的降本。 关于R1发布最初时所受到的“蒸馏😊”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽👍然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门💯的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型❤️输出的结果,作为监督信号再去训练另外一个模型。R1发布时,O😂penAI称它发现DeepSeek使用了OpenAI专有模型🤔来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。 💯 R2何时问世引发关注 自今年年初发布R1以来,D⭐eepSeek在全球树立了开源模型的典范,但过去数月,外界对👏于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2❤️的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有👍关。 展开全文 值得注意的是,今年8月21日,D🙌eepSeek正式发布DeepSeek-V3.1,称其为“迈🤩向Agent(智能体)时代的第一步”。据DeepSeek介绍🙌,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同😢时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短🔥时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新😡模型在工具使用与智能体任务中的表现有较大提升。 由于R😊1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路😀上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek🥳强调DeepSeek-V3.1使用了UE8M0 FP8 Sc😍ale的参数精度,而UE8M0 FP8是针对即将发布的下一代👏国产芯片设计。这也表明未来基于DeepSeek模型的训练与推😍理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表🔥态一度带动国产芯片算力股股价飙升。 中国银河证券研报指🌟出,DeepSeek从V3版本就开始采用FP8参数精度验证了😘其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟🤯制程(12-28nm)上接近先进制程英伟达GPU的算力精度,😴DeepSeek-V3.1使用UE8M0 FP8 Scale🙌参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”🤯的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多😴拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同🎉换取数量级性能的提升,国产算力芯片将迎来变革。 责编:😘万健祎 校对:王朝全 版权声明 " Typ👍e="normal"@@--> 证券时报各平台所有原创👍内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关❤️行为主体法律责任的权利。 转载与合作可联系证券时报小助🌟理,微信ID:SecuritiesTimes " Ty😘pe="normal"@@-->返回搜狐,查看更多
北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)
天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)
河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)
唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)
秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)
邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)
邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)
保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)
张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)
承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)
沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)
第一财经 不同硬件、不同大脑,不同机器人厂商进入不同场🌟景,在多方变量的加持下,机器人的规模化落地似乎遥遥无期。 😎 9月17日,第一财经记者在采访第三方部署方、机器人本体厂🤗商和场景落地方时发现,一个行业新角色正在出现。一个类似于安卓🤗操作系统的中间算法层正在承担屏蔽硬件差异、兼容不同大脑架构的🔥功能,为机器人在真实场景中的规模化落地提供可能。 如今😁,这一产业角色已经吸引了谷歌、智元、富临精工(300432.❤️SZ)、格力博(301260.SZ)、东土科技(300353😴.SZ)、巨星新材料等企业押注。但在硬件厂商坚持自家体系、大🤗模型企业追逐通用智能的格局下,行业的“安卓时刻”何时到来,仍😂有待市场与现实工况的双重检验。 机器人涌入场景,跨本体🎉训练遇阻 当机器人厂商涌向场景方,新的问题正在出现。 🥳 “这个月至少有两家机器人公司正在和我们谈合作。”Kel🤩vin是长三角一家物流上市公司的技术负责人,他告诉记者,为了😢和人形机器人厂商进行合作,自己不得不拨出一个八人左右的团队和😢不同机器人企业进行对接。“我们需要开放不同的数据接口,提供一😁个专门的实验场景,还需要根据各家机器人的要求不断调整流程和测😊试参数”。 在大量的人力和物力投入之外,Kelvin坦❤️言自己算不过来ROI(Return on Investmen💯t,投资回报率)。“机器的工作效率不稳定,且运维需要大量后续😁的费用。”他向第一财经记者透露,物流企业马上就会备战“双11🤩”时间,在此期间是否继续让机器人上岗,他还在犹豫。 更😂大的问题是,由于不同厂商的机器人算法不兼容、硬件各自封闭,导🌟致一个场景的成功经验难以迁移到另一个场景。“有的时候我们的流😁水线哪怕是多一个弯折,机器人都需要重新走一轮POC(Proo⭐f of Concept,概念验证)。” “厂商觉得我🙌们不够开放,我们觉得机器人厂商要得太多。”Kelvin说,这🎉是产业上下游之间对接存在的普遍问题。第一财经记者了解到,一些👍“中间人”的角色正在产业链中诞生。前上汽自动驾驶域控制器算法😘负责人,安努智能工程算法总监杨曾告诉记者,团队正在研发的一套⭐中间件算法平台,希望像手机里的操作系统一样,把不同厂商的机器🔥人纳入统一的兼容框架。 就像手机的操作系统让不同软件在💯同一套规则下运转一样,中间件希望能够通过屏蔽底层硬件差异,使😉一套算法能够迁移到不同厂商的机器人上。“如果每遇到一个新的硬🙄件,就要重新训练,机器人在实际场景部署的速度就会非常慢。”重🌟庆大学助理教授,人工智能及多模态实验室具身智能负责人,安努智🤗能首席科学家胡喆告诉第一财经记者,想要提高机器人的通用化,跨😅本体是必须跨过的门槛。 在不改动模型本身的前提下,兼容🤩不同机器人的大脑,成为中间件的挑战。“虽然主流的模型是VLA🤔模型(Vision-Language-Action Mode😢l,视觉-语言-动作模型),但其中的架构仍然不同,有端到端,🥳也有分层式。”胡喆说,中间件在机器人大脑和机器人作业的实际场💯景中充当一个“翻译官”的角色。在他的设想里,输出的指令会先被😆中间件被转化为统一的目标和约束,再交由各家机器人自身的规划控😊制器执行。 “这样我们就不必为每一个新厂商重新训练模型🤔,只需要向每一个机器人的规划控制器下达指令,就能让中间件跑通🤗整个流程。”胡喆说。 展开全文 物理规律难仿真,🎉机器人“干中学” “我们曾经试过,在实验室里跑通了所有😴算法,结果到实际场景中发现完全不是一回事儿。”钛维云创的创始🤯人张磊告诉记者,当自己试图让机器人处理布料这样的柔性物体时,🚀由于布料材质、厚薄、摩擦力不同,实验室的环境并不能完全满足操😆作需要。 张磊透露,像布料、不规则包裹等物体,POC周😜期“很长,且难以给出确切的时间”,“因为我们需要提前磨合算法🙄、下线采集数据、再拿到实验室反复训练,才能勉强适配场景”。 🎉 工厂中的物料、工艺成千上万,换一条生产线、换一个工位,😅都可能带来完全不同的情况。 “离线的强化学习不可能把所🙄有真实场景一网打尽。”胡喆告诉第一财经记者,机器人不仅需要根😎据场景反复调试算法,还往往要重新采集数据回到实验室做离线训练😂,这让整个周期被拉长,时间和人力都被大量消耗。 边做边🚀改,或许才是机器人进行学习的关键。 胡喆透露,他正在尝😴试利用实时的在线学习算法,允许机器人在实际作业过程中一边操作😜一边采集数据,并实时更新模型。这种方式只需在现场额外增加几秒👏钟运行和100个数据量,“我们会根据模型出来的结果选择数据,😉让机器人在不断学习的过程中遗忘无用的数据,保持数据的精简,也😀不会对算力提出过多的要求”。 机器人“干中学”的另一边🙄,团队也在尝试利用仿真等手段降低机器人的学习成本。“现在大部🎉分机器人仿真环境离现实工况还有很大差距,因为仿真环境中缺乏物🔥理定律的支撑。”美国肯塔基大学空气动力实验室仿真负责人、安努❤️智能联席科学家付博直言,大部分仿真平台依赖数据驱动,却缺乏物😴理定律的支撑。 “如果只是换个环境光影、物体形状等表层🔥变量,那在这种仿真里能跑通的算法,一旦放到现实中,往往会失效😀。”付博说。 让虚拟环境逼近真实世界,并不是一件容易的🔥事。“摩擦力、空气流动等连续变化的环境很难被拆成可以极端的小👏单元。”付博解释,以机器人搬箱子举例,这个场景涉及了力学、刚😡体运动学与工程力学等基本的物理规律。付博说,加入这些规律的仿🤔真能够模拟不同重量箱子堆叠时的微小形变,计算箱内散落零件导致😡的重心偏移,并让机器人理解物体变化对抓取稳定性的影响,以及机🤩器人发力点与物体形变的关联。 他坦言,将这些物理定律的😢融入仿真环境是一个“正在进行的过程”,需逐步攻克计算量庞大的🙄技术难题。付博认为,只有当机器人在仿真环境中充分理解并内化这🤩些物理规律,才能在真实场景中更好地应对突发情况,实现泛化能力🎉的提升。“模型永远无法完全替代实验,但我们希望通过极致的物理😀仿真,让真实实验只需做一次就能验证可行性。” 谷歌提前⭐布局,中间件或成规模化关键 从机器人本体和大脑厂商到最😉终的应用企业,中间还需要大量复杂的部署工作——包括接口打通、😂场景适配、算法迁移等环节。对整个产业链而言,这是一块颇具吸引🤩力的“肥肉”,盯上的远不止安努智能一家企业。 今年6月🤗,银河通用和博世中国成立合资公司博银合创。根据双方披露内容,😀合资公司将聚焦复杂装配、智能质检等高精度制造场景,并且构建标😂准化、模块化、可复制的训练与部署体系,支撑机器人产品的快速迭🤔代与规模化部署。 今年年初,富临精工宣布公司与智元机器⭐人等相关方签署了《人形机器人应用项目投资合作协议》,各方共同😂投资设立合资公司实施人形机器人项目。当前,富临精工、智元、巨😢星新材料均为安努智能股东。就在9月,专注于北美市场的产业股东🤩格力博、聚焦机器人操作系统的东土科技也宣布增资安努智能。 👏 在海外,Google(谷歌)的母公司Alphabet孵化😎的Intrinsic也在扮演类似的角色。Intrinsic试🤩图通过通用算法和工具链降低机器人系统的集成成本,让不同厂商的😆机器人在同一套兼容框架下运行。 通过一个类似操作系统的😂中间件来对接不同机器人厂商和场景,这是安努智能董事长文宏杰提😍出的解题思路。虽然路径各异,但上述三家兼具机器人和产业方背景🙄的第三方部署商,它们的共同点都是试图在碎片化的产业格局中,寻👏找一套能跨越厂商和场景的兼容方式。 不过,机器人产业是👏否会像手机产业那样,最终走向由统一“操作系统”支撑的格局,仍😢充满疑问。一位由数码3C行业转至机器人产业的工程师告诉第一财😆经记者。与手机产业面临的问题不同,机器人领域的情况更为复杂,😅硬件厂商坚持各自的体系,而大模型企业则瞄准通用智能,“屁股决😊定脑袋,大家想的未必是同一个目标”。 多方角力之下,第😊三方部署商设想的中间件是否能够建立起产业上下游的桥梁,还需要😴进一步观察。“模型如果停留在实验室、本体如果只会跳几支舞,那😜最终只是一个故事。”文宏杰认为,在当下的机器人产业,关键不是😆讲模型和本体的“故事”,而是扎进具体场景,通过部署获取真机数🥳据和工程化经验,将商业化的流程拉通、沉淀。 在他看来,🔥这些工程化的经验和数据才能汇聚成类似“操作系统”的底座,真正🔥支撑机器人跨厂商、跨场景的落地。“如果中间件能够像安卓这样的🚀操作系统一样稳定通用、开放兼容,任何厂商都能接入,机器人产业😜的规模化会越来越近。” (本文来自第一财经)返回搜狐,😊查看更多
推荐阅读
涉及10名干部!云南省人民政府发布任免职通知
7209
事关纯牛奶,今起全面禁用!
6170
富民县散旦镇党委书记张会春接受纪律审查和监察调查
8523
关于李鹏等37名同志任免职的通知
8861
迪庆州1名干部接受审查调查
5064
到底什么才是预制菜?6部门曾发文明确!
7553
罗永浩宣布“停战”
1314
突发!金价,彻底爆了!
9043
白天擦脸上,可能增加致癌风险!很多人天天接触,却不知道……
5268
罗景锋任楚雄州人民政府副州长、代理州长
3274
丽江市1名干部接受审查调查
2893
冯皓任昭通市人民政府副市长、代理市长
3930
昆明拟探索实行网约车政府指导价
6981
孟继早等同志拟任职务公示
4149
云南检察机关依法对韩跃先涉嫌受贿、徇私枉法案提起公诉
6569
呈贡区这两个城中村将提升改造,位置在→
6015
演员被围堵高铁站台拍照,铁路部门通报
5575
云南检察机关依法对许雷涉嫌贪污、受贿、挪用公款、国有公司人员滥用职权案提起公诉
4341
曲靖市1名干部接受审查调查
4671
微信最新公告:集体下架!
3632
今晚起,睡觉请把手机放1.5米以外
5968