等不来DeepSeek-R2的246天:梁文锋的“三重困境”与“三重挑战”
吃瓜电子官网最新热点:等不来DeepSeek-R2的246天:梁文锋的“三重困境”与“三重挑战”
更新时间: 浏览次数:1535
文 | 大模型之家 文 | 大模型之家 9月22😅日晚间,DeepSeek官方突然发布更新,宣布DeepSee🚀k-V3.1 现已更新至DeepSeek-V3.1-Term😅inus 版本。官方表示,此次更新并非简单例行迭代,而是针对🤗用户反馈中集中出现的问题进行了改进,在保持原有能力的同时,进😢一步提升了模型的稳定性与一致性。 消息一经发出,不到一🚀个小时便收获了一条“10w+”,足以见得行业对于DeepSe🤗ek的关注程度与影响力。 然而,市场的热烈反应背后,也😜夹杂着一丝失望:备受期待的新一代推理模型DeepSeek-R😉2再次缺席。这不仅是一次期待的落空,更像是一面棱镜,折射出这😜家明星创业公司,从年初以R1模型一鸣惊人,到如今核心产品迭代😘的持续延迟,在狂飙突进246天后的焦虑、挣扎与抉择。梁文锋和🥳他的DeepSeek,正在上演一出中国大模型领域最富戏剧性张😜力的“现代启示录”。 市场预期管理失焦:R2发布如“镜😜花水月” 当我们把时间的指针拨回2025 年的早春,彼😁时,DeepSeek-R1的横空出世,如同一声惊雷,在中国乃🤗至全球的AI领域炸响。其卓越的数学与代码推理能力,不仅在多项😜基准测试中对标甚至超越了OpenAI的顶尖模型,更重要的是,😅它以一种彻底开源的姿态,将推理大模型的门槛拉至前所未有的低位🙌。DeepSeek因此一战成神,成为那个“春节档”最耀眼的国😡产AI明星,创始人梁文锋也被寄予了挑战硅谷巨头的厚望。 😜 DeepSeek-R1推出的那一天,就为梁文锋治下的深度求😜索,留下了两个难以抹去的烙印:一是“开源且低成本”成为它的标👏签,二是外界由此对其下一步的期待被抬到了很高的位置。 😆然而,辉煌的序章之后,故事的走向却变得扑朔迷离。行业对下一代😅推理模型DeepSeek-R2的期待,随着时间的推移,演变成💯了一场反复上演的“狼来了”的故事。据大模型之家统计,截至20⭐25年9月23日,距离R1发布已过去整整246天,而关于R2💯的发布传言,已不下10次。 这场漫长的“悬念剧”始于2👏月,路透社首次援引信源,称R2“最迟5月初发布”,并暗示其在👏代码生成和多语言推理上将有重大突破,瞬间点燃了市场的热情。随🔥后的几个月,传言变得愈发具体和密集。3月,行业内开始流传“3🎉月17日发布”的精准日期;4月,Hugging Face代码🙄库的蛛丝马迹似乎暗示着即将到来的更新;而到了5月,传言达到了🚀顶峰,一份详尽的参数信息在网络上泄露,直指R2将采用革命性的🙄“Hybrid MoE 3.0”架构,总参数量高达惊人的1.🥳2万亿。 然而,期待中的5月发布会并未如期而至。随之而😊来的是更多混杂着失望与猜测的消息。有传闻称,发布延期是因为C🙄EO梁文锋对模型内部测试的性能不甚满意,认为尚未达到对R1的🤗“碾压级”优势。更关键的是,来自外部环境的压力开始显现——英😊伟达 H20芯片的供应问题,成为悬在所有中国AI公司头上的达😉摩克利斯之剑。 此后的故事线更加曲折。6月,消息称R2🚀的内部测试结果显示,其性能提升并未达到颠覆性的程度。7月,万😁众瞩目的世界人工智能大会(WAIC 2025)上,DeepS🤩eek的缺席让R2发布的希望再度落空。8月,关于“月底发布”😁的传言再次甚嚣尘上,但很快被官方辟谣。直到9月初,彭博社的报😡道才给出了一个新的时间窗口——计划于第四季度发布,并将主打当⭐下最热门的Agent(智能体)能力。 展开全文 😎在长达八个多月的时间里,DeepSeek官方始终未公布R2的💯明确发布计划。这种反复的传言与落空,在客观上造成了市场预期的😢管理失焦,也消耗了部分用户的耐心。更重要的是,在DeepSe❤️ek等待R2的这段时间,其主要竞争对手,如阿里巴巴的通义千问🤩(Qwen)和百度的文心大模型(ERNIE)等,均已完成了多🙌轮重要的功能迭代和模型升级。 在这场无声的竞赛中,时间😡的流逝,正在成为DeepSeek最沉重的成本。 延迟的🤩“三重困境”:开源生态的繁荣与核心产品的缺位 如果仅仅🌟将这八个多月定义为“等待”,那对DeepSeek而言无疑是不😉公平的。事实上,在R2缺位的日子里,DeepSeek非但没有😊停滞,反而在另一个维度上展现出了惊人的能量和战略远见。梁文锋😍选择了一条更为艰难但可能也更为长远的道路——构建一个从底层模😊型到上层工具链完全开源的全栈技术体系。 这是一场围绕“😆开源驱动创新”展开的“阳谋”。在核心模型层面,除了打响名声的🤔推理专用模型DeepSeek-R1,DeepSeek在3月又😊开源了通用模型V3.0324,其API成本仅为GPT-4的1😅/14,几乎是以“倾销”的方式,将大模型的使用成本打到了“地😉板价”。随后,融合了代码与对话能力的DeepSeek-V2.🙌5,以及多模态文生图模型Janus-Pro也相继开源。这一系🤩列组合拳,让DeepSeek成为了国产AI技术普惠的关键推动🥳者之一。 在基础设施与工具链层面,DeepSeek同样😢进行了深度布局,开源了一系列旨在提升训练和推理效率的关键组件🤔。例如,针对GPU优化的FlashMLA解码内核和DeepG🙄EMM矩阵运算库,官方数据显示可提升约30%的推理速度;为混🙄合专家(MoE)模型设计的DeepEP通信库和DualPip🙌e流水线算法,有效降低了分布式训练的通信延迟;而名为3FS的😂超高速分布式文件系统,则为大模型训练提供了高效的数据读写支持😍。 尤为关键的是,DeepSeek的开源并非仅仅停留在🌟代码层面。他们敏锐地捕捉到了国产算力崛起的趋势。其开源的工具😊链不仅支持主流的英伟达GPU,还同步推出了适配华为昇腾平台的🥳解决方案(如MindIE镜像)。这一举措有助于推动国产AI算😍力在实际应用场景中的落地,具有重要的产业价值。庞大的开源体系😜为DeepSeek带来了正向的生态循环。全球开发者基于其模型😆进行量化(如INT8/INT4版本),降低了部署成本,并围绕⭐医疗、金融等垂直行业进行微调,丰富了应用场景。 然而,⭐这耀眼的A面,却无法掩盖其B面深刻的隐忧。R2的迟迟未能发布😆,正是这些隐忧的集中体现。DeepSeek-R2的推迟,至少⭐面临着三重困境。 首先是技术突破与算力供应的核心矛盾。🤯据英国《金融时报》等媒体报道,R1发布后,DeepSeek在😀相关方面的鼓励下,曾尝试使用华为昇腾芯片进行下一代模型的训练😆。然而,从英伟达的CUDA生态迁移到昇腾的CANN生态,其难😴度远超预期。训练过程中的不稳定和性能瓶颈,严重拖慢了研发进度😘,甚至一度迫使团队将关键训练任务切回NVIDIA平台。这场“🔥算力长征”的艰难,或许是导致R2延期的最直接、最核心的技术因😡素。 其次,资本的狂热与市场的超高预期,放大了传言的传🎉播效应,也给DeepSeek戴上了沉重的“枷锁”。R1的成功⭐让DeepSeek成为了资本市场的宠儿,估值水涨船高。每一次😀关于R2的传言,都能在资本市场掀起波澜。这种高度关注,既是动😁力也是压力,它迫使DeepSeek必须拿出一款超越性的产品,😁任何一点瑕疵都可能被无限放大,从而导致团队在发布决策上慎之又💯慎。 最后,在激烈的行业竞争与中美技术角力的背景下,构🤗成了R2发布最严峻的外部压力。在国内,阿里、百度等巨头凭借强❤️大的资源整合能力,在模型迭代、产品落地和生态构建上步步紧逼。😍在国际上,美国对先进AI技术的出口管制日益收紧。DeepSe😊ek既要面对国内市场的“内卷”,又要应对国际环境的“脱钩”风😘险,其战略选择空间正变得越来越狭窄。 DeepSeek😀与梁文锋面临的“三重挑战” 当前,DeepSeek及其👏创始人梁文锋正不得不面临着来自技术、战略和市场三个层面的严峻👍挑战,这种局面使其在后续发展路径的选择上变得异常艰难。 🥳 第一重挑战,是如何在技术上实现自我超越,即“创新者的窘境”🔥。DeepSeek-R1在推理能力上的突出表现,已经为公司树👍立了极高的技术标杆。这意味着R2必须在性能上实现质的飞跃,而🚀非简单的参数提升或常规优化,才能满足市场的期待。 如果🙄R2的提升幅度有限,很可能会面临类似于今年GPT-5发布后,😜行业普遍认为其创新力度不足的评价。对于一家以技术驱动的创业公🤗司而言,这种来自内部的、超越自我的压力,是其决策过程中必须考⭐虑的首要因素。 第二重挑战,是公司在技术路线上的战略短🤩板,特别是在多模态能力上的“缺位”。当前,全球顶尖大模型的发😉展趋势已明确指向文本、图像、音频、视频等多模态能力的融合。无🤗论是通过多模型能力调用协议(MCP)整合不同模型,还是发展原🌟生的多模态大模型,都已成为行业共识。 相比之下,Dee⭐pSeek至今发布和开源的模型仍主要集中在文本和代码领域,旗😍下多模态文生图模型Janus-Pro并未在行业掀起波浪。这种🚀技术路线上的单一性,可能会使其在未来以多模态为核心的应用场景😁竞争中处于不利地位,限制其生态的广度和商业化的想象空间。 🤩 而国内的另一家大模型公司MiniMax为例,则走向了另一😍个极端:其从创业初期就专注于多模态技术,并已推出了成熟的产品🙄,但囿于当前主流大模型能力评估体系,仍以语言模型为基准。这使🙌得 Minimax 在模型排名、社区认可度、学术引用等“行业😁标尺”上较为边缘,其开源的大模型 MiniMax-M1,在H😘ugging Face等平台的活跃度远低于DeepSeek。😜此外,其主打的线性注意力机制与混合专家系统(MoE)虽然理论😂上具备效率优势,但在实践中尚未充分验证其长期可控性和泛化能力🎉,也让MiniMax 40亿美元估值屡遭质疑。 第三重😁挑战,是需要面对DeepSeek面临的生态问题。自今年年中开😴始,网络中关于“DeepSeek变笨了”的讨论不绝于耳,调查😎发现虽然R1模型在数学推理上表现优异,但在涉及创意、事实性内🙌容时却频繁出现“幻觉”。 而这背后,正揭示出DeepS❤️eek在内容生态上的“先天”短板。大型科技公司如百度、字节跳😴动等,其优势不仅仅在于资金和技术,更在于其庞大的流量入口和内🌟容生态系统。例如,百度拥有搜索、贴吧、文库等一系列产品,而字🌟节跳动则有抖音、今日头条、西瓜视频等。这些平台不仅为用户提供😍了稳定的流量入口,更重要的是,在用户与内容交互的过程中,源源😆不断地产生着最新的、鲜活的数据。这些数据经过清洗和处理,可以🙌持续地为大模型提供高质量的训练语料,形成一个良性的“数据飞轮😘”——模型越好,用户越多,产生的数据越新,模型迭代越快。 😆 DeepSeek目前并不具备这样的内容生态优势。其模型能😊力的提升,更多依赖于外部公开数据集和合作方提供的数据,缺乏像⭐百度、字节那样自有的、能够实时更新的“活水”。当模型在训练过🤯程中无法有效甄别和清洗受污染的语料时,就可能导致“幻觉”现象😉的加剧。这种“幻觉”,不仅仅是简单的信息编造,更可能表现为逻😅辑混乱、事实错误,甚至答非所问,这无疑严重影响了用户的信任感🔥和使用体验。对于一个致力于商业化的大模型来说,用户信任是其产😂品生命线的基石,而“幻觉”问题,恰恰是横亘在其商业化路径上的😍一大障碍。 写在最后 因此,对于梁文锋而言,是如😢何平衡内部研发节奏与外部市场竞争的压力。R2的延迟发布,为竞❤️争对手提供了追赶和反超的时间窗口。在快速变化的大模型市场,技🙌术领先的优势稍纵即逝。梁文锋必须在“追求技术极致”与“抢占市🚀场时机”之间做出权衡。 发布一个性能未达内部最高标准但😎能及时卡位市场的产品,还是继续打磨一个可能错过最佳发布窗口的😉“完美”产品,这是一个艰难的战略抉择。同时,叠加算力迁移带来😴的工程挑战,使得这一决策过程变得更加复杂。 不可否认,😍DeepSeek-R1的发布对行业产生了深远影响。它不仅证明⭐了国内团队在核心推理模型领域的研发实力,更重要的是,其开源策❤️略极大地降低了AI技术的应用成本,打破了海外少数厂商在高端模😅型领域的垄断,为推动整个行业的创新和普及做出了重要贡献。 😎 在大模型之家看来,DeepSeek当前所面临的困境,并非🔥个例,而是国内顶尖AI公司在向更高技术水平迈进过程中普遍面临🎉的挑战缩影。市场期待R2的最终发布,不仅是期待一款性能更强的😁模型,也是在观察DeepSeek如何在技术瓶颈、战略短板和激😴烈竞争的多重压力下,给出自己的解决方案。DeepSeek和梁😉文锋给出的答案,也将对国内其他AI公司的发展路径提供重要的参💯考和启示。返回搜狐,查看更多
北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)
天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)
河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)
唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)
秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)
邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)
邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)
保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)
张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)
承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)
沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)
文 | 长三角MOMO 文 | 长三角MOMO 刚刚一个朋友,发了我一张不知道谁偷拍的我的“工作照”。 前景是几个朋友在打台球,远景是我抱着电脑,埋头打字。 我回忆了一下,虽然这个假期我时常掏出来电脑处理个事情,但这张台球厅的场景,应该是10月3号拍的。因为除了公众号,公司还有公关服务的业务,那天恰逢周五,需要给客户交周报了。 “感觉这个假期,全世界都在加班。”她说。她是某4A公司的,因为服务的一家手机厂商10号和13号分别在深圳和上海有两场活动,所以虽然在旅游途中,也得随身带着电脑,时不时就要更新下某位老师的行程变更。 在我的记忆里,干我们这行的,几乎没有过完整的假期,总有这样那样的事情。其实不仅自媒体和公关行业,互联网、金融、城市服务、销售等诸多行业,都是一样的情况。 所以前两天有个新闻,有人中秋国庆用微信处理工作,法院判定这属于加班,裁定单位要给他补偿加班费,还引发了不小的争论。 网友表示:微信回个工作消息这也能算加班?这不是发财了。 我看了下各方报道,这还真算。加班还真不再局限于传统的坐在办公室,通过微信等线上工具,在休息时间处理工作,绝对属于加班。 如此说来,在刚刚过去的国庆假期,又有几个人没有过“加班”? 那问题来了:同样都是牛马,对比国外,中国的打工人为什么就没有福气享受完完整整的假期呢? 我第一个想到的是,除了“奋斗精神”和“传统服从式职场文化”这些比较虚的原因外,首先从技术层面,最大的因素就是微信。 就工作工具而言,国内用的最多的就是微信,而微信作为全能型工具,集成了社交、支付、生活、工作全部功能。 这就导致了,工作与生活的场景在同一个App里“侵染式”的融合了:你打开微信是想看看家人的动态,却不得不先处理工作群里的@。 而国外习惯的工作工具,主流的比如Slack、Teams、Email等,就是工作没有生活,同时也是“分而治之”的,专用工具用于专业的工作场景。 此外,微信包括钉钉,是“强制提醒”的:消息会推送、会响铃、能拨打语音电话,制造了一种“立刻回复”的紧迫感。虽然在假期不想打开它,但App上的红点,会不断给你制造焦虑。 而Slack、Teams、Email这些,是“可管理”的,通过“勿扰模式”,使用者可以在休假时,直接关闭所有非紧急通知。 展开全文 而上面这些工具差异的背后,其实暴露了我们假期被打扰更深层的原因:国内公司的管理,绝大多数都要求“同步沟通”,即要求对方立刻响应。 而欧美职场,更习惯于“异步沟通”。即:“我提出问题或任务,并不期待你立刻回复。我希望你在自己方便的时候,经过思考后给我一个高质量的回复。” 正是这种不同的公司管理和沟通方式,导致了不同打工人使用工具的不同表现。 国内的牛马:在假期面对领导或者客户微信中发来的“在吗?”,基本不可能保持无动于衷。 国外的牛马:假期根本不打开工作相关的软件,在假期结束时,再回复邮件或者Slack频道里的留言,在项目管理工具中更新任务状态和注释。 除了沟通的时效性,沟通的习惯也不一样,我们中的很多人,已经习惯了碎片化的沟通方式。 就拿自媒体约稿来说,一些国际大厂,会让你发邮件,然后在文档中详细的批注每一处改动,批注里不仅告诉你修改意见,甚至将这段需要参考的链接都给附上。 而国内大部分企业的约稿,都是微信上传来传去,有的企业对接人,每一次修改就说一个意见,我曾经见过一位同行改过十七八个版本的稿件。 就说这次假期,有个朋友手头有个企业约稿要写,每次改完,还得抱着手机等待下一次意见。“感觉休了一个假十一,午休也不敢,出门也要时不时看眼手机,休的七零八落的。” 碎片化的工作沟通,割裂出了碎片化的假期。 比管理和沟通文化的异同,更深层次的原因,还有社会和法律环境。 在欧洲很多国家,都有“断联权”法律,规定企业必须尊重员工在下班后的“断联”权利,不得在非工作时间发送工作邮件。美国很多科技大厂,有完整的带薪休假(PTO)制度,而且鼓励甚至强制员工休完。不休假反而会被经理约谈。 比法条更重要的是,工作和生活严格分开,已经成为欧美社会的普遍认知。而国内,虽然法律上有上述的判例,但“加班文化”,还是主流环境。 那么,如果作为一个管理者,如何才能让公司员工,真正能拥有一段“非商品化”的时间、一种可以对工作说“不”的休憩自由呢? 这应该是一个重塑公司管理的系统结果。 第一,技术层面,可以尝试使用为分离而设计的工具,比如邮件,尽量降低微信的比重。 第二,流程层面,建立并习惯于异步沟通的工作流程,减少不必要的实时干扰。 第三,管理层面,不再把“工作时长”与“工作态度”等同于“工作效率”,信奉授权、信任和结果导向的管理哲学,并做好员工休假期间的工作规划。 一些小公司,可以考虑在一些项目管理和重大事项决策方面,部分沟通流程从微信上挪到邮件。有条件的,还可以考虑试行一下AB岗,这样哪怕是对接客户的岗位,也有一半的小伙伴可以休个无人打扰的年假。 既然工作的目的是为了更好地生活,而不是让生活成为工作的附属品,那么我们每个人,都需要有一个真正的假期,一个不受侵犯的心境时间,一个可以坦然放下工作手机、不被莫名的焦虑所绑架、全心全意投入到自己生活中的神圣空间。 往大了说,这是我们每一个个体,是“人”而非“人力资源”的尊严。返回搜狐,查看更多
推荐阅读
电影《浪浪人生》票房破2000万
8291
容大感光:珠海一期项目显示用光刻胶和半导体光刻胶已试生产
7075
30家公募参与定增,23家实现项目全浮盈
7510
张江高科:控股股东张江集团拟减持不超过1%公司股份
1261
特朗普:若政府“关门” 大量联邦雇员可能被裁
5547
俄中能源合作前景如何?中国计划如何吸引更多俄游客?中国驻俄大使回应
9266
广汽集团:广汽本田拟收购东风本田发动机50%股权
5396
2025年9月票房26.54亿
1299
电影《志愿军:浴血和平》总票房破3000万
3334
美国7月FHFA房价指数环比下降0.1%
1981
滨会生物向港交所提交上市申请
6825
企业自动化软件公司UiPath盘前大涨23%
5737
好医生云医疗向港交所提交上市申请
5515
CoreWeave盘前涨近8%
2351
沈阳化工:公司股票将被实施其他风险警示,股票简称变更为“ST沈化”
1231
国家林草局:坚持市场导向、以需定供,推动林业与市场深度融合
3047
剑桥科技:发行境外上市股份(H股)获得中国证监会备案
4917
东方财富股东陆丽丽、沈友根拟询价转让1.5%股份,用途为投资科创类企业
8948
抖音安全与信任中心举办专家沟通会,联动各界提升算法透明度
2681
福建:进一步加大稳就业政策支持
9679
高视医疗:与德国SCHWIND公司续签独家代理协议
7148