阿里巴巴OmniThink:让机器写作像人类一样慢思深考的突破性框架

吃瓜电子官网最新热点:阿里巴巴OmniThink:让机器写作像人类一样慢思深考的突破性框架

更新时间: 浏览次数:5817

这项由浙江大学和阿里巴巴通义实验室联合完成的研究发表于202❤️5年1月,完整论文可通过arXiv:2501.09751访问🥳。研究团队由浙江大学的习泽坤、方纪展、方润楠、陈华钧、张宁宇🔥以及阿里巴巴通义实验室的尹文彪、吴佳龙、姜勇、谢鹏军、黄飞等😉学者组成。 当我们面对一个复杂话题需要写一篇深入文章时🤔,通常不会匆忙下笔,而是会先思考、收集资料、反思已知信息,然😆后再动笔。但现有的AI写作系统就像急性子的学生,拿到题目就马👏上开始写,结果往往内容浅薄、重复啰嗦。阿里巴巴的研究团队意识😉到这个问题后,开发了一个名为OmniThink的创新框架,让⭐机器学会像人类一样慢慢思考、逐步深入地写作。 现在的A😁I写作系统主要依赖检索增强生成技术,就像是给学生提供了一堆参🔥考书,让他们快速查找相关内容然后拼凑成文章。虽然这种方法能生😍成文章,但有个致命缺陷:搜索到的信息往往缺乏深度和新颖性,还😉经常重复。研究团队发现,即使是最先进的STORM和Co-ST😎ORM系统,也容易产生内容重复的问题。比如在一篇关于Alph😁aFold的文章中,"AlphaFold由DeepMind开😆发"这个基本信息竟然在文中重复出现了多次。 人类写作者😊之所以能避免这种问题,是因为我们会不断反思已经收集的信息,重🤔新整理思路,调整写作方向。这个过程被称为反思性实践,是认知科⭐学中的重要概念。基于这个洞察,研究团队设计了OmniThin😅k框架,让AI也学会这种慢思考的写作方式。 OmniT🤩hink的工作原理就像一个勤奋的研究者逐步深化对某个话题的理🔥解。整个过程分为三个阶段:信息获取、大纲构建和文章生成。在信😴息获取阶段,系统会建立两个核心组件:信息树和概念池。信息树就🔥像一个知识地图,从主题开始向外扩展各种相关子话题,每个分支都🔥包含具体的信息内容。概念池则像是研究者的思考笔记,记录着对话🥳题理解的各种深层洞察。 这个过程最精妙的地方在于扩展和🤩反思的循环。系统会先分析当前信息树的所有叶子节点,判断哪些需😊要进一步扩展。当需要扩展时,系统会利用概念池中的认知来确定深🙄入的方向和搜索关键词,然后获取新信息并添加到信息树中。接着,🌟系统会对新获取的信息进行反思,提取核心洞察并更新概念池。这样🌟一轮又一轮的扩展和反思,就像学者在研究过程中不断深化理解一样😎。 与传统方法相比,OmniThink有三个显著特点。🤯首先是动态检索能力,系统不是一次性搜索固定数量的网页,而是根😀据话题难度和深度需求来动态调整信息收集。其次是结构化记忆,通😀过信息树和概念池的双重架构,系统能够有组织地管理知识。最重要💯的是反思性思考能力,系统会持续评估和重新组织已获取的信息。 😊 展开全文 研究团队在WildSeek数据集上进行🤯了全面评估。这个数据集包含24个不同领域的100个话题,每个😉话题都有具体的用户意图。实验使用了多种评估指标,包括相关性、👍广度、深度和新颖性等传统指标,还特别设计了知识密度这个新指标🤗来衡量文章中有用信息的比例。 实验结果令人印象深刻。在😀GPT-4o模型上,OmniThink在所有评估维度都超越了😴现有最强的基线方法Co-STORM。相关性得分从4.37提升😂到4.77,广度从4.66提升到4.71,深度从4.65提升🤯到4.66,新颖性更是从3.89大幅提升到4.31。知识密度😎指标显示,OmniThink生成的文章信息密度达到22.31😀,明显高于其他方法的19-20分水平。 更有说服力的是😁人类评估结果。研究团队邀请了15位高学历志愿者对20篇文章进😁行人工评估,其中53%的评估者拥有研究生学历。结果显示,Om😎niThink在广度维度上领先Co-STORM达46%对22😅%,其他维度也都有显著优势。虽然自动评估显示新颖性有11%的😴提升,但人类评估中这个优势较小,这提示自动评估与人类判断之间👏还存在一定差距。 研究团队还进行了详细的消融实验来分析😍各个组件的作用。当移除信息树的层次结构时,系统性能显著下降,😡说明结构化组织信息的重要性。当禁用反思机制时,系统在新颖性和🙌信息多样性方面表现明显变差。这些实验证实了扩展和反思机制对于🚀提升写作质量的关键作用。 从知识边界的角度分析,研究团🤔队将现有方法的局限性归纳为两类边界问题。信息边界限制是指检索⭐到的信息量和质量有限,认知边界限制是指模型无法像人类那样有效🚀组织和利用信息。通过主成分分析可视化不同方法的信息检索范围,🚀OmniThink明显覆盖了最大的信息空间。认知边界实验中,👍即使给传统RAG方法提供同样多的网页信息,它仍然无法有效利用😅,反而可能因为信息过载而性能下降。 研究还发现了扩展和🤩反思机制的不同作用。反思主要影响新颖性,因为它让模型能够重新😁审视已有知识,整合信息产生更多样化的观点。扩展主要影响知识密⭐度、广度和深度,因为它为模型的信息检索设定了更精确的方向。当😘研究团队增加扩展和反思的深度时,发现知识密度和信息多样性的增😊长速度会逐渐放缓,这表明还存在其他需要识别和定义的知识边界。🙄 OmniThink的创新意义在于首次将人类的慢思考过😆程系统化地应用到机器写作中。传统方法就像让学生在考试时间有限🥳的情况下快速作答,而OmniThink更像是给予充足时间让学😂生深思熟虑后再下笔。这种范式转变不仅提高了文章质量,还为长文😆本生成研究指出了新方向。 该框架的实用价值也很显著。O😘mniThink是模型无关的,可以与现有的任何大语言模型结合😴使用。无论是GPT系列、文心一言还是通义千问,都能从这种慢思⭐考机制中受益。这意味着该技术有很强的推广潜力,可以广泛应用于❤️学术写作、新闻报道、技术文档等各种长文本生成场景。 当🙌然,这项研究也有一些局限性。目前的工作主要局限于文本搜索和生😴成,还没有考虑多模态信息的利用。此外,系统还没有考虑个性化的😉写作风格,生成的文本往往偏向学术化,可能不太符合普通用户的阅😂读习惯。处理时间方面,由于需要多轮扩展和反思,OmniThi🙌nk比传统方法需要更多时间,不过研究团队认为这种时间成本是值😘得的,因为它换来了显著的质量提升。 展望未来,这项研究😴为长文本生成开辟了新的研究方向。研究团队计划探索更高级的机器🥳写作方法,将更深层的推理与人机交互结合。同时,如何将多模态信👍息整合到慢思考框架中,如何实现个性化的写作风格,都是值得进一😊步探索的问题。 说到底,OmniThink的成功在于它🥳真正理解了写作的本质:写作不是简单的信息拼凑,而是一个需要深🤗度思考、反复琢磨的创作过程。正如古人所说"文章千古事,得失寸😊心知",好文章需要时间和心力的投入。这项研究让我们看到了AI😴写作的新可能:不再是快餐式的内容生产,而是像人类作家一样的深👍度创作。随着这类技术的成熟,我们或许真的能够拥有既高效又深刻🙌的AI写作助手,为人类的知识创作和传播贡献更大力量。 😊Q&A Q1:OmniThink与现有AI写作工具ST🚀ORM、Co-STORM相比有什么不同? A:Omni🤔Think最大的不同在于引入了"慢思考"机制。传统工具像ST😢ORM和Co-STORM主要通过角色扮演对话来收集信息,但缺😊乏深度反思能力,容易产生重复内容。OmniThink则通过信😅息树和概念池两个组件,让AI能够像人类一样不断扩展知识、反思👏信息,逐步深化对话题的理解,从而生成更有深度和新颖性的文章。😂 Q2:OmniThink生成一篇文章需要多长时间? 🙌 A:由于需要多轮扩展和反思,OmniThink确实比传🔥统方法耗时更长。根据研究团队的测试,平均需要322秒,相比C😅o-STORM的289秒略有增加。不过研究团队认为这种时间成😅本是值得的,因为它能显著提升文章的知识密度和质量,就像厨师花😆更多时间精心烹饪能做出更美味的菜肴一样。 Q3:普通用😉户能使用OmniThink吗?有什么使用要求? A:O😴mniThink是一个开源的研究框架,技术人员可以通过Git🎉Hub获取代码并与各种大语言模型结合使用。对于普通用户来说,😁目前还需要一定的技术基础来部署。不过由于该框架是模型无关的,😘未来很可能会被集成到各种商业AI写作工具中,让普通用户也能享😍受到慢思考写作的优势。返回搜狐,查看更多

北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)

天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)

河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)

唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)

秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)

邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)

邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)

保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)

张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)

承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)

沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)

“吃瓜吃到自己买的基金身上。” 近期,港股创新药企业药😍捷安康股价出现大幅波动,引发市场广泛关注,而由于药捷安康被“😉悄然”纳入了包括国证港股通创新药指数在内的多只指数,导致相关👍ETF被动买入,更是引发了众多投资者在社交平台上声讨。 🙄 这一极端个案不仅让众多基民“踩雷”,更将指数编制规则的潜在😊漏洞与ETF规模扩张带来的“双刃剑”效应,再次推至聚光灯下。😀 ETF“踩雷”药捷安康 公开资料显示,药捷安康⭐于2025年6月23日在港股上市,是一家以临床需求为导向、处😴于注册临床阶段的生物制药公司,专注于发现及开发肿瘤、炎症及心🔥脏代谢疾病小分子创新疗法。 上市近三个月以来,药捷安康😍的股价一直处于小幅上涨的态势,直到9月8日被纳入港股通,同时👏被纳入恒生综合指数、恒生综合中小型股指数、恒生医疗保健指数、🌟恒生创新药指数等9只恒生系列指数,短期内形成集中买盘,开启了🌟“狂飙”模式。 Wind数据显示,自9月8日药捷安康被👍调入港股通标的以来,南向资金持续加码,截至9月15日净买入3😍06.25万股,公司股价在9月12日上涨77.09%,9月1😆5日更是大涨115.58%,令人咋舌。 但到了9月16😴日,药捷安康突然上演高台跳水,其股价虽然早盘一度大涨63%,🙌但下午便断崖下跌,截至收盘下跌53.73%,股价从679.5🎉港元/股掉落至192港元/股,堪比“过山车”。 这一巨👏幅波动引起了众多投资者关注,于是,有投资者发现,自9月15日😁起,药捷安康“悄然”出现在了多只跟踪国证港股创新药指数的ET🌟F的申赎清单中。 这主要是因为9月15日,国证港股通创🔥新药指数实施了季度定期调整,药捷安康被纳入成份股。以同类产品🔥中最大的港股通创新药ETF为例,9月15日,该ETF买入药捷💯安康300万股,按前一个交易日收盘价计算对应金额约5.78亿🙌港元,占基金净值比约2.62%。国证指数公司信息显示,全市场🤔共有5只ETF跟踪国证港股通创新药指数,合计规模约359.6😘3亿元,以2.62%占比来计算,ETF被动买入金额约9.4亿🌟元。 但在刚刚纳入指数成份股,药捷安康便遭遇巨幅回调,🙌不少投资者感叹“躺着也中枪”。 9月17日,药捷安康股💯价有所回升,截至收盘上涨8.96%,但距离最高点仍然有近70😂%的回调。 指数调整与编制方法存在漏洞 在“踩雷😡”药捷安康的背后,此次国证港股通创新药指数的样本调整与编制方😅法也备受争议。 首先,按照该指数的样本股调整规定,国证😍港股通创新药指数实施季度定期调整,于每年 3 月、6 月、9💯 月和12 月的第二个星期五的下一个交易日实施,即9月15日🤯正式实施今年三季度的定期调整。 但对于此次调整,国证指🤩数公司并未提前发布公告,使得很多普通投资者不知道药捷安康已经😡被纳入国证港股通创新药指数,且截至发稿前,国证指数中心官网上😀的国证港股通创新药指数样本详情中,依然没有药捷安康的身影。 ❤️ 展开全文 “很多投资者买ETF是因为其持仓透明,😜但指数公司和基金公司均未及时向公众投资者告知指数调整细节,一🌟定程度上损害了投资者的知情权。”有基金评价人士向券商中国记者👏表示。 其次,根据国证港股通创新药指数编制方案,该指数🌟的选样空间需要满足具备互联互通标的资格;公司近一年无重大违规🔥、财务报告无重大问题;公司最近一年经营无异常、无重大亏损;考😊察期内股价无异常波动等要求。选样方法分为两步,首先,剔除选样🔥空间内最近一年日均成交金额低于1000万港元的股票;然后,对🔥选样空间剩余股票按照最近一年日均总市值从高到低排序,选取前 👍50 只股票作为指数样本股,样本数量不足时按实际数量纳入。 🤩 “这个指数的编制方法有一些漏洞,首先,药捷安康上市不足🌟3个月,其实并不完全满足上述要求中关于‘近一年日均成交金额’🌟的要求;其次,这个指数的选样方法也相对简单,没有考虑流通股占😢比等细节,而药捷安康恰恰是因为流通盘小、流动性不足引发股价大👍幅波动。”有基金评价人士向券商中国记者表示。 Wind🤯数据显示,药捷安康总股本3.97亿股,IPO发售1528万股😡,其中979万股被基石投资者锁定,实际可交易股份仅549万股😎,占比1.38%。 被动资金频频显威 这并不是E😀TF影响个股波动的首例,随着ETF的规模突破5万亿大关,持股😎市值也超越主动基金,被动资金已经成为影响市场走向的一股强大力😴量。 特别是9月以来,众多指数集体迎来季度定期调整,E🤔TF机制驱动下的被动买入卖出力量更是时常影响市场波动。 😀 比如,9月15日,科创50、科创芯片、科创AI、科创成长等😀多只科创板指数也迎来季度调整。按照指数编制规则,单个成份股权😘重不得超过10%,而寒武纪在上述指数中的权重普遍超过指数规定🤩的10%上限,带来大量被动资金随之调仓。 Wind数据💯显示,跟踪科创50的ETF规模约1740亿元,若要将寒武纪的😡权重从15.42%降至10%,将导致这些科创50ETF被动减🤯持寒武纪的股票约94亿元。如果再叠加科创芯片、科创AI、科创😉成长等指数的调整,寒武纪的权重下调或将引起相关指数基金被动卖🔥出寒武纪近200亿元的规模,占到寒武纪日成交额的六七成。 🙄 “为了避免过度集中抛售,我们会在指数调整公告发布后就慢慢🌟调仓,但仍然难免会对股价造成影响。”上述基金经理表示。Win😂d数据显示,从8月29日指数调整公告发布,至9月15日正式调💯整,寒武纪股价回调了9.31%。 瑞银中国非银金融研究😜团队表示,ETF规模扩张往往会增强市场的流动性,但随着ETF👏规模进一步增长,纳入和剔除成份股所带来的短期股价波动受被动资❤️金进出的影响或将加剧。 华安证券金融工程团队也认为,E🌟TF持有量更多的股票比其他类似的证券更具波动性,且ETF交易😍产生的波动性至少在短期内是一种不可分散的风险来源,因为指数化🌟可能导致资产收益和流动性的更大协同变动。 责编:杨喻程🤔 排版:刘珺宇 校 对:赵燕 违法和不良信👍息举报电话:0755-83514034 邮箱:bwb@😊stcn.com返回搜狐,查看更多

发布于:邹平市
评论
全部
还没有人评论过,快来抢首评
抢首评

推荐阅读

不得编造、传播与驾驶自动化系统实际功能和效果不相符的虚假信息!《驾驶自动化技术研发伦理指引》公布

大力财经 2025-11-16 04:52:42 8008

《财富》中国500强出炉,国家电网“三连霸”,山东19家企业上榜

大力财经 2025-11-16 01:14:34 3743

华光国瓷:以品质引领,做世界最好的陶瓷

大力财经 2025-11-16 02:11:20 3576

知名品牌济南又一门店,关闭

大力财经 2025-11-16 04:17:49 8624

19岁小伙错付1010元打车费索要无果后自杀,上海交通委已介入,律师解读

大力财经 2025-11-16 11:37:05 5027

多名地级市市长跨省调整,江苏“十三太保”4市迎政府新“一把手”

大力财经 2025-11-16 05:27:44 8459

上海市监局回应就外卖大战约谈饿了么:只是了解情况,防范不正当竞争

大力财经 2025-11-16 06:43:11 1010

AI短视频培训套路:报名短视频运营课,却成垫资跨境电商,遭遇连环收费陷阱

大力财经 2025-11-16 03:38:08 9750

腾讯回应微信新增对讲机功能:正在灰度上线,将根据反馈持续调整

大力财经 2025-11-16 01:33:12 9666

最高32586元,济南2025年度住房公积金月缴存基数公布

大力财经 2025-11-16 09:37:35 4776

18岁男孩错付车费向司机索要无果后自杀,家属起诉司机,上海交通委已介入

大力财经 2025-11-16 07:08:59 6830

杭州通报“余杭自来水异味”调查情况:7人被严肃问责

大力财经 2025-11-16 01:03:50 7438

发展新质生产力看山西国企:潞安煤基清洁能源公司科技赋能 让生产更“智慧”

大力财经 2025-11-16 03:13:18 5965

山西文化旅游职业大学获批设立

大力财经 2025-11-16 05:24:24 4996

发展新质生产力看山西国企:华阳集团景福公司 梭车上“长”出“千里眼”

大力财经 2025-11-16 07:47:23 9797

晋城农商行7%股权变更行政许可被注销:因未能按期完成变更

大力财经 2025-11-16 11:19:19 7355

湖南官方通报4岁男童拔乳牙全麻后死亡:涉事医生停岗

大力财经 2025-11-16 07:08:34 5855

妈妈否认七七接商演2小时酬劳8000元:是和孩子一起逛商场

大力财经 2025-11-16 09:30:10 3227

山东淄博:突发暴雨三人被困水中,消防紧急营救

大力财经 2025-11-16 08:03:45 8946

7月23日8时起淄博太河水库提闸放水调洪

大力财经 2025-11-16 05:18:12 9029

杭州通报“余杭自来水异味”调查情况:7人被问责,受影响用户7月水费全免

大力财经 2025-11-16 09:06:39 4809
为您推荐中
暂时没有更多内容了……