谷歌“香蕉”杀死Photoshop,全球软件业彻底变天了
吃瓜电子官网最新热点:谷歌“香蕉”杀死Photoshop,全球软件业彻底变天了
更新时间: 浏览次数:3954
“惊艳”两个字已不足以形容,它是跨时代的领先。 锦缎 😢 若论当前最火的AI应用,非谷歌的香蕉Nano Bana👏na莫属。 Nano Banana原名是Gemini 👍2.5 Flash Image,但自从它验明真身,大家普遍反🤩映还是Banana好记。 而听劝的谷歌,也马上把模型名🎉换了回去。 不论是文本生成还是图像编辑,Nano Ba🎉nana都展现出了断档领先的实力。 首先来看看评分: 😘 图:LMarena文生图模型排行榜 图:LMar🚀ena图像编辑模型排行榜 展开全文 可以看到,文🙌生图能力属于最优一档,而图像编辑能力更是碾压级别,几乎砸穿了😢Photoshop的锅。 我们可以笃定,Nano Ba🤯nana之后,全球软件业彻底变天了。 01 用户体验:🤗惊艳两个字已不足以形容 事实上,惊艳这两个字,已经不足😊以形容Nano Banana的强大。 先前的文生图评测🔥中,我们已经见识过它的本事。 但根据Gemini AP⭐I文档中的描述,它还有几个其他的拿手好活: 在Nano💯 Banana被发现出现于LMarena之前,各家大模型对于😂文生图中的文字几乎都束手无策。 哪怕不提汉字,只是英文🙄单词,生成出来的基本都是乱码,令人难以理解。 Nano🤩 Banana轻而易举地攻克了这一难关。 而最近让Na🥳no Banana在网络上爆火的原因,则是有网友发现它可以制👍作精度极高的手办图。 图片中的手办完全能够以假乱真,圈🌟外人可能完全无法分辨这到底是不是真的手办。 除此之外,🙄Google还明确介绍了Nano Banana的其他生图优势🌟: 例如逼真的场景、风格化的插图和贴纸、产品模型和商业🤔摄影、极简风格和负空间设计等。 而在图像编辑方面,Na🤯no Banana也能够出色的完成以下任务:例如添加和移除元😆素、局部重绘、风格迁移、组合多张图片、高保真细节保留等有效解😡决了以往模型牵一发而动全身的问题。 这么说可能有些抽象😊,我们用Nano Banana团队在采访中谈到的例子来解释。🙄 ①像素级的修图编辑 最常见的需求之一:只想修改🤩一张图像中的一处细节,但又希望其他部分保持原样。 旅游😂照片P掉路过的游客、自拍照去掉熬夜的黑眼圈,这些对于以往的多😴模态模型来说,并不是一项很简单的挑战。 微小的修改往往😅会导致图像整体风格或结构的不协调,而观感则会遭到严重的破坏。😊 Robert Riachi在采访中提到,团队在模型2😂.0版本时期遇到的一个主要挑战,就是编辑时往往无法保证与图像🎉其他部分的一致性。 但通过持续的爬坡训练和用户反馈收集😴,Nano Banana才取得了明显的进步。 无论是给👍小猫戴上一顶帽子,还是调整一件家具的方向,它都能做到保持场景🥳的整体姿态和结构不变,让编辑的部分与图像其余部分无缝融合。 😍 而这种精准的控制力,对于需要高度一致性的创作场景至关重💯要。 ②不同角度的渲染 图像虽然是2D的,但它反🤩映的内容却是3D的。 因此,想要完成对现实世界中物体的🙌精确编辑,还需要AI对三维空间具备一定的理解能力。 N🤔anoBanana能够从不同的角度渲染角色和物体,创造出全新😢的场景。 比如,上传一件家具的图像,让它从侧面或是背面🥳重新生成,生成的结果仍然能保持高度一致性。 这种能力不😜仅是像素的复制,而是通过理解对象的外观和深层结构,对原始图像🙌进行实质性变换,而创作自由度也是由此而来。 ③交错式生🤩成 相比于文本,图像中包含的信息往往更多。 对于👏较为复杂的图像生成任务,Nano Banana引入了交错式生😊成的新范式。 传统的文生图模型需要一次性处理所有细节,🙌如果指令中包含大量修改或元素的提示,模型就很容易发生饱和现象😍。 Nano Banana采取的解决方案是化整为零。 😂 将复杂的提示分解为多个步骤,逐步进行编辑或生成。 🤩 这种增量生成的方式,能够让模型处理细节时更加精准。 👏同时,它还可以积累上下文信息,从而生成高度复杂且高质量的图像🚀。 创作流程因此变得更加灵活可控,模型处理复杂任务的能👏力也得以显著提升。 ④超越用户的预期 Mosta😢fa Dehghani在访谈中提到了一个词智能感。 他🤔给出了一个有趣的例子:在要求模型执行某项操作时,模型并未原封😊不动地遵循并执行他的指令。 但最终生成的结果却比他实际😴描述的要更好,这使得他感到十分惊喜。 可以看出,Nan😢o Banana已经打破执行命令的工具这一格局。 它具🤔备一定的真实世界的相关知识和常识,能够在一些特定情境下对用户👍的模糊或错误指令进行修正和优化。 这种智能带来的影响可🤩好可坏,或许它无法达成用户的预期效果,但也可能生成更符合用户🤩潜在需求甚至更具创意的图像。 对于大部分人来说,这种智🥳能还是会明显提升用户体验,毕竟创意总是可遇而不可求的。 🤩 02 商业化前景:文生图盈亏平衡出现曙光 任何先进的😁技术,其商业化落地都离不开成本效益的考量。 而Nano😅 Banana在图像领域的应用,自然也涉及到成本和潜在的盈利😀模式。 Robert Riachi在采访中,明确提出多😍模态数据(图像和视频等)的爬坡训练非常困难。 这需要大😉量的人类偏好信号,因此训练就需要投入巨大的时间成本和资源。 🤯 机器学习的过程中,需要锚定一个指标用于评估训练结果的好😁坏。 以往的指标往往需要几个小时才能获取到有效反馈,而🤗Google的研究团队则始终在努力寻找更为高效的训练指标。 😎 另一方面,图像的极度主观性,使得收集并处理用户反馈成为😀一个同样耗时且昂贵的过程。 Kaushik Shiva😆kumar强调了人工评分在图像生成评估中的成本效益问题。 🤔 先前我们的AI竞技场一文中曾经介绍过,LMarena就采🎉用了这种人工评分的方式。 我们看到的排行榜上的Vote🙄s正是由该网站的使用者进行投票得出的。 即便是效果如此❤️出色的Nano Banana,目前的投票数量也只有22万左右👍。 因此,让足够多的用户进行图像质量评分固然能提供良好😉的信号,但这种方式的成本恐怕令Google团队都难以承受。 🤗 这条路走不通,就必须寻找更加高效且经济的评估指标,也就🤩是Nano Banana目前使用的文本渲染度量,这项技术我们😁后面再介绍。 除了训练成本,模型部署上线后的推理成本也🚀要考虑。 目前,Nano Banana的API定价为:🥳 文字输入:$0.30/M tokens 文字输😍出:$2.50/M tokens 图像输入:$0.30😴/张 图像输出:$0.039/张 在Google🎉 AI Studio上可以免费使用,但近期已经设置免费额度。😊 如此低的定价再加上高质量的生成效果,Nano Ban🤗ana的性价比可以说是直接拉满。 与此同时,本周网上已🤩经开始出现第三方平台以更低的价格提供Nano Banana的🤔API服务。 以AI领域现有的产品迭代速度,其他厂商推😆出水平相近的模型恐怕也只是时间问题。 仅仅依靠Nano😀 Banana的使用费用,极难覆盖Google在如此先进的模😅型上投入的巨大成本。 因此,这一重新定义AI图像领域的😆模型的诞生,更多还是为了应对市场份额和生态系统的竞争。 😍 AIGC作为科技巨头公司竞争的焦点,Google必须不断推😴出有竞争力的产品以对抗OpenAI或是Midjourney等😊公司。 而Nano Banana和Gemini 2.5🎉 Pro两款高用户评分产品的存在,有效保持了Google在A🤗I领域的领导地位。 从技术角度来看,模型的迭代和优化是😂一个几乎永不间断的过程。 平民级别的价格能够带来的,是😢所有厂商都急需的大量真实用户数据。 Google这样的🙌科技公司,更多是通过平台上提供的各种服务实现盈利。 即😜使Nano Banana现在可能亏本,但低成本的图像生成和编🤩辑能力,不仅可以用来吸引用户进入Google的生态系统,鼓励🚀用户使用Google提供的相关服务;未来,还可能成为某些更大🤯利润业务的核心组件。 03 技术逻辑:跨时代的强大 😡 Nano Banana能够在AI图像领域实现如此强大的能😂力,归功于Google团队在多模态学习、用户反馈机制和创新架💯构设计等方面的长期投入和努力。 在观看完Google官😁方发布的约30分钟的采访后,不得不对其技术能力感到惊讶。 🤯 ①文本渲染度量 这是Kaushik Shivaku❤️mar始终坚持的一项指标,起初谁也没能想到它就是成功的关键。😡 前面我们说过,Google团队需要找到一个无需依靠用😘户主观评价的指标来判断模型是否在越变越好。 在Nano🤯 Banana正式发布之前,无论是国内还是国外的多模态模型,😀生图水平参差不齐。 但在图片中加入文字这件事上,所有的😘模型都无法准确完成。 看起来,文字生成只是AI图像领域😅的一个分支,但Google团队坚持以此为优化目标。 最🙄终结果也证明了这是一个无比正确的决定。 在对文本渲染的😀不断优化过程中,研究团队发现图像生成质量也在不断提高。 🤩 天才般的想法,加上持之以恒的努力,成就了Nano Bana🤔na的强大。 ②多模态统一模型与正向迁移 Mos😡tafa Dehghani提出了Nano Banana的核心🤔理念之一:实现原生的图像生成和多模态理解与生成。 这意😘味着模型会在同一个训练运行中学习所有模态和不同的能力,而最终😡目标则是实现跨不同维度的正迁移。 简单地说,就是要让模🙄型不仅能理解和生成单一模态(比如文本或图像),还能利用从一种🎉模态中学到的知识,帮助理解和生成另一种模态。 例如,模😡型可以从图像、音频和视频中学到真实世界的相关知识,从而更好地🔥理解和生成文本。 就像Robert Riachi提到的😘一种名为报告偏差的现象: 人们在日常对话中通常不会提及💯哪些显而易见、习以为常的事物,比如朋友家的普通沙发。 👏但如果展示一张房间的图片,沙发就会自然呈现在眼前。 说🎉实话,这个例子举得有点莫名其妙,但确实有一定道理: 图😀像和视频等视觉信号里,包含着大量关于真实世界的隐性信息,而这😁些信息无需明确请求即可获取。 对于一个多模态模型来说,🙌视觉信号是了解世界难得的捷径。 这种统一的多模态学习方😉式,帮助Google团队建立了更全面和深入的世界模型。 👍 Gemini系列产品也在各种模态任务中表现出了更高的智能化🎉程度,LMarena的数据已经验证了这一点。 因此,采💯访中提及图像理解和图像生成被视为姐妹,在交错生成中互相促进。🤯 ③从错误中学习:用户反馈驱动爬坡训练 Robe😡rt Riachi着重强调了利用人类偏好进行爬坡训练的重要性😅。 但前面已经说过,不可能模型每次生成图片都让人类来判😅断孰优孰劣。 因此,Google团队收集了大量来自Tw👏itter等平台的真实用户反馈,将失败案例转化为评估基准,而🙄这些恰恰是用于改进模型的宝贵信号。 在模型的2.0版本🤯发布时,团队成员敏锐地注意到一个常见的失败案 例: 😂 编辑时无法保持图像其余部分的一致性。 于是,以此为🥳基础,团队开始针对于具体问题进行爬坡训练和迭代。 这种😜以用户为中心、从错误中学习的机制,正是Nano Banana⭐能够解决这一挑战的关键。 ④团队协作:Gemini与I😢magen的融合 采访的最后,Robert Riach🙄i也谈到了Nano Banana的成功离不开Gemini和I🙄magen两个团队的紧密协作。 Gemini团队专注于😉指令遵循和世界知识等方面,确保模型能够理解用户的意图并生成符😂合逻辑的内容。 Imagen团队专注于图像的视觉质量,⭐确保生成的图像自然美观,且不出现明显问题。 Gemin🌟i 2.5 Pro之前的长期霸榜已经说明其功能的强大,而融合🙄两个团队的视角和专业知识,Nano Banana做到了兼顾图😢像的智能性和美观性。 Nano Banana在Goog😊le AI Studio上线后,我们也可以发现,它和Gemi😜ni 2.5 Pro是融为一体的,在原先的聊天界面就可以直接😆使用,而非两个独立的模型。 这种跨团队的深度合作,使得💯Google的产品体系上升到了一个新的高度。 04 结👏语 就像很多标题所说,Nano Banana的出现毫无😊疑问给AI图像领域带来了革命性的变化。 从像素级的完美😢编辑,到交错式的复杂图像构建; 从对用户意图的智能理解😅,到超越预期的创意发散; 人工智能在视觉艺术上的创作潜🤔力正在被逐步发掘。 但与此同时,以假乱真的高质量图像也🤯在改变很多行业的现状。 尽管Nano Banana生成👏的图像目前也已经明确带有AI生成标识,但它的作品已经足以满足😢大多数人的需求。 未来的创作者和艺术家又该何去何从? 🤗 唯一可以确定的,是AI图像领域的未来将会更加智能、更加😴高效、更具创意。 而人机之间的协作,也即将开始书写全新😜的篇章,全球软件业正因此重塑。返回搜狐,查看更多
北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)
天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)
河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)
唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)
秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)
邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)
邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)
保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)
张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)
承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)
沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)
文:凯风 来源:国民经略 撤县并省,全面落地。 👍 一夜之间,越南全国63个省市精简为34个省级单位,62😴8个县级行政机构被整体撤销,1万多个乡级单位合并为3321个👍。 这场被越南称为“重整江山”的史上最大行政改革,自去😁年10月启动,仅8个月时间就已尘埃落定。 受此影响,越😜南短期将裁撤近10万个“铁饭碗”,长期则有25万个行政、事业💯编制受波及,而越南只有1亿人口。 15年免费义务教育;🥳与美国率先达成关税协议,同时宣布加入金砖伙伴国…… 动🚀作一个接一个,给人以“时不我待”的紧迫感,越南为何这么急? 🥳 01 撤县并省,力度有多大? 行政区划改革🔥,涉及重重利益调整,放在任何一个地方都历来不易。 越南🤩靠着“8年战略准备,8个月快速实施”成功落地,速度之快、力度💯之大、动作之猛令外界瞠目。 经过这轮改革,越南县级行政🌟单位不复存在,地方行政体系从“省-县-乡”三级制变成“省-乡❤️”两级制。 越南面积约33万平方公里,与云南省相差无几😘;人口超过1亿人,与河南省基本相当。 然而,一个中国省⭐份的体量,此前却划出了63个省级行政区,又下设县、乡,叠床架😡屋,极尽臃肿。 越南没有地级市,但由于体量不大,改革前😴的“省”相当于我们的地级市,改革后的“省-乡”类似于我们的“👏市-乡”。 撤并近半省级单位,直接砍掉“县”一级,削减😡70%左右基层单位,动作不可谓不大。 任何机构改革,首🌟当其冲的自然是“铁饭碗”,而刀刃向内,又是最难的。 改🥳革前越南公务员约250 万,此次改革短期影响10万人、长期影😎响25万人,相当于砍掉4%-10%的编制。 削减铁饭碗😜,效果立竿见影。越南官方预计,2026年至2030年将节省资🚀金超过190万亿越南盾(约500亿人民币)。 对于越南😅来说,减轻财政负担只是一方面。 精简行政层级,让改革轻🚀装上阵,激发市场活力,才是更关键的。 02 越南👏的行政体系,与中国有何区别? 同为社会主义国家,同属儒⭐家文化圈,且历史上作为中国的一员,越南地方行政体系与中国有诸😉多相似之处。 越南不设地级市,最近又取消了县,与我国行😉政区划有了分野,但在省级层面,仍有高度的相似性。 越南❤️改革之后形成34个省,而我国拥有34个省级行政区,究竟是致敬❤️还是巧合,不得而知。 有意思的是,越南同样设有直辖市,🚀34个省中,共有6个直辖市,既有首都河内,也有经济重镇胡志明😊市。 河内、胡志明市之于越南,类似北京、上海之于中国,😂堪称越南版的一线城市。 作为越南经济第一大市,胡志明市👏常住人口约1400万人,2024年GDP为697亿美元(约5🚀000亿人民币),占越南全国15%左右。 目前,越南正😢在策划连通河内与胡志明市的,官方曾多次向京沪高铁取经,并非偶👍然。 更有意思的是,在这场大刀阔斧的撤省改革中,越南采😎取了“留名不留驻”的平衡术:两省合并,以一省为省名,省会则设👏在另一省。 老街省和安沛省合并为老街省,省会设在安沛;🎉太平省和兴安省合并为兴安省,省会设在兴安;西宁省和隆安省合并😜为西宁省,省会设在隆安…… 一般而言,无论是省域合并还😉是城市合并,只要是强弱结合,强者通吃就是常态。 历史上🤗江苏、安徽合并为江南省,省府一直放在南京,后来即使两省分治,😢安徽布政使司仍长期在南京办公。 折中式命名,自然是为了😡改革顺利推进。 对此,越南官方媒体越通社直言不讳,不要😢过于纠结“省名不见了”、“县没了”、“我们乡被合并了”,应当🤯超越“地方情结”,将国家利益置于家乡情结之上。 03 😉 越南改革为何这么急? 刚刚过去的上半年,越南GD😁P增速为7.52%,创15年新高,增速位居亚洲国家最前列。 🤯 今年以来,关税战反复折腾,地缘动乱惊扰不绝,全球经济面😢临巨大的不确定性,对于以外贸为最大支柱的新兴国家来说,殊为不😴易。 面向未来,越南颇具雄心壮志,提出2030年跻身中🙌等收入国家,2045年跻身高收入国家。 要知道,就是中😉国,也是在改革开放第20个年头,1998年才晋级中等收入国家🙄,如今仍未跨过高收入国家门槛。 越南一直以“下一个中国😀”自诩,但目标不无好高骛远之嫌,但也凸显了“时不我待”之心。😎 越南之所以着急,是因为全球化红利期、人口红利黄金期、🙌产业转移机遇期,都在快速消退。 全球化的红利期正在远去🤗,国际经贸冲突、地方保护主义乃至局部战争不绝于耳,外贸早已没👍了先前的和平环境。 雪上加霜的是,越南人口红利的黄金期😴只剩下10多年时间,再不抓紧就来不及了。 为此,今年6🤔月,越南全面取消计划生育、推行15年免费教育,试图在人口滑坡😴之前托住生育大局。 更大的挑战在于,以人工智能为核心的😅第四次科技革命已经到来,正在重塑全球产业结构、重构世界经济格🥳局,后发国家显然首当其冲。 过去几十年来,亚洲国家靠着😴雁阵式的产业梯度转移先后脱颖而出,而驱动全球产业转移的核心要😡素在于成本,尤其是低廉的劳动力成本,或者说“人口红利”。 🔥 然而,人工智能突飞猛进,一旦“机器换人”取得全面突破,发😍展中国家唯一能借重的成本优势将不复存在。返回搜狐,查看更多
推荐阅读
覆盖“吃住行游娱购医”,“双节”前美团推出亿元补贴
1625
9月销售回暖 前三季度百强房企销售总额2.6万亿 保利发展位居榜首
5221
交大思诺董事长李伟被实施留置,公司年报、半年报净利均约“腰斩”
4482
保代管理不到位、欺骗投保人!建信人寿浙江分公司及责任人收罚单
3048
东风科技子公司因买卖合同争议遭索赔1385万元,公司上半年营利双降
5038
实控人团队“解散”,山科智能陷“无主”状态称无碍经营,公司上半年净利近“腰斩”
7154
ST立方第三大股东6756万股流拍,公司近年深陷亏损泥潭,4月底被证监会立案
8489
易会满被免去政协第十四届全国委员会经济委员会驻会副主任职务,其委员资格被撤销
6335
天猫:超200万人次领用深圳家装补贴
7757
高管动向|任立新出任中国石油总裁,现年58岁
6146
公司热点|炒概念?海南华铁36.9亿元巨额算力合同无疾而终,上交所火速发监管函
8178
开展苹果手机贸易业务,对方已签收但未按协议支付,物产中大子公司起诉追讨2.25亿元货款
8960
携手四方共建,深理工深化产学研创新生态
6527
金通灵犯欺诈发行证券罪被罚800万元,多名责任人被判刑并处罚金
6617
深企焕新传统产业活力,培育形成竞争新优势
4855
蓝鲸跃海!多元化幕墙打造全球最大室内滑雪场
9072
深圳市工商联“企·航”计划荣获2025年推动民营企业高质量发展典型案例
3054
将复杂咨询等核心服务交还人工客服!深圳海关这波操作获高赞
1003
前海发布“信用十二条”,设300万元支持拓展商业信用服务市场
4346
员工违规荐股、投资者管理漏洞,中金财富证券大连港兴路营业部部分业务暂停三个月
7455
三年半累亏超10亿元!星环科技裁员10%-20%,急赴港股融资
5435