华为昇腾 0Day 支持 DeepSeek-V3.2-Exp

吃瓜电子官网最新热点:华为昇腾 0Day 支持 DeepSeek-V3.2-Exp

更新时间: 浏览次数:3256

IT之家 9 月 29 日消息,今晚,DeepSeek-V3🔥.2-Exp 发布并开源,引入稀疏 Attention 架构😢。华为宣布昇腾已快速基于 vLLM/SGLang 等推理框架❤️完成适配部署,实现 DeepSeek-V3.2-Exp 0d🥳ay 支持,并面向开发者开源所有推理代码和算子实现。 😆IT之家从官方介绍获悉,昇腾在 DeepSeek-V3.2-🤔Exp 一发布开源即实现了 DeepSeek-V3.2-Ex😘p BF16 模型部署,并在 CANN 平台上完成对应的优化😅适配,整体部署策略沿用 DeepSeek 的大 EP 并行方🤯案,针对稀疏 DSA 结构,叠加实现长序列亲和的 CP 并行🥳策略,兼顾时延和吞吐,在 128K 长序列下能够保持 TTF👏T 低于 2 秒、TPOT 低于 30 毫秒的推理生成速度。🤩 NPU DeepSeek-V3.2-Exp 推理优化🙄实践: 昇腾针对 DeepSeek-V3.2-Exp 😡架构中两个全新的算子:Lightning Indexer (😁LI) 以及 Sparse Flash Attention 😅(SFA),针对性地进行算子 Tiling 设计、Cube 😆核与 Vector 核间的流水优化、计算流程的实现优化等,模😴型和融合 Kernel 均已开源。 NPU DeepS🙌eek-V3.2-Exp Ascend C 融合算子优化: 🎉 为进一步提高昇腾融合算子的编程易用性,昇腾 CANN 😀首次推出大融合算子的编程体系 PyPTO,旨在简化算子开发流😢程,同时保持高性能计算能力。该框架创新性地采用 PTO (P❤️arallel Tensor / Tile Operatio🚀n) 编程范式,以 Tensor 为基本数据表达方式,构建计😘算图,实现高效计算与优化。目前在昇腾上已经基于 PyPTO 😉完成 DeepSeek-V3.2-Exp 模型中 DeepS😴eek Indexer Attention 和 Lightn😂ing indexer 算子的开发实践,仅需几百行代码即可完🥳成动态 Shape 算子编程和算子整网运行。 基于 P🤗yPTO 的 Lightning Indexer 和 Dee🙄pSeek Indexer Attention 算子开发实践🤩: 昇腾不仅提供了 DeepSeek-V3.2-Exp😜 的官方参考实践,也同步支持 vLLM 和 SGLang 等😴业界主流大模型推理框架部署,提供完整功能,能够让广泛的开发者😅在社区直接下载相关代码体验 DeepSeek-V3.2-Ex⭐p 模型,可以在昇腾实现融合算子、稀疏访存、多核并行计算等深😡度优化能力,并持续优化 DeepSeek-V3.2-Exp 🙄在主流社区的推理性能。 大模型推理框架 vLLM 及昇😘腾实现: 大模型推理框架 SGLang 及昇腾实现: 😊 TileLang 是由 Tile-AI 社区发起的 T🌟ile-level 的类 Python 的 AI 编程语言(🚀DSL)项目,在 Tile 粒度上进行编程和编译,实现模型算😡子和硬件的高效协同。昇腾已经实现 TileLang 的 Sp😡arse Flash Attention 和 Lightni😉ng Indexer 算子开发,后续将支持更完备的 NPU 😘算子并提升性能和泛化性。 NPU DeepSeek-V😘3.2-Exp TileLang 算子开发实践:返回搜狐,查⭐看更多

北京市:市辖区:(东城区、西城区、朝阳区、丰台区、石景山区、海淀区、门头沟区、房山区、通州区、顺义区、昌平区、大兴区、怀柔区、平谷区、密云区、延庆区)

天津市:市辖区:(和平区、河东区、河西区、南开区、河北区、红桥区、东丽区、西青区、津南区、北辰区、武清区、宝坻区、滨海新区、宁河区、静海区、蓟州区)

河北省:石家庄市:(长安区、桥西区、新华区、井陉矿区、裕华区、藁城区、鹿泉区、栾城区、井陉县、正定县、行唐县、灵寿县、高邑县、深泽县、赞皇县、无极县、平山县、元氏县、赵县、石家庄高新技术产业开发区、石家庄循环化工园区、辛集市、晋州市、新乐市)

唐山市:(路南区、路北区、古冶区、开平区、丰南区、丰润区、曹妃甸区、滦南县、乐亭县、迁西县、玉田县、河北唐山芦台经济开发区、唐山市汉沽管理区、唐山高新技术产业开发区、河北唐山海港经济开发区、遵化市、迁安市、滦州市)

秦皇岛市:(海港区、山海关区、北戴河区、抚宁区、青龙满族自治县、昌黎县、卢龙县、秦皇岛市经济技术开发区、北戴河新区)

邯郸市:(邯山区、丛台区、复兴区、峰峰矿区、肥乡区、永年区、临漳县、成安县、大名县、涉县、磁县、邱县、鸡泽县、广平县、馆陶县、魏县、曲周县、邯郸经济技术开发区、邯郸冀南新区、武安市)

邢台市:(襄都区、信都区、任泽区、南和区、临城县、内丘县、柏乡县、隆尧县、宁晋县、巨鹿县、新河县、广宗县、平乡县、威县、清河县、临西县、河北邢台经济开发区、南宫市、沙河市)

保定市:(竞秀区、莲池区、满城区、清苑区、徐水区、涞水县、阜平县、定兴县、唐县、高阳县、容城县、涞源县、望都县、安新县、易县、曲阳县、蠡县、顺平县、博野县、雄县、保定高新技术产业开发区、保定白沟新城、涿州市、定州市、安国市、高碑店市)

张家口市:(桥东区、桥西区、宣化区、下花园区、万全区、崇礼区、张北县、康保县、沽源县、尚义县、蔚县、阳原县、怀安县、怀来县、涿鹿县、赤城县、张家口经济开发区、张家口市察北管理区、张家口市塞北管理区)

承德市:(双桥区、双滦区、鹰手营子矿区、承德县、兴隆县、滦平县、隆化县、丰宁满族自治县、宽城满族自治县、围场满族蒙古族自治县、承德高新技术产业开发区、平泉市)

沧州市:(新华区、运河区、沧县、青县、东光县、海兴县、盐山县、肃宁县、南皮县、吴桥县、献县、孟村回族自治县、河北沧州经济开发区、沧州高新技术产业开发区、沧州渤海新区、泊头市、任丘市、黄骅市、河间市)

文 | 长三角MOMO 文 | 长三角MOMO 刚刚一个朋友,发了我一张不知道谁偷拍的我的“工作照”。 前景是几个朋友在打台球,远景是我抱着电脑,埋头打字。 我回忆了一下,虽然这个假期我时常掏出来电脑处理个事情,但这张台球厅的场景,应该是10月3号拍的。因为除了公众号,公司还有公关服务的业务,那天恰逢周五,需要给客户交周报了。 “感觉这个假期,全世界都在加班。”她说。她是某4A公司的,因为服务的一家手机厂商10号和13号分别在深圳和上海有两场活动,所以虽然在旅游途中,也得随身带着电脑,时不时就要更新下某位老师的行程变更。 在我的记忆里,干我们这行的,几乎没有过完整的假期,总有这样那样的事情。其实不仅自媒体和公关行业,互联网、金融、城市服务、销售等诸多行业,都是一样的情况。 所以前两天有个新闻,有人中秋国庆用微信处理工作,法院判定这属于加班,裁定单位要给他补偿加班费,还引发了不小的争论。 网友表示:微信回个工作消息这也能算加班?这不是发财了。 我看了下各方报道,这还真算。加班还真不再局限于传统的坐在办公室,通过微信等线上工具,在休息时间处理工作,绝对属于加班。 如此说来,在刚刚过去的国庆假期,又有几个人没有过“加班”? 那问题来了:同样都是牛马,对比国外,中国的打工人为什么就没有福气享受完完整整的假期呢? 我第一个想到的是,除了“奋斗精神”和“传统服从式职场文化”这些比较虚的原因外,首先从技术层面,最大的因素就是微信。 就工作工具而言,国内用的最多的就是微信,而微信作为全能型工具,集成了社交、支付、生活、工作全部功能。 这就导致了,工作与生活的场景在同一个App里“侵染式”的融合了:你打开微信是想看看家人的动态,却不得不先处理工作群里的@。 而国外习惯的工作工具,主流的比如Slack、Teams、Email等,就是工作没有生活,同时也是“分而治之”的,专用工具用于专业的工作场景。 此外,微信包括钉钉,是“强制提醒”的:消息会推送、会响铃、能拨打语音电话,制造了一种“立刻回复”的紧迫感。虽然在假期不想打开它,但App上的红点,会不断给你制造焦虑。 而Slack、Teams、Email这些,是“可管理”的,通过“勿扰模式”,使用者可以在休假时,直接关闭所有非紧急通知。 展开全文 而上面这些工具差异的背后,其实暴露了我们假期被打扰更深层的原因:国内公司的管理,绝大多数都要求“同步沟通”,即要求对方立刻响应。 而欧美职场,更习惯于“异步沟通”。即:“我提出问题或任务,并不期待你立刻回复。我希望你在自己方便的时候,经过思考后给我一个高质量的回复。” 正是这种不同的公司管理和沟通方式,导致了不同打工人使用工具的不同表现。 国内的牛马:在假期面对领导或者客户微信中发来的“在吗?”,基本不可能保持无动于衷。 国外的牛马:假期根本不打开工作相关的软件,在假期结束时,再回复邮件或者Slack频道里的留言,在项目管理工具中更新任务状态和注释。 除了沟通的时效性,沟通的习惯也不一样,我们中的很多人,已经习惯了碎片化的沟通方式。 就拿自媒体约稿来说,一些国际大厂,会让你发邮件,然后在文档中详细的批注每一处改动,批注里不仅告诉你修改意见,甚至将这段需要参考的链接都给附上。 而国内大部分企业的约稿,都是微信上传来传去,有的企业对接人,每一次修改就说一个意见,我曾经见过一位同行改过十七八个版本的稿件。 就说这次假期,有个朋友手头有个企业约稿要写,每次改完,还得抱着手机等待下一次意见。“感觉休了一个假十一,午休也不敢,出门也要时不时看眼手机,休的七零八落的。” 碎片化的工作沟通,割裂出了碎片化的假期。 比管理和沟通文化的异同,更深层次的原因,还有社会和法律环境。 在欧洲很多国家,都有“断联权”法律,规定企业必须尊重员工在下班后的“断联”权利,不得在非工作时间发送工作邮件。美国很多科技大厂,有完整的带薪休假(PTO)制度,而且鼓励甚至强制员工休完。不休假反而会被经理约谈。 比法条更重要的是,工作和生活严格分开,已经成为欧美社会的普遍认知。而国内,虽然法律上有上述的判例,但“加班文化”,还是主流环境。 那么,如果作为一个管理者,如何才能让公司员工,真正能拥有一段“非商品化”的时间、一种可以对工作说“不”的休憩自由呢? 这应该是一个重塑公司管理的系统结果。 第一,技术层面,可以尝试使用为分离而设计的工具,比如邮件,尽量降低微信的比重。 第二,流程层面,建立并习惯于异步沟通的工作流程,减少不必要的实时干扰。 第三,管理层面,不再把“工作时长”与“工作态度”等同于“工作效率”,信奉授权、信任和结果导向的管理哲学,并做好员工休假期间的工作规划。 一些小公司,可以考虑在一些项目管理和重大事项决策方面,部分沟通流程从微信上挪到邮件。有条件的,还可以考虑试行一下AB岗,这样哪怕是对接客户的岗位,也有一半的小伙伴可以休个无人打扰的年假。 既然工作的目的是为了更好地生活,而不是让生活成为工作的附属品,那么我们每个人,都需要有一个真正的假期,一个不受侵犯的心境时间,一个可以坦然放下工作手机、不被莫名的焦虑所绑架、全心全意投入到自己生活中的神圣空间。 往大了说,这是我们每一个个体,是“人”而非“人力资源”的尊严。返回搜狐,查看更多

发布于:邹平市
评论
全部
还没有人评论过,快来抢首评
抢首评

推荐阅读

【钛晨报】每年一次性发放,育儿补贴制度管理规范发布;英伟达以50亿美元入股英特尔,并达成芯片合作;房车新国标发布:行车“禁卧”“禁浴”,明年3月1日起实施

大力财经 2025-11-07 10:16:37 9861

苹果也学会内卷了

大力财经 2025-11-07 00:56:00 1689

顺丰京东菜鸟鏖战东南亚:极兔王座不稳?

大力财经 2025-11-07 10:30:07 1878

餐饮加盟商,不再为“大牌”买单?

大力财经 2025-11-07 06:29:49 6928

预制菜的困局与出路:一场来自业内的真实对话

大力财经 2025-11-07 11:20:24 5960

全球资管格局生变,上海凭科技与资产优势跃居全球第五

大力财经 2025-11-07 09:54:15 1754

印尼镍业变局:一纸查封,难抚全球焦虑

大力财经 2025-11-07 08:31:17 6219

转转向左,闲鱼向右

九派新闻 2025-11-07 05:39:21 5573

被嫌弃的PROTAC第一人

九派新闻 2025-11-07 01:43:13 1811

警惕GLP-1“陷阱”

九派新闻 2025-11-07 10:09:27 6213

国美遇困,黄光裕“追氢”

九派新闻 2025-11-07 11:12:47 2573

AI认知革命:从Ilya的“超级智能对齐”到智能体“不完备定理”

九派新闻 2025-11-07 08:45:35 3118

前阿里CEO卫哲入局圣湘生物,传统检测厂商变身“科技成长股”?

IT之家 2025-11-07 09:24:59 9231

巴西投资340万雷亚尔推动电商发展;TikTok美国出售期限第四次被延长;京东物流“杀入”美国尾程配送市场|一周出海参考

IT之家 2025-11-07 05:43:25 5514

为什么品牌要「真的」有价值观

IT之家 2025-11-07 10:08:25 1012

宗馥莉的第二次“自伤式袭击”

IT之家 2025-11-07 06:04:45 4273

【钛晨报】中证指数发布中证全球算力主题指数等20条指数;英伟达将向OpenAI投资千亿美元共建数据中心;智元机器人正式入主上纬新材,邓泰华成实控人

IT之家 2025-11-07 04:52:56 1822

3人团队掌管300亿保费?保险业高管的生死减法

IT之家 2025-11-07 08:55:28 5268

小米汽车的“必修课”迎来大考

IT之家 2025-11-07 00:27:53 6366

山姆救不了太二酸菜鱼

IT之家 2025-11-07 04:50:23 8355

始祖鸟营销翻车,安踏撞上“烟花墙”

IT之家 2025-11-07 07:49:29 3388
为您推荐中
暂时没有更多内容了……