COPU会议纪要丨2026.06.16

2026-06-17 13:10:46 253

图片关键词

6月16日陆主席主持召开COPU例会。

会议发表COPU关于《中国开源降价大模型发展情况》的文章；

中国开源降价大模型发展情况

陆首群2026.6.11

有人问我：目前中美发展的AI大模型，谁领先？

美西方认为：美国领先。最近针对全球编程能力或性能的夺冠，OpenAI的GPT5.5，Anthropic的Claude Opus 4.8/4.7，正在轮流夺取王冠。此时，中国大批编程大模型也跟上来了，进入了全球编程能力的前列（如阿里千问的Qwen3.7，DeepSeekv.4pro、Kimi的 K2.6、小米的MiMoV2.5、MiniMax M3、智谱的GLM5.1），它们在编程性能的排行榜上虽然仍居美西方的下方，但中国AI大模型发展速度之快，与美国顶尖大模型差距之小，引起了美西方的震惊！

我认为要谈论目前中美AI大模型谁领先的问题，必须从AI大模型三个维度来考察：①从大模型性能维度上看，美国领先；②从大模型的降价维度上看，中国大大领先（把大模型价格降到“白菜价”）；③从大模型调用量维度上看，中国领先。

中国DeepSeekv4在性能维度上与低于但接近美国大模型，在降价和调用量维度上领先较多。美国官方（商务部NlST研究唍）评论：①DeepSeekv4是NlST迄今评估过最强大的中国大模型，②它实际性能与美国目前发的8个顶级大模型接近，③DeepSeekpro的降价比美国低价位的GPT5.4mini还便宜。

美媒报导：越来越多的美国企业（特别是初创企业）广泛表达要转向中国更便宜可调用的开源大模型，OpenAI CEO萨姆奥特曼坦言，成本已突然成为AI大模型发展中的大问题。

除DeepSeek外，Kimi、Mimo、Qwen、GLM、MiniMax等中国大模型集体冲进了世界降本大模型的前列。

这里特别要介绍小米开发的MiMo v2.5，在采用自研的、不同于DeepSeek核心技术的情况下，可以做到与DeepSeek同样的降价水平。

小米MiMo大模型与DeepSeek V4 Pro降价对比分析

小米开发的开源MiMov2.5大模型，在采用自研的、不同于DeepSecSeek核心技术的情况下，可以做到与DeepSteekv4同样的降价水平。

小米MiMo2.5模型的核心技术驱动力是采用开源+推理系统工程化，即自研SNA（滑动窗口注意力）架构，通过FP4Experts、DFlash解码及TileRT执行系统的全链路优化，即基于SGLangHiCache架构的滑动窗口注意力将缓存多级存储间数据搬运量降至1/7，可缓存Token量提升近5倍，成本下降来自缓存工程。

不同于DeepSeekv4pro的核心技术驱动力，即开源+底层架构创新：自研稀疏注意力机制+混合专家模型（MoE）及擵其迭代或延伸。在处玲百万级Token长上下文时对算力消耗仅为上一代的27%，KVCache占用降至10%。成本下降来自模型架构师革命。

对比MiMov2.5与DeepSeek v4的降价效果，达到相同的水平。

1）DeepSeekV4 （元/百万 tokens）

维度 V4 flash V4 Pro

输入（缓存命中） 0.02元 0.025元

输入（缓存未命中）1.0元 3.0元

输出 2.0元 6.0元

上下文长度 1M 1M

2）小米 MiMo

维度 V2.5 V2.5 pro

输入（缓存命中） 0.02元 0.025元

输入（缓存未命中）1.0元 3.0元

输出 2.0元 6.0元

上下文长度256K~1M

会议接着发表CSDN创始人蒋涛关于《Agent入口战的中国变量：五座孤岛和一片微信大陆》的文章。

Agent 入口战的中国变量：五座孤岛，和一片微信大陆

当 App 从「用户打开的入口」变成「AI 调用的工具」，中国卡住的不是模型，而是谁来制定公共规则

本篇摘要：Agent 时代，App 能不能活下去，正在从「用户会不会打开你」，变成「AI 会不会调用你」。苹果和 Google 已经动手，把 App 从前台入口降成后台被调用的能力；中国五家终端厂也在各修各的 Agent，却卡在身份、信任、分成三件事上——谁也不认谁，没有公共答案。而真正的中国变量是微信：它早已握住账号、支付、关系链、小程序和高频入口。中国 Agent 战争最大的悬念，不是下一个模型，而是五座终端孤岛能不能和这片微信大陆，坐到同一张桌上。

图片关键词

────────────────────

6 月 3 日晚，我发出《Agent 入口保卫战》。文章写在 WWDC 之前，提出了一个判断：Apple，微软，华为先后交卷之后，Agent 入口的争夺会从暗线变成明牌。

没想到明牌来得这么齐——

5 月 12 日，Google 把 Android 的定位从 operating system 改成 intelligence system；

6 月 2 日，微软在 Build 上发布 Project Solara——一个「为 Agent 而非 App 打造」的设备平台，基于 AOSP 定制；

6 月 8 日，Apple 在 WWDC 上把 Siri 推倒重写为 Siri AI，底层租用 Google 定制的 Gemini；

6 月 12 日，华为在 HDC 上把鸿蒙推向 Agent OS——开源盘古 openPangu 2.0、预告麒麟端侧 30B，小艺升级为系统级 Agent、成为整个操作系统的调度中心。

三十一天，四张船票：海外三巨头先后下场，中国的华为压轴交卷。

图片关键词

这篇文章讲三件事：先对照 WWDC 的实际发布，说清我说中了什么、错估了什么；再回答留言区问得最多的两个问题——苹果、Android、中国厂商三个生态各自往哪走？中国厂商的框架「互不相通」，到底怎么个不通法？最后补上那头房间里的大象：微信。

────────────────────

一、苹果交的答卷

6 月 8 日的 keynote 是 Tim Cook 作为 CEO 的最后一场——据多家媒体报道，9 月 1 日他将交棒给硬件负责人 John Ternus。他留给继任者的，是苹果十五年来在软件上一次罕见的破例。

Siri 被推倒重写为 Siri AI。能多轮对话、读屏、检索你的邮件短信照片，有独立 App，对话记录跨设备同步——2011 年发布以来，Siri 第一次长成一个完整的智能体入口，而不是一个语音遥控器。

云端模型借 Google 的力。最强的云端模型 AFM Cloud Pro，是苹果借助 Google 的 Gemini、通过蒸馏和训练得来的——据 Bloomberg 等多方报道，价码约每年 10 亿美元，定制模型约 1.2 万亿参数。但苹果反复强调一点：成品「不含一滴 Gemini 代码」，是纯苹果的模型，用户交互时碰不到任何 Google 代码或服务。官方口径是 AI 副总裁 Amar Subramanya 的说法：Apple Foundation Models「为 Apple Silicon 定制、用自有数据训练、用 Gemini 前沿模型的输出做精炼」。

自研模型守端侧。第三代 AFM 3 的端侧主力是一个 200 亿参数的稀疏模型，每次只激活 10 亿到 40 亿参数，直接跑在 iPhone 的芯片上。它接管的是用户最高频、也最敏感的行为：语音识别与听写、读屏理解你正在看什么、调取你的日程邮件照片这些个人上下文、以及大量「订桌、改设置、查订单」级别的简单指令——只有它答不了的复杂推理，才往云端送。换句话说，日常多数交互根本不出门，而这恰恰是苹果最不肯外包的一层：端侧贴着用户最私密的数据，谁掌握端侧，谁就掌握用户画像和隐私这张底牌。云端可以借 Google 的力，端侧必须自己掌握。

App Intents 成为接入 Siri 的唯一通道。它的机制是：App 把自己的功能和数据声明成系统可调用的「意图」——一个意图就是一个带标准化参数和返回结构的动作，订一张桌、查一笔订单、改一个设置。Siri 不再打开你的界面，而是在后台直接调用这些意图，把结果呈现在自己的对话里，还能把几个 App 的意图串成一条任务链。旧的 SiriKit 同场拿到正式废弃通知——不迁移的 App，今秋 iOS 27 发布起就不会出现在新 Siri 的世界里。

两块市场被排除在外。Siri AI 今秋随 iOS 27 上线，硬件门槛 iPhone 17 Pro / iPhone Air 起；欧盟的 iPhone 和 iPad 用不上——苹果把原因归于《数字市场法》（DMA）的互操作性要求，称无法在合规前提下保证安全；中国大陆则是整个 Apple Intelligence 都不可用，监管审批中。两大监管区各自把这个海外入口挡在门外，原因不同，结果一样。

────────────────────

二、苹果正在改写 App 的活法

这届 WWDC 真正的重磅，不是 Siri 变聪明了，而是苹果用一纸开发者通知，开始改写 App 靠什么活下去的规则。

App Intents 强制迁移、SiriKit 废弃，翻译过来就一句话：要么把你的功能拆成 Siri 可调用的意图，要么从入口消失。曝光的分配权从应用商店的榜单，移到了助手的调度逻辑里，一个更深、更不透明的位置。一个用户面对的前台界面，就此被降格成 Agent 在后台调用的能力供应商。这是 Agent 时代对所有 App 的判决书，苹果第一个把它写成了执行细则。

App 的生死线，从「用户会不会点开你」，变成「Siri 会不会调用你」。

我在上一篇《Agent 入口保卫战》里预测——「App 会从信息入口退化为行动入口的能力供应商」，苹果用产品兑现了它。但同一篇里我还有两条对苹果的预判，一条几乎逐字命中，一条错了一半，值得拿出来对个账，因为错的那一半恰恰让核心论点更硬。

第一条命中的是底层模型：「Apple 选择租用底层模型——定制大参数 Gemini，跑在自家 Private Cloud Compute 上。」几乎逐字兑现，连「定制、大参数、自家基础设施」三个限定词都对上了。

错估的是另一条：「iOS 27 将引入一套机制，允许 Claude、Gemini、ChatGPT 等第三方模型成为系统级助手可切换的后端」，并由此推断 Apple 间接背书了「模型中立」。

这条错了一半。多模型确实来了——但来的位置不是 Siri，是开发者工具层。Foundation Models 框架现在可以把任务路由给端侧模型、Private Cloud Compute 或第三方服务端模型；Xcode 27 直接内置了 Anthropic、Google、OpenAI 三家的编码 Agent。

而 Siri 这个入口本身，是苹果一家说了算。它背后那套三层调度——什么走端侧、什么进 Private Cloud Compute、什么交给云端的大模型——全由苹果自己编排，用户看到的只是一个统一的 Siri。云端那层虽然借了 Gemini 的力，但对用户而言，入口的掌控权、调度逻辑、默认大脑，都攥在苹果手里（用户仍可手动选 ChatGPT 处理特定问题，但默认后端是苹果定的）。

所以苹果的真实路线，要从主文写的「封闭中立」修正为：

工具层开放，入口层独占。

它把「模型中立」只给了写代码的人，没有给用户和入口。这个修正反而让主文的核心论点更硬：三条路里，「模型中立的入口」这个位置，Google 不做，苹果也不做。

三、连巨头都只能租地基

前文写中国厂商的处境，用了一句话：身体在中国，大脑在别处。

WWDC 之后，这句话有了一个意外的新主语：苹果——身体在库比蒂诺，最重的那层大脑却要向山景城借。全球市值最高的硬件公司、最有钱做垂直整合的公司，在前沿模型这一层选择了租。

值得玩味的是，这不是苹果和 Google 之间第一笔大交易，但方向反了。过去十几年，是 Google 每年付给苹果约 200 亿美元，买 Safari 上的默认搜索位——那笔钱差不多是 Google 从苹果设备搜索广告里分出的三成。那时苹果是房东：它手握十几亿台设备的用户入口，Google 为了租这个入口付天价。如今这笔模型交易，钱反过来流了：苹果每年付 Google 约 10 亿美元，买自己造不出的前沿模型能力。同样两家公司，十几年间从"Google 交租买苹果的入口"变成"苹果交租买 Google 的大脑"——苹果从房东变成了租客。变的不是谁强谁弱，是稀缺的东西换了：过去最稀缺的是用户入口，苹果攥着；现在最稀缺的是前沿模型，少数几家攥着。谁攥着别人离不开的那样东西，谁就收租。

另一个软件生态巨头的答卷更耐人寻味。微软手握 Windows，却把 Solara 建在 MDEP 上——一套它从 AOSP 分叉出来的企业版系统，因为不是授权版 Android，微软甚至不能叫它 Android。理由很坦白：低功耗设备要的芯片、驱动、硬件生态现成长在 Android 上，Windows 太重；何况「从零做一个移动 OS」的学费，微软用 Windows Phone 的墓碑交过一次了。

一家拥有全球最大桌面 OS 的公司，宁可在对手的开放底座上盖楼，也不肯再赌一次从零做系统。这件事说明两点。一是安卓这套开源底座的引力太强——连微软都得用。二是微软虽然甩开了 Google 的应用服务（GMS），却甩不开 Google 对安卓往哪走的决定权——地基还是 Google 说了算。这第二点，正是中国需要一个中立底座的理由：底座的方向，不能攥在任何一家外国公司手里。

三家海外巨头都在圈自己的地，却都在对手的地基上盖楼：苹果最重的云端推理借 Google 的力，微软的底座用 Google 的开源安卓。这不是它们不想自己干，是前沿模型和移动底座这两样东西，今天就攥在少数几家手里，强如苹果、微软也绕不开——只能租。

这一层，没有任何后来者能靠单家自建追平，可行的路只剩共建。

────────────────────

四、Google 的答卷：本尊登基

如果说 Gemini 在 iOS 里是个隐姓埋名的外包大脑，在 Android 上它是名正言顺登基的新国王。

入口层，Gemini 取代了 Google Assistant，成为系统级常驻助手。今年 I/O 上 Google 给它的定位很直白：从「你问我答」的助手，变成主动跟进任务的个人 Agent。Pichai 给的数字是：Google 每月处理的 token 量已达 3200 万亿——一年前是 480 万亿，涨了 6 倍多。

App 层，Google 给 Agent 修了两条路。第一条是正门：AppFunctions——让 App 把功能注册成系统级可调用的函数，Google 自己把它类比为「设备本地的 MCP」。第二条是后门：UI 自动化——App 不接入也没关系，Gemini 直接代替用户点屏幕，用户通过「实时画面」监看、随时接管。

两条路合起来，是比苹果更完整的收编方案：接入 AppFunctions 的 App 被 API 调度，不接入的被 UI 自动化穿透。对中长尾开发者，「不配合」几乎不再是一个选项；对头部 App，则是换了一张牌桌的平台博弈。目前 AppFunctions 还在实验预览，与 Gemini 的集成在小范围私测，Android 17 上会扩大到更多用户、开发者和厂商——倒计时已经按下。

控制面层，是主文讲过的老故事：AICore 锁在 OEM 无权触及的安全等级里。于是 Android 生态的演进呈现一个剪刀差——

对开发者越来越开放，对手机厂商越来越封闭。胡萝卜给写代码的人，大棒留给造手机的人。

────────────────────

五、中国的答卷（一）：五座孤岛

中国市场和上面两个生态有一个根本差异：入口权还没有归属。

第一节末尾那两块被排除在外的市场，正是这一节的起点。Gemini 进不来，Siri AI 卡在审批，两个海外大脑都缺席，这块全球最大的单一手机市场，Agent 入口此刻是真空；欧盟那一边，苹果的新入口同样被挡在门外。全球前两大监管区，一个进不去、一个进不全。主文讲的「数字主权市场」不是推演，是正在发生的现实：监管强度越高的市场，越需要一个不被单一外国厂商控制的中立底座。

真空里站着五家厂商，各举各的旗：华为的 HMAF 鸿蒙智能体框架、小米的超级小爱加自研 MiMo 模型加玄戒芯片、vivo 的蓝心智能、OPPO 的小布助手、荣耀的阿尔法战略——主文第六部分把这个格局叫「协议孤岛」：每家都在自己的城里修 Agent，城与城之间没有路。

五家里答得最完整的是华为。6 月 12 日的 HDC，鸿蒙交出的是一份「全栈自有」的答卷：底座是 13 亿设备的鸿蒙、98% 的 HarmonyOS 6 升级率；模型是当天宣布从 6 月 30 日起陆续开源的盘古 openPangu 2.0（505B 与 92B 两个稀疏版本，激活参数压到 18B 和 6B），外加预告秋季上麒麟的端侧 30B；入口是升级成系统级 Agent 的小艺——鸿蒙智能体框架 2.0，复杂任务成功率超九成，能调用 2100 多项系统能力、独占 200 多项系统级用户数据，日活 1.8 亿、日均唤醒 30 亿次。华为还把交互范式从「人找应用」改写成「意图即服务」：一句「我下周跑半马，帮我排恢复训练加进日程」，小艺自己拆解、调用、落到日历——小艺被明确定位成「整个操作系统的调度中心」。

这份答卷的完整度，反而把孤岛问题摆得更清楚。底座、模型、入口、调度全栈自有，意味着这一切的闭环边界，就是华为这一家的边界：小艺独占的那 200 多项数据、那 2100 项系统能力，换台小米手机一项都带不走。

华为答得越全栈，墙就砌得越高——它证明的不是孤岛在变通，是每座孤岛都在把自己挖得更深。底座越自有，跨厂商的那道缝就越宽。

留言区追问最多的就是这里：到底怎么个不通法？不是都支持 MCP 了吗？

这个问题问到点子上——因为「不通」恰恰不是一堵墙，是四堵。而最关键的那一堵，和协议无关。

────────────────────

六、孤岛解剖：四层不通

图片关键词

第一层，用户的不通：五个大脑互不相认。你在华为手机上调教了一年的小艺——它记住了你的日程习惯、常用服务、说话方式——换一台小米，全部归零，从头教超级小爱。这道墙在 Agent 时代只会更高：小艺生长在系统底层、独占大量系统级用户数据，这份「懂你」被焊死在品牌里，换机等于清零重来。App 时代没有这个问题——微信装在哪台手机上都是你的微信。Agent 时代，「懂你」成了厂商的私产。

第二层，开发者的不通：协议通了，整机还是孤岛。想让你的服务被中国用户的手机 Agent 调用？华为要你上小艺智能体开放平台、用鸿蒙智能体框架开发、过审后上架鸿蒙智能体市场；小米要你上 Agent 生态平台、把服务上传给 miclaw（这个平台 2026 年 4 月才开公测，定向邀请制）；vivo 走蓝心的意图框架加智能体平台；OPPO 和荣耀的小布、YOYO 再各走一遍。五套文档、五套审核、五个市场、五份持续维护——对比海外接入苹果一套 App Intents、接入 Google 一套 AppFunctions，这是 Android 时代「写一次、到处跑」倒退成「写五次、各跑各的」。

第三层，协议的悖论：通了，却还是不通。协议层明明已经在收敛：华为 HMAF 兼容 MCP，小米的平台直接收 MCP 服务，荣耀官宣支持 MCP 与 A2A——头部厂商正汇向同一套全球零件标准。零件通用了，整机为什么还是孤岛？

因为 MCP 解决的是「Agent 怎么调用一个工具」，它不解决工具背后那三件事——

身份：你的服务接入小艺要用华为账号体系打通登录和会员，接入小爱要用小米账号体系再打通一遍，五家各一套、互不相认。用户在哪家被授权、授权到什么程度，账归各家自己管，没有一个跨生态认得过来的统一身份。

信任：华为凭什么信任一个为小米生态写的 Agent，放它进系统层读上下文、动用户数据？反过来也一样。每家的权限授信都是封闭的，一个 Agent 在 A 家拿到的信任，到 B 家归零。

分成：用户通过 Agent 在你的服务里完成一笔交易，这笔钱走谁的支付、抽谁的成、数据归谁，五家各有各的规矩，且都没跟别家对齐过。

这三件事，每一件都在协议之外，每一件都没有公共答案。它们有个共同点：都不是技术问题，是「谁说了算」的问题——这类事天然不能由竞争中的某一家单方面拍板，只能由一个各方都认的公共层来裁定。

不通的不是协议，是协议管不到的事：身份、信任、分成。

USB-C 接口全球统一了，也不意味着任何设备能插进任何机房——零件标准化，和系统级互通，是两回事。

第四层，Agent 的不通：谁也不肯把大脑交出去。让 Agent 真正跨应用干活，正路是意图框架——App 把功能注册成可调用的意图。华为、vivo、OPPO 都推出了各自的意图框架，小红书、同程、58 同城、支付宝出现在各家的合作名单里。但据接触过谈判的业内人士透露，接入进展并不顺利——App 大厂普遍谨慎：被 Agent 直接调用，用户就不再打开 App，流量、广告、数据积累都被截走。

这层抵触，在 Agent 时代比 App 时代重得多。App 时代，应用商店要的是上架和分成，数据还攥在 App 自己手里；Agent 时代，系统级 Agent 长在 OS 底层、贴着用户数据，一个 App 把功能注册给它，等于把「用户想干什么」这条最值钱的信息流，连同交易和数据，一起接到了终端厂的管子上。交给一个框架是让渡，交给五个各自封闭的框架、还得赌哪家终端厂将来不会变成自己的对手——接入意愿上不来，根子在这里。

于是出现绕路方案：GUI Agent——模型直接看屏幕、模拟点击，不需要 App 配合。豆包手机走的就是这条路，结果是被围堵。耐人寻味的是 OPPO 的内部判断：他们把 GUI Agent 定位成「覆盖长尾场景的兜底方案」，更倾向用 Agent to Agent 的方式实现生态互联，理由是一句很诚实的话——「手机在这方面的尝试其实牵一发而动全身，因为它本身的生态位很特殊。」

翻译一下：终端厂自己也知道，硬闯 App 的围墙会引发全面战争，坐下来谈又没有共同的桌子。四层不通，环环加固。

而四层之下，还压着一个谁都没先开口的问题：钱怎么分。App 时代的分账规则用了十五年才稳定——苹果三七开，中国安卓渠道对游戏一度按五五分。Agent 时代这套规则直接失效：过去 App 付给应用商店 30%，买的是分发和曝光；现在发现、比价、下单全由系统 Agent 在后台完成，App 连界面都没露脸，议价地位归零。系统会不会要一个比 30% 更狠的「任务佣金」？搜索时代的竞价排名会不会重演成「调用竞价」——谁出价高，谁被 Agent 优先选中？更反常识的是：用户一句「订一张最便宜的半马酒店」，背后可能调用五个 App、烧掉一大把推理 token，开放接口的 App 非但拿不到广告费，还得为别人的调用倒贴算力钱——账单最后记在自己头上。这笔账算不平，意图框架就只是空中楼阁。而它算不平的根子，和前三件事一样：钱怎么分，没有一家能替所有人拍板。

把这四层叠起来看，会发现 Agent 入口战的本质，不是「谁家助手更聪明」，是一场新分发秩序之争——每一类玩家的核心问题都被改写了。对 App 公司，过去是「怎么让用户打开我」，未来是「怎么让 Agent 调用我」；对终端厂，过去是「怎么卖更多设备」，未来是「怎么成为那个调度一切的中心」；对整个中国生态，过去是「各自怎么做强」，未来是「怎么建起一张彼此都认的公共调用网」。四层不通卡住的，正是最后这件事。

────────────────────

七、中国的答卷（二）：墙内大陆

中国 Agent 战场的真实格局，从来不只是五座孤岛——岛群旁边停着一片大陆：微信。

6 月 2 日《金融时报》报道：腾讯正在测试微信内置 AI Agent——主界面右滑唤出，一句话就能驱动它调用小程序完成筛选、下单，内部列为最高战略优先级。The Information 给的时间表是三季度上线，可连接微信内数百万个小程序。这不是临时起意：腾讯 3 月的年报已写明要在微信生态内建设「下一代 Agentic services」。消息传出当天，腾讯股价应声大涨——市场对「微信做 Agent」的分量，投了最直接的一票。

六天之后，6 月 8 日——苹果发布 Siri AI 的同一天——微信开放平台官宣向小程序开发者开放微信 AI 接入。指引开头很客气：「在充分尊重开发者权益和自主选择的基础上」，往下是两种模式：自动模式，开发者授权平台读取小程序源码，无需额外开发，微信 AI 直接操作页面；开发模式（内测中），开发者把功能封装成 SKILL，由「小程序 MCP」协议供 AI 调用。但公告同时写明两件事：接入后小程序「有机会」被推荐和调用；未接入的，将无法被微信 AI 调用。美团已宣布接入。

把这份开发文档和前文对照着读，有三个发现。

第一，微信对小程序做的，正是苹果对 App 做的。同一道最后通牒，两种口音：苹果用废弃通知说「不迁移 App Intents，就从新 Siri 消失」；微信用「充分尊重开发者权益和自主选择」开头，落点是「未接入将无法被调用」。一个把话挑明，一个裹着敬语，逼到的是同一个墙角——应用退化为可调用的能力，界面退化为对话流里的一张卡片。而且接入只是门票：调用要过平台评测与审核，推荐与否是平台裁量。「Siri 会不会调用你」的微信版已经挂出来了——微信 AI 会不会调用你。

第二，微信把 Google 的两条路在墙内复刻了。开发模式是正门（标准化接口），自动模式是后门（平台读源码、AI 直接操作页面）——而且这条后门比 Google 的 UI 自动化伸得更深：Google 只是看屏幕，微信直接读代码。正门加后门，开发者同样面对收编：中长尾几乎没有「不配合」的余地，头部则只剩「被怎样调用」的谈判空间。

第三，开发文档明文写着，小程序 MCP「与标准 MCP 不同」。MCP 和 Skill 本是 Anthropic 立下、全球 Agent 生态正在收敛的两个标准，可微信把它们接进来后改写了语法：标准 MCP 让任意 AI 连接任意工具，小程序 MCP 只让微信 AI 连接微信生态内的工具。这不是微信第一次这么干——小程序从诞生起就走私有的一套：页面不用 HTML 用 WXML，样式不用 CSS 用 WXSS，没有标准 DOM，连尺寸单位都自创了一个，官方理由通常是性能与安全。

全球标准进了墙，不只变成方言——墙还会反过来定义这门语言。

把微信 Agent 放进上一节的「四层不通」框架里看，会看到一个让所有终端厂坐立不安的事实——

第六节列的那三件没有公共答案的事——身份、信任、分成——微信的围墙之内，全部已经解决了。身份是微信账号加实名体系——开发文档明文规定，AI 模式下的用户登录身份与原小程序保持一致，wx.login 直接复用；信任是支付级风控跑了十年；分成是微信支付加服务商抽成体系。再加上数百万小程序加搜一搜这个现成的分发盘子，14.32 亿月活之上，Agent 需要的全部基础设施现成摆着。

严格说，「墙内已通」的不止微信一家——支付宝同样三件俱全，阿里的千问已经在打通电商、出行与蚂蚁支付干活。但支付宝缺两样东西：社交关系链，和「一天被打开几十次」的入口频次。三件事加这两样，凑齐的只有微信。

五家终端厂还在为这三个问题各修各的答案，微信墙内的答案，十年前就在真金白银地运转了。

这就是为什么豆包们做 Agent 要「找入口」，而微信做 Agent 只需要「开闸」。也是为什么字节的豆包顶着 3.45 亿月活，仍然要去造一台手机——独立 AI App 有心智没闭环，缺的就是微信墙内那三件事。

而微信还有一件别人没有的底牌：商业闭环。抖音的电商闭环也跑通了，靠的是公域内容流加直播间的货架逻辑；微信走的是另一条——商家这几年正从拼价格、拼量的货架电商出走，涌进微信做私域，把客户沉淀在自己手里。私域里的发现、比价、下单本来就长在小程序和支付里，Agent 把它们串成一句话的事，交易里抽一道手续费，token 的账单就有人付了。这一点很关键：别家做 Agent 都在发愁推理成本谁来出，微信靠交易抽成就能覆盖——用户每下一单，抽的手续费就够付这次调用烧掉的算力。而这套抽成管道早就是成熟的现金流：微信支付的商业支付，是腾讯金融科技板块的基本盘，而这个板块 2025 年收入 2294 亿元、占腾讯总营收三成，是它仅次于游戏的第二大收入来源。做 Agent 不用新建一条变现路，现成的支付管道直接接上就行。三件事之外，它还多解决了一件最现实的：不光能把钱分清楚，还能挣钱养住这套系统。

────────────────────

八、墙内大陆的边界

但墙内大陆有两个结构性局限。

第一，它只在墙内通。微信 Agent 调度的是小程序宇宙；墙外的系统能力、硬件、其他 App 的原生功能，它够不着——除非手机厂商放行，而手机厂商攥着语音入口、系统权限和默认设置。豆包手机演示了平台封杀终端；接下来大概率上演反向剧目：终端钳制平台——系统级 Agent 和微信 Agent 抢同一个用户的同一句指令，谁先听见、谁能调谁，取决于谁攥着系统。

中国的 Agent 战争由此从「终端对平台」升级为双向钳制：你封我的手机，我掐你的入口。

第二，它出不了海。墙内大陆的全部地基——小程序密度、支付渗透、关系链——都长在中国市场里。微信 Agent 可以统一墙内体验，但它给不了中国产业一个能走向全球的 Agent 底座。

所以超级 App 面前摆着三个选项：

守墙（赌系统级 Agent 永远进不来——这堵墙挡得住一台手机，挡不住五家终端厂加一个时代）；

称王（自建 OS 外之 OS，重演双向钳制的消耗战）；

或者上桌——把墙内那套已经跑通的三件事答案，变成行业公共层的蓝本。

6 月 8 日官宣说明微信已经迈进了「称王」，但称王和上桌并不互斥——墙内称王解决不了出海、也解决不了与终端的钳制，而且称王越成功，上桌定规则的筹码越足。

对微信，上桌不是让利，是变现：三件事完整、又握着关系链和最高入口频次的，全中国就微信一家，在公共规则的制定桌上它天然坐主位。我在上一篇提出的 MAL（Mobile Agentic Linux，移动智能体公共底座）——一个由终端厂、监管、模型方、Agent 方、App 方共建的中立联盟，正是为这张桌子设计的：App 这一方留的就是微信这个位置——

腾讯级别的玩家在不在桌上，桌子本身的合法性都不一样。

────────────────────

九、四份答卷，一张表

图片关键词

先把表横着读「App / 服务的命运」那一行：四堵围墙的主人，在 2026 年做着同一个动作——把应用拆成 AI 可调用的原子能力，正门叫意图、叫 SKILL，后门叫自动化。对一个想全渠道存活的服务，「写一次、到处跑」的反面正在成形：App Intents 写一遍，AppFunctions 写一遍，五套终端框架各写一遍，微信 SKILL 再写一遍。

四层不通，不是哪一家的过错——它是「没有公共层」这个结构的必然产物，换任何五家公司坐进这个结构，结果都一样。而公共层并不要求谁放弃自己的助手。Linux 史给过现成答案：共内核、异发行——Red Hat、SUSE、Ubuntu 用同一个内核打了三十年商战，差异化全在发行层。小艺、超级小爱、蓝心小 V、小布、YOYO，就是 Agent 时代的五个发行版；底座统一抹平的不是差异，是五份重复造轮子的成本。这条思路，下一篇《MAL 2.0》会展开。

再读最后两列，就是中国战场的特殊性：

**海外是巨头对巨头的阵地战，中国是终端、平台、独立 AI 入口的三方混战**——苹果和 Google 面对的开发者里，没有一个握着 14 亿月活。

把表竖着读控制权那一行：苹果已收紧，Google 正在收紧，中国未归属。前两个没有悬念，第三个才有变数——而变数的窗口在走表。主文给的 36 个月，由四个外部进程的倒计时决定，其中「Apple 的 Agent 体系全量铺开」这一格，已随 iOS 27 今秋全量、Siri AI 年内开测正式启动；Android 17 的 Agent 全量铺开是另一格。微信 Agent 三季度上线，则会在窗口之内把「双向钳制」从推演变成日常。

让这五家同意一个系统核心，近乎不可能。证据就在眼前——跨品牌传一个文件这种最简单的协作，非华为几家也是从 2019 年的互传联盟起步，磨了好几年才磨通；每家手里都备着自己的 OS，鸿蒙之外，小米有澎湃 OS，vivo 有自研的蓝河，连海内外两轨的系统都刚并成自家一套；agents all in 的账单，各家自己都还没算清；说到底，他们的本能仍是堆料卖硬件的公司。我和几位一线决策者聊过，对「统一 Agent OS」普遍悲观，有位资深专家举了个很关键、却很小的例子：连 WebView 这种最底层的东西，几家到今天都统一不了——明明都是魔改同一个 Chromium 内核，可每家都要在上面叠自己的一套管控，连一个浏览器内核都各自要加一道自己的管控，遑论一个调度全机的 Agent 核心。

但这些悲观，针对的全是「统一一个系统核心」——而 MAL 要的恰恰不是这个。WebView 统一不了，是因为它动了各家系统的实现；互传联盟最终通了，是因为它不动任何一家的系统，只在上面立一层薄薄的协议。MAL 的入口走的是后一条路：不换核心、不碰各家的发行版，只在三件事的治理层上立一层公共标准。「我的地盘我做主」和「地盘之间留一条公共通道」并不矛盾。

何况还有两个五年前没有的新情况：当年 Google 还没把控制权收进 AICore，微信也还没带着现成的闭环要在三季度入场。外部压力变了，"自己单干划算还是一起共建划算"这笔账，也得重新算。

该从哪里下手，第六节已经标出来了。技术协议这层正在统一：华为、小米、荣耀都已经接入 MCP。标准这层也有了开头：《人工智能终端智能化分级》国家标准已经把五家拉到一起当起草单位。真正还缺的，是身份、信任、分成这三件事的公共规则。这三件事说到底是分钱分权，谁自己出来定，别家都不服——所以只有一个办法：交给一个谁都不独大的中立机构来管，谁贡献大谁的话语权就大。

至于这张桌子怎么搭，起点未必在最难处：不必从「数据互通」动手，最薄的第一步是先立一层谁都不独大的 Agent 能力注册与认证——不碰系统核心、不要求交出用户数据，只解决「一个外来 Agent 凭什么被信任、被调用、被分账」。身份与信任先通，分成随后，数据互不互通甚至可以永远不碰。这条路谁来牵头、各方为什么愿意上桌，是下一篇的事。

────────────────────

十、三年后，如果还是各打各的

把上面的「如果」反过来推一遍：假设这张桌子始终没搭起来，五家各守各的城、微信守住墙，三年后会怎样？这不是危言，是把今天每一条已经画好的线，顺斜率往前延一格。

先碎的是用户体验。今天换手机，丢的是相册和聊天记录，云端找得回；三年后换手机，丢的是一个懂你两年的助手——它知道你每周三接孩子、出差只住某个连锁、说「老地方」指哪家店。这些「理解」焊死在前一家的系统底层，带不走。于是用户被迫精神分裂：你的微信在每台手机上都是你的微信，你的系统助手却换一台就失忆一次，「问系统的事」和「问微信的事」得分两个脑子记。

接着碎的是开发者投入。「写一次、到处跑」在 Agent 层退回部落时代：第六节那七八套封闭接入，三年后逼出分化——大厂只接流量最大的两三家，中小开发者干脆只接微信。两头一挤，终端厂的系统 Agent 越来越空，最后沦为一个调不动外卖、打不到车、买不了票的高级闹钟。

最后碎的是「Agent OS」这个词本身。五家都说自己做的是 Agent OS、是操作系统的调度中心。但操作系统的前提是能调度一切，而这五个「OS」每个都只能调度自己围墙内的部分。当一个 OS 调不动用户每天用得最多的那批 App，它就不是 OS，是个壳。

中国可能成为全球唯一一个「人人都在做 Agent OS、却没有一个真正的 Agent OS」的市场。

────────────────────

结语

一个月，先是三张来自海外的船票：Google 把 Android 改了名，微软把设备平台建在 AOSP 上，苹果把 Siri 的大脑租给了 Google。三家路线不同，动作相同——把自己的桌子搭起来，把 App 收编成 Agent 的技能，把入口攥进自己的 AI 层。第四张票来自国内：华为把鸿蒙推成 Agent OS，小艺坐上了操作系统的调度中心——中国厂商也开始交卷了，只是这张卷子还只答了自己那一栏。

中国的答卷，一半是孤岛，一半是围墙：五家终端厂的孤岛，缺的是三件事的公共答案；微信的围墙，圈住的恰恰是这三件事的现成答案。

把孤岛连成网，和把围墙变成桌子，是同一件事。

苹果和 Google 争的是「谁的大脑更强」。中国要解的是另一道题：缺的从来不是一个更强的大脑，而是让五个大脑和一片大陆愿意同坐一桌的那套规则。

这场战争的完整推演、中国手里的牌、以及 MAL 的具体方案，都在 6 月 3 日那篇《Agent 入口保卫战》里。这篇是它的续集——而结论没有变：

合纵未必赢，但连横必输。

────────────────────

下一篇是《MAL 2.0：Linux 赢 Unix，赢的从来不是内核》。今天中国 Agent 入口战遇到的难题——五家凭什么共建、同质化怎么破、出海靠什么、token 账单谁来付——三十年前的 Linux 生态都遇到过。Linux 最重要的胜利不是写出了一个更强的内核，而是发明了一套让竞争者共同站在同一层底座上的产业结构：上层继续厮杀，底层共同繁荣；诸侯不必交出王冠，只需要统一货币和度量衡。中国 Agent 生态要躲开「五座孤岛各自为战」，缺的正是这样一层薄而关键的公共底座。怎么建，下篇拆开讲。

────────────────────

本文主要基于 Apple WWDC 2026、Google I/O 2026、华为 HDC 2026、微信开放平台公告、腾讯财报及多家产业媒体的公开报道整理；涉及未公开商业条款与未上线产品的信息，均按报道来源标注。

参考资料与公开信息来源（按主题归并）

苹果 WWDC 2026（6.8）：Siri AI、App Intents 强制迁移与 SiriKit 废弃、Xcode 27 内置三家编码 Agent、欧盟 DMA 与中国大陆不可用、硬件门槛、Cook 末届与 Ternus 接任——Apple 官方及 Engadget、TechCrunch、CNBC 等报道；定制 Gemini 约 10 亿美元/年、约 1.2 万亿参数为 Bloomberg（Gurman）报道、苹果未确认商业条款；AFM 3 端侧 20B 稀疏与 Cloud Pro 跑在 Google Cloud 英伟达 GPU 上为 Apple 开发者文档及技术媒体分析。

Google I/O 2026：Gemini 取代 Assistant、AppFunctions（「设备本地的 MCP」、Android 17 扩大）+ UI 自动化、token 量级（Pichai）——Google 官方博客、Android Developers Blog、9to5Google。

微软 Project Solara / MDEP（6.2）：建于 AOSP 分叉的企业级 OS、不能称 Android——微软官方博客 Command Line、GeekWire、BetaNews。

华为 HDC 2026（6.12）：小艺升级系统级 Agent、鸿蒙智能体框架 2.0、盘古 openPangu 2.0 开源、端侧 30B、独占 200+ 系统级数据等——新浪财经、TGBUS、雷科技现场报道（数据为华为官方口径）；HMAF/Agent Kit 为 HDC 2025 及技术解读。

其他终端厂：小米 Agent 生态平台（澎湃 OS 开发者公告）、荣耀支持 MCP/A2A、意图框架谈判受阻与 OPPO 表态（21 世纪经济报道、华尔街见闻）、《人工智能终端智能化分级》GB/Z 177—2026（新华网）。

微信：AI Agent 原型（《金融时报》6.2、The Information、虎嗅、IT之家）、《关于开发者接入微信AI生态的指引》与《小程序 AI 开发模式（beta）接入指南》（微信开放平台公告 6.8 及开放文档）、"下一代 Agentic services"（腾讯 2025 年报）、马化腾表态（钛媒体）、合并月活 14.32 亿（腾讯 2026Q1 财报）、金融科技及企业服务 2025 年收入 2294 亿元 / 占总营收约三成（腾讯 2025 年度业绩公告 2026.3.18）。

其他：豆包月活 3.45 亿（QuestMobile）；Google 改名、豆包手机被围堵等见《Agent 入口保卫战》正文及来源。

——蒋涛 · CSDN

参会人员：陆首群、孟伟、杨文庆、安泱、张侃、孟迎霞、袁怿、陈道新、靳虹博（线上）、韩宪平（线上）、陈伟（线上）、Anna.AI（线上）、陈越（线上）、谭中意（线上）。

图片关键词

COPU会议纪要丨2026.06.16

开源创新中心

推荐