COPU会议纪要丨2026.06.16

2026-06-17 13:10:46 235

图片关键词

616日陆主席主持召开COPU例会。

会议发表COPU关于《中国开源降价大模型发展情况》的文章;

中国开源降价大模型发展情况

陆首群2026.6.11

有人问我:目前中美发展的AI大模型,谁领先?

美西方认为:美国领先。最近针对全球编程能力或性能的夺冠,OpenAIGPT5.5AnthropicClaude Opus 4.8/4.7,正在轮流夺取王冠。此时,中国大批编程大模型也跟上来了,进入了全球编程能力的前列(如阿里千问的Qwen3.7DeepSeekv.4proKimi K2.6、小米的MiMoV2.5MiniMax M3、智谱的GLM5.1),它们在编程性能的排行榜上虽然仍居美西方的下方,但中国AI大模型发展速度之快,与美国顶尖大模型差距之小,引起了美西方的震惊!

我认为要谈论目前中美AI大模型谁领先的问题,必须从AI大模型三个维度来考察:①从大模型性能维度上看,美国领先;②从大模型的降价维度上看,中国大大领先(把大模型价格降到“白菜价”);③从大模型调用量维度上看,中国领先。

中国DeepSeekv4在性能维度上与低于但接近美国大模型,在降价和调用量维度上领先较多。美国官方(商务部NlST研究唍)评论:①DeepSeekv4NlST迄今评估过最强大的中国大模型,②它实际性能与美国目前发的8个顶级大模型接近,③DeepSeekpro的降价比美国低价位的GPT5.4mini还便宜。

美媒报导:越来越多的美国企业(特别是初创企业)广泛表达要转向中国更便宜可调用的开源大模型,OpenAI CEO萨姆奥特曼坦言,成本已突然成为AI大模型发展中的大问题。

DeepSeek外,KimiMimoQwenGLMMiniMax等中国大模型集体冲进了世界降本大模型的前列。

这里特别要介绍小米开发的MiMo v2.5,在采用自研的、不同于DeepSeek核心技术的情况下,可以做到与DeepSeek同样的降价水平。

小米MiMo大模型与DeepSeek V4 Pro降价对比分析

小米开发的开源MiMov2.5大模型,在采用自研的、不同于DeepSecSeek核心技术的情况下,可以做到与DeepSteekv4同样的降价水平。

小米MiMo2.5模型的核心技术驱动力是采用开源+推理系统工程化,即自研SNA(滑动窗口注意力)架构,通过FP4ExpertsDFlash解码及TileRT执行系统的全链路优化,即基于SGLangHiCache架构的滑动窗口注意力将缓存多级存储间数据搬运量降至1/7,可缓存Token量提升近5倍,成本下降来自缓存工程。

不同于DeepSeekv4pro的核心技术驱动力,即开源+底层架构创新:自研稀疏注意力机制+混合专家模型(MoE)及擵其迭代或延伸。在处玲百万级Token长上下文时对算力消耗仅为上一代的27%KVCache占用降至10%。成本下降来自模型架构师革命。

 

对比MiMov2.5DeepSeek v4的降价效果,达到相同的水平。

1DeepSeekV4 (元/百万 tokens

维度 V4 flash   V4 Pro

输入(缓存命中) 0.02 0.025

输入(缓存未命中)1.0 3.0

输出 2.0   6.0

上下文长度 1M    1M

2)小米 MiMo

维度 V2.5    V2.5 pro

输入(缓存命中) 0.02  0.025

输入(缓存未命中)1.0 3.0

输出 2.0  6.0

上下文长度256K~1M

 

会议接着发表CSDN创始人蒋涛关于《Agent入口战的中国变量:五座孤岛和一片微信大陆》的文章。

 

Agent 入口战的中国变量:五座孤岛,和一片微信大陆

App 从「用户打开的入口」变成「AI 调用的工具」,中国卡住的不是模型,而是谁来制定公共规则

本篇摘要:Agent 时代,App 能不能活下去,正在从「用户会不会打开你」,变成「AI 会不会调用你」。苹果和 Google 已经动手,把 App 从前台入口降成后台被调用的能力;中国五家终端厂也在各修各的 Agent,却卡在身份、信任、分成三件事上——谁也不认谁,没有公共答案。而真正的中国变量是微信:它早已握住账号、支付、关系链、小程序和高频入口。中国 Agent 战争最大的悬念,不是下一个模型,而是五座终端孤岛能不能和这片微信大陆,坐到同一张桌上。

图片关键词 

────────────────────

6 3 日晚,我发出《Agent 入口保卫战》。文章写在 WWDC 之前,提出了一个判断:Apple,微软,华为先后交卷之后,Agent 入口的争夺会从暗线变成明牌。

没想到明牌来得这么齐——

5 12 日,Google Android 的定位从 operating system 改成 intelligence system

6 2 日,微软在 Build 上发布 Project Solara——一个「为 Agent 而非 App 打造」的设备平台,基于 AOSP 定制;

6 8 日,Apple WWDC 上把 Siri 推倒重写为 Siri AI,底层租用 Google 定制的 Gemini

6 12 日,华为在 HDC 上把鸿蒙推向 Agent OS——开源盘古 openPangu 2.0、预告麒麟端侧 30B,小艺升级为系统级 Agent、成为整个操作系统的调度中心。

三十一天,四张船票:海外三巨头先后下场,中国的华为压轴交卷。

图片关键词

 

这篇文章讲三件事:先对照 WWDC 的实际发布,说清我说中了什么、错估了什么;再回答留言区问得最多的两个问题——苹果、Android、中国厂商三个生态各自往哪走?中国厂商的框架「互不相通」,到底怎么个不通法?最后补上那头房间里的大象:微信。

────────────────────

一、苹果交的答卷

6 8 日的 keynote Tim Cook 作为 CEO 的最后一场——据多家媒体报道,9 1 日他将交棒给硬件负责人 John Ternus。他留给继任者的,是苹果十五年来在软件上一次罕见的破例。

Siri 被推倒重写为 Siri AI。能多轮对话、读屏、检索你的邮件短信照片,有独立 App,对话记录跨设备同步——2011 年发布以来,Siri 第一次长成一个完整的智能体入口,而不是一个语音遥控器。

 

云端模型借 Google 的力。最强的云端模型 AFM Cloud Pro,是苹果借助 Google Gemini、通过蒸馏和训练得来的——Bloomberg 等多方报道,价码约每年 10 亿美元,定制模型约 1.2 万亿参数。但苹果反复强调一点:成品「不含一滴 Gemini 代码」,是纯苹果的模型,用户交互时碰不到任何 Google 代码或服务。官方口径是 AI 副总裁 Amar Subramanya 的说法:Apple Foundation Models「为 Apple Silicon 定制、用自有数据训练、用 Gemini 前沿模型的输出做精炼」。

自研模型守端侧。第三代 AFM 3 的端侧主力是一个 200 亿参数的稀疏模型,每次只激活 10 亿到 40 亿参数,直接跑在 iPhone 的芯片上。它接管的是用户最高频、也最敏感的行为:语音识别与听写、读屏理解你正在看什么、调取你的日程邮件照片这些个人上下文、以及大量「订桌、改设置、查订单」级别的简单指令——只有它答不了的复杂推理,才往云端送。换句话说,日常多数交互根本不出门,而这恰恰是苹果最不肯外包的一层:端侧贴着用户最私密的数据,谁掌握端侧,谁就掌握用户画像和隐私这张底牌。云端可以借 Google 的力,端侧必须自己掌握。

App Intents 成为接入 Siri 的唯一通道。它的机制是:App 把自己的功能和数据声明成系统可调用的「意图」——一个意图就是一个带标准化参数和返回结构的动作,订一张桌、查一笔订单、改一个设置。Siri 不再打开你的界面,而是在后台直接调用这些意图,把结果呈现在自己的对话里,还能把几个 App 的意图串成一条任务链。旧的 SiriKit 同场拿到正式废弃通知——不迁移的 App,今秋 iOS 27 发布起就不会出现在新 Siri 的世界里。

两块市场被排除在外。Siri AI 今秋随 iOS 27 上线,硬件门槛 iPhone 17 Pro / iPhone Air 起;欧盟的 iPhone iPad 用不上——苹果把原因归于《数字市场法》(DMA)的互操作性要求,称无法在合规前提下保证安全;中国大陆则是整个 Apple Intelligence 都不可用,监管审批中。两大监管区各自把这个海外入口挡在门外,原因不同,结果一样。

────────────────────

二、苹果正在改写 App 的活法

这届 WWDC 真正的重磅,不是 Siri 变聪明了,而是苹果用一纸开发者通知,开始改写 App 靠什么活下去的规则。

App Intents 强制迁移、SiriKit 废弃,翻译过来就一句话:要么把你的功能拆成 Siri 可调用的意图,要么从入口消失。曝光的分配权从应用商店的榜单,移到了助手的调度逻辑里,一个更深、更不透明的位置。一个用户面对的前台界面,就此被降格成 Agent 在后台调用的能力供应商。这是 Agent 时代对所有 App 的判决书,苹果第一个把它写成了执行细则。

App 的生死线,从「用户会不会点开你」,变成「Siri 会不会调用你」。

我在上一篇《Agent 入口保卫战》里预测——App 会从信息入口退化为行动入口的能力供应商」,苹果用产品兑现了它。但同一篇里我还有两条对苹果的预判,一条几乎逐字命中,一条错了一半,值得拿出来对个账,因为错的那一半恰恰让核心论点更硬。

第一条命中的是底层模型:「Apple 选择租用底层模型——定制大参数 Gemini,跑在自家 Private Cloud Compute 上。」几乎逐字兑现,连「定制、大参数、自家基础设施」三个限定词都对上了。

错估的是另一条:「iOS 27 将引入一套机制,允许 ClaudeGeminiChatGPT 等第三方模型成为系统级助手可切换的后端」,并由此推断 Apple 间接背书了「模型中立」。

这条错了一半。多模型确实来了——但来的位置不是 Siri,是开发者工具层。Foundation Models 框架现在可以把任务路由给端侧模型、Private Cloud Compute 或第三方服务端模型;Xcode 27 直接内置了 AnthropicGoogleOpenAI 三家的编码 Agent

Siri 这个入口本身,是苹果一家说了算。它背后那套三层调度——什么走端侧、什么进 Private Cloud Compute、什么交给云端的大模型——全由苹果自己编排,用户看到的只是一个统一的 Siri。云端那层虽然借了 Gemini 的力,但对用户而言,入口的掌控权、调度逻辑、默认大脑,都攥在苹果手里(用户仍可手动选 ChatGPT 处理特定问题,但默认后端是苹果定的)。

所以苹果的真实路线,要从主文写的「封闭中立」修正为:

工具层开放,入口层独占。

它把「模型中立」只给了写代码的人,没有给用户和入口。这个修正反而让主文的核心论点更硬:三条路里,「模型中立的入口」这个位置,Google 不做,苹果也不做。

三、连巨头都只能租地基

前文写中国厂商的处境,用了一句话:身体在中国,大脑在别处。

WWDC 之后,这句话有了一个意外的新主语:苹果——身体在库比蒂诺,最重的那层大脑却要向山景城借。全球市值最高的硬件公司、最有钱做垂直整合的公司,在前沿模型这一层选择了租。

 

值得玩味的是,这不是苹果和 Google 之间第一笔大交易,但方向反了。过去十几年,是 Google 每年付给苹果约 200 亿美元,买 Safari 上的默认搜索位——那笔钱差不多是 Google 从苹果设备搜索广告里分出的三成。那时苹果是房东:它手握十几亿台设备的用户入口,Google 为了租这个入口付天价。如今这笔模型交易,钱反过来流了:苹果每年付 Google 10 亿美元,买自己造不出的前沿模型能力。同样两家公司,十几年间从"Google 交租买苹果的入口"变成"苹果交租买 Google 的大脑"——苹果从房东变成了租客。变的不是谁强谁弱,是稀缺的东西换了:过去最稀缺的是用户入口,苹果攥着;现在最稀缺的是前沿模型,少数几家攥着。谁攥着别人离不开的那样东西,谁就收租。

 

另一个软件生态巨头的答卷更耐人寻味。微软手握 Windows,却把 Solara 建在 MDEP ——一套它从 AOSP 分叉出来的企业版系统,因为不是授权版 Android,微软甚至不能叫它 Android。理由很坦白:低功耗设备要的芯片、驱动、硬件生态现成长在 Android 上,Windows 太重;何况「从零做一个移动 OS」的学费,微软用 Windows Phone 的墓碑交过一次了。

 

一家拥有全球最大桌面 OS 的公司,宁可在对手的开放底座上盖楼,也不肯再赌一次从零做系统。这件事说明两点。一是安卓这套开源底座的引力太强——连微软都得用。二是微软虽然甩开了 Google 的应用服务(GMS),却甩不开 Google 对安卓往哪走的决定权——地基还是 Google 说了算。这第二点,正是中国需要一个中立底座的理由:底座的方向,不能攥在任何一家外国公司手里。

 

三家海外巨头都在圈自己的地,却都在对手的地基上盖楼:苹果最重的云端推理借 Google 的力,微软的底座用 Google 的开源安卓。这不是它们不想自己干,是前沿模型和移动底座这两样东西,今天就攥在少数几家手里,强如苹果、微软也绕不开——只能租。

 

这一层,没有任何后来者能靠单家自建追平,可行的路只剩共建。

────────────────────

四、Google 的答卷:本尊登基

如果说 Gemini iOS 里是个隐姓埋名的外包大脑,在 Android 上它是名正言顺登基的新国王。

入口层,Gemini 取代了 Google Assistant,成为系统级常驻助手。今年 I/O Google 给它的定位很直白:从「你问我答」的助手,变成主动跟进任务的个人 AgentPichai 给的数字是:Google 每月处理的 token 量已达 3200 万亿——一年前是 480 万亿,涨了 6 倍多。

App 层,Google Agent 修了两条路。第一条是正门:AppFunctions——App 把功能注册成系统级可调用的函数,Google 自己把它类比为「设备本地的 MCP」。第二条是后门:UI 自动化——App 不接入也没关系,Gemini 直接代替用户点屏幕,用户通过「实时画面」监看、随时接管。

两条路合起来,是比苹果更完整的收编方案:接入 AppFunctions App API 调度,不接入的被 UI 自动化穿透。对中长尾开发者,「不配合」几乎不再是一个选项;对头部 App,则是换了一张牌桌的平台博弈。目前 AppFunctions 还在实验预览,与 Gemini 的集成在小范围私测,Android 17 上会扩大到更多用户、开发者和厂商——倒计时已经按下。

控制面层,是主文讲过的老故事:AICore 锁在 OEM 无权触及的安全等级里。于是 Android 生态的演进呈现一个剪刀差——

对开发者越来越开放,对手机厂商越来越封闭。胡萝卜给写代码的人,大棒留给造手机的人。

────────────────────

五、中国的答卷(一):五座孤岛

中国市场和上面两个生态有一个根本差异:入口权还没有归属。

第一节末尾那两块被排除在外的市场,正是这一节的起点。Gemini 进不来,Siri AI 卡在审批,两个海外大脑都缺席,这块全球最大的单一手机市场,Agent 入口此刻是真空;欧盟那一边,苹果的新入口同样被挡在门外。全球前两大监管区,一个进不去、一个进不全。主文讲的「数字主权市场」不是推演,是正在发生的现实:监管强度越高的市场,越需要一个不被单一外国厂商控制的中立底座。

真空里站着五家厂商,各举各的旗:华为的 HMAF 鸿蒙智能体框架、小米的超级小爱加自研 MiMo 模型加玄戒芯片、vivo 的蓝心智能、OPPO 的小布助手、荣耀的阿尔法战略——主文第六部分把这个格局叫「协议孤岛」:每家都在自己的城里修 Agent,城与城之间没有路。

五家里答得最完整的是华为。6 12 日的 HDC,鸿蒙交出的是一份「全栈自有」的答卷:底座是 13 亿设备的鸿蒙、98% HarmonyOS 6 升级率;模型是当天宣布从 6 30 日起陆续开源的盘古 openPangu 2.0505B 92B 两个稀疏版本,激活参数压到 18B 6B),外加预告秋季上麒麟的端侧 30B;入口是升级成系统级 Agent 的小艺——鸿蒙智能体框架 2.0,复杂任务成功率超九成,能调用 2100 多项系统能力、独占 200 多项系统级用户数据,日活 1.8 亿、日均唤醒 30 亿次。华为还把交互范式从「人找应用」改写成「意图即服务」:一句「我下周跑半马,帮我排恢复训练加进日程」,小艺自己拆解、调用、落到日历——小艺被明确定位成「整个操作系统的调度中心」。

这份答卷的完整度,反而把孤岛问题摆得更清楚。底座、模型、入口、调度全栈自有,意味着这一切的闭环边界,就是华为这一家的边界:小艺独占的那 200 多项数据、那 2100 项系统能力,换台小米手机一项都带不走。

华为答得越全栈,墙就砌得越高——它证明的不是孤岛在变通,是每座孤岛都在把自己挖得更深。底座越自有,跨厂商的那道缝就越宽。

留言区追问最多的就是这里:到底怎么个不通法?不是都支持 MCP 了吗?

这个问题问到点子上——因为「不通」恰恰不是一堵墙,是四堵。而最关键的那一堵,和协议无关。

────────────────────

六、孤岛解剖:四层不通

图片关键词

 

第一层,用户的不通:五个大脑互不相认。你在华为手机上调教了一年的小艺——它记住了你的日程习惯、常用服务、说话方式——换一台小米,全部归零,从头教超级小爱。这道墙在 Agent 时代只会更高:小艺生长在系统底层、独占大量系统级用户数据,这份「懂你」被焊死在品牌里,换机等于清零重来。App 时代没有这个问题——微信装在哪台手机上都是你的微信。Agent 时代,「懂你」成了厂商的私产。

第二层,开发者的不通:协议通了,整机还是孤岛。想让你的服务被中国用户的手机 Agent 调用?华为要你上小艺智能体开放平台、用鸿蒙智能体框架开发、过审后上架鸿蒙智能体市场;小米要你上 Agent 生态平台、把服务上传给 miclaw(这个平台 2026 4 月才开公测,定向邀请制);vivo 走蓝心的意图框架加智能体平台;OPPO 和荣耀的小布、YOYO 再各走一遍。五套文档、五套审核、五个市场、五份持续维护——对比海外接入苹果一套 App Intents、接入 Google 一套 AppFunctions,这是 Android 时代「写一次、到处跑」倒退成「写五次、各跑各的」。

第三层,协议的悖论:通了,却还是不通。协议层明明已经在收敛:华为 HMAF 兼容 MCP,小米的平台直接收 MCP 服务,荣耀官宣支持 MCP A2A——头部厂商正汇向同一套全球零件标准。零件通用了,整机为什么还是孤岛?

因为 MCP 解决的是「Agent 怎么调用一个工具」,它不解决工具背后那三件事——

身份:你的服务接入小艺要用华为账号体系打通登录和会员,接入小爱要用小米账号体系再打通一遍,五家各一套、互不相认。用户在哪家被授权、授权到什么程度,账归各家自己管,没有一个跨生态认得过来的统一身份。

信任:华为凭什么信任一个为小米生态写的 Agent,放它进系统层读上下文、动用户数据?反过来也一样。每家的权限授信都是封闭的,一个 Agent A 家拿到的信任,到 B 家归零。

分成:用户通过 Agent 在你的服务里完成一笔交易,这笔钱走谁的支付、抽谁的成、数据归谁,五家各有各的规矩,且都没跟别家对齐过。

这三件事,每一件都在协议之外,每一件都没有公共答案。它们有个共同点:都不是技术问题,是「谁说了算」的问题——这类事天然不能由竞争中的某一家单方面拍板,只能由一个各方都认的公共层来裁定。

不通的不是协议,是协议管不到的事:身份、信任、分成。

USB-C 接口全球统一了,也不意味着任何设备能插进任何机房——零件标准化,和系统级互通,是两回事。

第四层,Agent 的不通:谁也不肯把大脑交出去。让 Agent 真正跨应用干活,正路是意图框架——App 把功能注册成可调用的意图。华为、vivoOPPO 都推出了各自的意图框架,小红书、同程、58 同城、支付宝出现在各家的合作名单里。但据接触过谈判的业内人士透露,接入进展并不顺利——App 大厂普遍谨慎:被 Agent 直接调用,用户就不再打开 App,流量、广告、数据积累都被截走。

这层抵触,在 Agent 时代比 App 时代重得多。App 时代,应用商店要的是上架和分成,数据还攥在 App 自己手里;Agent 时代,系统级 Agent 长在 OS 底层、贴着用户数据,一个 App 把功能注册给它,等于把「用户想干什么」这条最值钱的信息流,连同交易和数据,一起接到了终端厂的管子上。交给一个框架是让渡,交给五个各自封闭的框架、还得赌哪家终端厂将来不会变成自己的对手——接入意愿上不来,根子在这里。

于是出现绕路方案:GUI Agent——模型直接看屏幕、模拟点击,不需要 App 配合。豆包手机走的就是这条路,结果是被围堵。耐人寻味的是 OPPO 的内部判断:他们把 GUI Agent 定位成「覆盖长尾场景的兜底方案」,更倾向用 Agent to Agent 的方式实现生态互联,理由是一句很诚实的话——「手机在这方面的尝试其实牵一发而动全身,因为它本身的生态位很特殊。」

翻译一下:终端厂自己也知道,硬闯 App 的围墙会引发全面战争,坐下来谈又没有共同的桌子。四层不通,环环加固。

而四层之下,还压着一个谁都没先开口的问题:钱怎么分。App 时代的分账规则用了十五年才稳定——苹果三七开,中国安卓渠道对游戏一度按五五分。Agent 时代这套规则直接失效:过去 App 付给应用商店 30%,买的是分发和曝光;现在发现、比价、下单全由系统 Agent 在后台完成,App 连界面都没露脸,议价地位归零。系统会不会要一个比 30% 更狠的「任务佣金」?搜索时代的竞价排名会不会重演成「调用竞价」——谁出价高,谁被 Agent 优先选中?更反常识的是:用户一句「订一张最便宜的半马酒店」,背后可能调用五个 App、烧掉一大把推理 token,开放接口的 App 非但拿不到广告费,还得为别人的调用倒贴算力钱——账单最后记在自己头上。这笔账算不平,意图框架就只是空中楼阁。而它算不平的根子,和前三件事一样:钱怎么分,没有一家能替所有人拍板。

把这四层叠起来看,会发现 Agent 入口战的本质,不是「谁家助手更聪明」,是一场新分发秩序之争——每一类玩家的核心问题都被改写了。对 App 公司,过去是「怎么让用户打开我」,未来是「怎么让 Agent 调用我」;对终端厂,过去是「怎么卖更多设备」,未来是「怎么成为那个调度一切的中心」;对整个中国生态,过去是「各自怎么做强」,未来是「怎么建起一张彼此都认的公共调用网」。四层不通卡住的,正是最后这件事。

────────────────────

七、中国的答卷(二):墙内大陆

中国 Agent 战场的真实格局,从来不只是五座孤岛——岛群旁边停着一片大陆:微信。

6 2 日《金融时报》报道:腾讯正在测试微信内置 AI Agent——主界面右滑唤出,一句话就能驱动它调用小程序完成筛选、下单,内部列为最高战略优先级。The Information 给的时间表是三季度上线,可连接微信内数百万个小程序。这不是临时起意:腾讯 3 月的年报已写明要在微信生态内建设「下一代 Agentic services」。消息传出当天,腾讯股价应声大涨——市场对「微信做 Agent」的分量,投了最直接的一票。

六天之后,6 8 ——苹果发布 Siri AI 的同一天——微信开放平台官宣向小程序开发者开放微信 AI 接入。指引开头很客气:「在充分尊重开发者权益和自主选择的基础上」,往下是两种模式:自动模式,开发者授权平台读取小程序源码,无需额外开发,微信 AI 直接操作页面;开发模式(内测中),开发者把功能封装成 SKILL,由「小程序 MCP」协议供 AI 调用。但公告同时写明两件事:接入后小程序「有机会」被推荐和调用;未接入的,将无法被微信 AI 调用。美团已宣布接入。

把这份开发文档和前文对照着读,有三个发现。

第一,微信对小程序做的,正是苹果对 App 做的。同一道最后通牒,两种口音:苹果用废弃通知说「不迁移 App Intents,就从新 Siri 消失」;微信用「充分尊重开发者权益和自主选择」开头,落点是「未接入将无法被调用」。一个把话挑明,一个裹着敬语,逼到的是同一个墙角——应用退化为可调用的能力,界面退化为对话流里的一张卡片。而且接入只是门票:调用要过平台评测与审核,推荐与否是平台裁量。「Siri 会不会调用你」的微信版已经挂出来了——微信 AI 会不会调用你。

第二,微信把 Google 的两条路在墙内复刻了。开发模式是正门(标准化接口),自动模式是后门(平台读源码、AI 直接操作页面)——而且这条后门比 Google UI 自动化伸得更深:Google 只是看屏幕,微信直接读代码。正门加后门,开发者同样面对收编:中长尾几乎没有「不配合」的余地,头部则只剩「被怎样调用」的谈判空间。

第三,开发文档明文写着,小程序 MCP「与标准 MCP 不同」。MCP Skill 本是 Anthropic 立下、全球 Agent 生态正在收敛的两个标准,可微信把它们接进来后改写了语法:标准 MCP 让任意 AI 连接任意工具,小程序 MCP 只让微信 AI 连接微信生态内的工具。这不是微信第一次这么干——小程序从诞生起就走私有的一套:页面不用 HTML WXML,样式不用 CSS WXSS,没有标准 DOM,连尺寸单位都自创了一个,官方理由通常是性能与安全。

全球标准进了墙,不只变成方言——墙还会反过来定义这门语言。

把微信 Agent 放进上一节的「四层不通」框架里看,会看到一个让所有终端厂坐立不安的事实——

第六节列的那三件没有公共答案的事——身份、信任、分成——微信的围墙之内,全部已经解决了。身份是微信账号加实名体系——开发文档明文规定,AI 模式下的用户登录身份与原小程序保持一致,wx.login 直接复用;信任是支付级风控跑了十年;分成是微信支付加服务商抽成体系。再加上数百万小程序加搜一搜这个现成的分发盘子,14.32 亿月活之上,Agent 需要的全部基础设施现成摆着。

严格说,「墙内已通」的不止微信一家——支付宝同样三件俱全,阿里的千问已经在打通电商、出行与蚂蚁支付干活。但支付宝缺两样东西:社交关系链,和「一天被打开几十次」的入口频次。三件事加这两样,凑齐的只有微信。

五家终端厂还在为这三个问题各修各的答案,微信墙内的答案,十年前就在真金白银地运转了。

这就是为什么豆包们做 Agent 要「找入口」,而微信做 Agent 只需要「开闸」。也是为什么字节的豆包顶着 3.45 亿月活,仍然要去造一台手机——独立 AI App 有心智没闭环,缺的就是微信墙内那三件事。

而微信还有一件别人没有的底牌:商业闭环。抖音的电商闭环也跑通了,靠的是公域内容流加直播间的货架逻辑;微信走的是另一条——商家这几年正从拼价格、拼量的货架电商出走,涌进微信做私域,把客户沉淀在自己手里。私域里的发现、比价、下单本来就长在小程序和支付里,Agent 把它们串成一句话的事,交易里抽一道手续费,token 的账单就有人付了。这一点很关键:别家做 Agent 都在发愁推理成本谁来出,微信靠交易抽成就能覆盖——用户每下一单,抽的手续费就够付这次调用烧掉的算力。而这套抽成管道早就是成熟的现金流:微信支付的商业支付,是腾讯金融科技板块的基本盘,而这个板块 2025 年收入 2294 亿元、占腾讯总营收三成,是它仅次于游戏的第二大收入来源。做 Agent 不用新建一条变现路,现成的支付管道直接接上就行。三件事之外,它还多解决了一件最现实的:不光能把钱分清楚,还能挣钱养住这套系统。

────────────────────

八、墙内大陆的边界

但墙内大陆有两个结构性局限。

第一,它只在墙内通。微信 Agent 调度的是小程序宇宙;墙外的系统能力、硬件、其他 App 的原生功能,它够不着——除非手机厂商放行,而手机厂商攥着语音入口、系统权限和默认设置。豆包手机演示了平台封杀终端;接下来大概率上演反向剧目:终端钳制平台——系统级 Agent 和微信 Agent 抢同一个用户的同一句指令,谁先听见、谁能调谁,取决于谁攥着系统。

中国的 Agent 战争由此从「终端对平台」升级为双向钳制:你封我的手机,我掐你的入口。

第二,它出不了海。墙内大陆的全部地基——小程序密度、支付渗透、关系链——都长在中国市场里。微信 Agent 可以统一墙内体验,但它给不了中国产业一个能走向全球的 Agent 底座。

所以超级 App 面前摆着三个选项:

守墙(赌系统级 Agent 永远进不来——这堵墙挡得住一台手机,挡不住五家终端厂加一个时代);

称王(自建 OS 外之 OS,重演双向钳制的消耗战);

或者上桌——把墙内那套已经跑通的三件事答案,变成行业公共层的蓝本。

6 8 日官宣说明微信已经迈进了「称王」,但称王和上桌并不互斥——墙内称王解决不了出海、也解决不了与终端的钳制,而且称王越成功,上桌定规则的筹码越足。

对微信,上桌不是让利,是变现:三件事完整、又握着关系链和最高入口频次的,全中国就微信一家,在公共规则的制定桌上它天然坐主位。我在上一篇提出的 MALMobile Agentic Linux,移动智能体公共底座)——一个由终端厂、监管、模型方、Agent 方、App 方共建的中立联盟,正是为这张桌子设计的:App 这一方留的就是微信这个位置——

腾讯级别的玩家在不在桌上,桌子本身的合法性都不一样。

────────────────────

九、四份答卷,一张表

图片关键词 

先把表横着读「App / 服务的命运」那一行:四堵围墙的主人,在 2026 年做着同一个动作——把应用拆成 AI 可调用的原子能力,正门叫意图、叫 SKILL,后门叫自动化。对一个想全渠道存活的服务,「写一次、到处跑」的反面正在成形:App Intents 写一遍,AppFunctions 写一遍,五套终端框架各写一遍,微信 SKILL 再写一遍。

四层不通,不是哪一家的过错——它是「没有公共层」这个结构的必然产物,换任何五家公司坐进这个结构,结果都一样。而公共层并不要求谁放弃自己的助手。Linux 史给过现成答案:共内核、异发行——Red HatSUSEUbuntu 用同一个内核打了三十年商战,差异化全在发行层。小艺、超级小爱、蓝心小 V、小布、YOYO,就是 Agent 时代的五个发行版;底座统一抹平的不是差异,是五份重复造轮子的成本。这条思路,下一篇《MAL 2.0》会展开。

再读最后两列,就是中国战场的特殊性:

**海外是巨头对巨头的阵地战,中国是终端、平台、独立 AI 入口的三方混战**——苹果和 Google 面对的开发者里,没有一个握着 14 亿月活。

把表竖着读控制权那一行:苹果已收紧,Google 正在收紧,中国未归属。前两个没有悬念,第三个才有变数——而变数的窗口在走表。主文给的 36 个月,由四个外部进程的倒计时决定,其中「Apple Agent 体系全量铺开」这一格,已随 iOS 27 今秋全量、Siri AI 年内开测正式启动;Android 17 Agent 全量铺开是另一格。微信 Agent 三季度上线,则会在窗口之内把「双向钳制」从推演变成日常。

让这五家同意一个系统核心,近乎不可能。证据就在眼前——跨品牌传一个文件这种最简单的协作,非华为几家也是从 2019 年的互传联盟起步,磨了好几年才磨通;每家手里都备着自己的 OS,鸿蒙之外,小米有澎湃 OSvivo 有自研的蓝河,连海内外两轨的系统都刚并成自家一套;agents all in 的账单,各家自己都还没算清;说到底,他们的本能仍是堆料卖硬件的公司。我和几位一线决策者聊过,对「统一 Agent OS」普遍悲观,有位资深专家举了个很关键、却很小的例子:连 WebView 这种最底层的东西,几家到今天都统一不了——明明都是魔改同一个 Chromium 内核,可每家都要在上面叠自己的一套管控,连一个浏览器内核都各自要加一道自己的管控,遑论一个调度全机的 Agent 核心。

但这些悲观,针对的全是「统一一个系统核心」——MAL 要的恰恰不是这个。WebView 统一不了,是因为它动了各家系统的实现;互传联盟最终通了,是因为它不动任何一家的系统,只在上面立一层薄薄的协议。MAL 的入口走的是后一条路:不换核心、不碰各家的发行版,只在三件事的治理层上立一层公共标准。「我的地盘我做主」和「地盘之间留一条公共通道」并不矛盾。

何况还有两个五年前没有的新情况:当年 Google 还没把控制权收进 AICore,微信也还没带着现成的闭环要在三季度入场。外部压力变了,"自己单干划算还是一起共建划算"这笔账,也得重新算。

 

该从哪里下手,第六节已经标出来了。技术协议这层正在统一:华为、小米、荣耀都已经接入 MCP。标准这层也有了开头:《人工智能终端智能化分级》国家标准已经把五家拉到一起当起草单位。真正还缺的,是身份、信任、分成这三件事的公共规则。这三件事说到底是分钱分权,谁自己出来定,别家都不服——所以只有一个办法:交给一个谁都不独大的中立机构来管,谁贡献大谁的话语权就大。

 

至于这张桌子怎么搭,起点未必在最难处:不必从「数据互通」动手,最薄的第一步是先立一层谁都不独大的 Agent 能力注册与认证——不碰系统核心、不要求交出用户数据,只解决「一个外来 Agent 凭什么被信任、被调用、被分账」。身份与信任先通,分成随后,数据互不互通甚至可以永远不碰。这条路谁来牵头、各方为什么愿意上桌,是下一篇的事。

────────────────────

十、三年后,如果还是各打各的

把上面的「如果」反过来推一遍:假设这张桌子始终没搭起来,五家各守各的城、微信守住墙,三年后会怎样?这不是危言,是把今天每一条已经画好的线,顺斜率往前延一格。

先碎的是用户体验。今天换手机,丢的是相册和聊天记录,云端找得回;三年后换手机,丢的是一个懂你两年的助手——它知道你每周三接孩子、出差只住某个连锁、说「老地方」指哪家店。这些「理解」焊死在前一家的系统底层,带不走。于是用户被迫精神分裂:你的微信在每台手机上都是你的微信,你的系统助手却换一台就失忆一次,「问系统的事」和「问微信的事」得分两个脑子记。

接着碎的是开发者投入。「写一次、到处跑」在 Agent 层退回部落时代:第六节那七八套封闭接入,三年后逼出分化——大厂只接流量最大的两三家,中小开发者干脆只接微信。两头一挤,终端厂的系统 Agent 越来越空,最后沦为一个调不动外卖、打不到车、买不了票的高级闹钟。

最后碎的是「Agent OS」这个词本身。五家都说自己做的是 Agent OS、是操作系统的调度中心。但操作系统的前提是能调度一切,而这五个「OS」每个都只能调度自己围墙内的部分。当一个 OS 调不动用户每天用得最多的那批 App,它就不是 OS,是个壳。

中国可能成为全球唯一一个「人人都在做 Agent OS、却没有一个真正的 Agent OS」的市场。

────────────────────

结语

一个月,先是三张来自海外的船票:Google Android 改了名,微软把设备平台建在 AOSP 上,苹果把 Siri 的大脑租给了 Google。三家路线不同,动作相同——把自己的桌子搭起来,把 App 收编成 Agent 的技能,把入口攥进自己的 AI 层。第四张票来自国内:华为把鸿蒙推成 Agent OS,小艺坐上了操作系统的调度中心——中国厂商也开始交卷了,只是这张卷子还只答了自己那一栏。

中国的答卷,一半是孤岛,一半是围墙:五家终端厂的孤岛,缺的是三件事的公共答案;微信的围墙,圈住的恰恰是这三件事的现成答案。

把孤岛连成网,和把围墙变成桌子,是同一件事。

苹果和 Google 争的是「谁的大脑更强」。中国要解的是另一道题:缺的从来不是一个更强的大脑,而是让五个大脑和一片大陆愿意同坐一桌的那套规则。

这场战争的完整推演、中国手里的牌、以及 MAL 的具体方案,都在 6 3 日那篇《Agent 入口保卫战》里。这篇是它的续集——而结论没有变:

合纵未必赢,但连横必输。

────────────────────

下一篇是《MAL 2.0Linux Unix,赢的从来不是内核》。今天中国 Agent 入口战遇到的难题——五家凭什么共建、同质化怎么破、出海靠什么、token 账单谁来付——三十年前的 Linux 生态都遇到过。Linux 最重要的胜利不是写出了一个更强的内核,而是发明了一套让竞争者共同站在同一层底座上的产业结构:上层继续厮杀,底层共同繁荣;诸侯不必交出王冠,只需要统一货币和度量衡。中国 Agent 生态要躲开「五座孤岛各自为战」,缺的正是这样一层薄而关键的公共底座。怎么建,下篇拆开讲。

────────────────────

本文主要基于 Apple WWDC 2026Google I/O 2026、华为 HDC 2026、微信开放平台公告、腾讯财报及多家产业媒体的公开报道整理;涉及未公开商业条款与未上线产品的信息,均按报道来源标注。

参考资料与公开信息来源(按主题归并)

苹果 WWDC 20266.8):Siri AIApp Intents 强制迁移与 SiriKit 废弃、Xcode 27 内置三家编码 Agent、欧盟 DMA 与中国大陆不可用、硬件门槛、Cook 末届与 Ternus 接任——Apple 官方及 EngadgetTechCrunchCNBC 等报道;定制 Gemini 10 亿美元/年、约 1.2 万亿参数为 BloombergGurman)报道、苹果未确认商业条款;AFM 3 端侧 20B 稀疏与 Cloud Pro 跑在 Google Cloud 英伟达 GPU 上为 Apple 开发者文档及技术媒体分析。

Google I/O 2026Gemini 取代 AssistantAppFunctions(「设备本地的 MCP」、Android 17 扩大)+ UI 自动化、token 量级(Pichai——Google 官方博客、Android Developers Blog9to5Google

微软 Project Solara / MDEP6.2):建于 AOSP 分叉的企业级 OS、不能称 Android——微软官方博客 Command LineGeekWireBetaNews

华为 HDC 20266.12):小艺升级系统级 Agent、鸿蒙智能体框架 2.0、盘古 openPangu 2.0 开源、端侧 30B、独占 200+ 系统级数据等——新浪财经、TGBUS、雷科技现场报道(数据为华为官方口径);HMAF/Agent Kit HDC 2025 及技术解读。

其他终端厂:小米 Agent 生态平台(澎湃 OS 开发者公告)、荣耀支持 MCP/A2A、意图框架谈判受阻与 OPPO 表态(21 世纪经济报道、华尔街见闻)、《人工智能终端智能化分级》GB/Z 177—2026(新华网)。

微信:AI Agent 原型(《金融时报》6.2The Information、虎嗅、IT之家)、《关于开发者接入微信AI生态的指引》与《小程序 AI 开发模式(beta)接入指南》(微信开放平台公告 6.8 及开放文档)、"下一代 Agentic services"(腾讯 2025 年报)、马化腾表态(钛媒体)、合并月活 14.32 亿(腾讯 2026Q1 财报)、金融科技及企业服务 2025 年收入 2294 亿元 / 占总营收约三成(腾讯 2025 年度业绩公告 2026.3.18)。

其他:豆包月活 3.45 亿(QuestMobile);Google 改名、豆包手机被围堵等见《Agent 入口保卫战》正文及来源。

——蒋涛 · CSDN

 

参会人员:陆首群、孟伟、杨文庆、安泱、张侃、孟迎霞、袁怿、陈道新、靳虹博(线上)、韩宪平(线上)、陈伟(线上)、Anna.AI(线上)、陈越(线上)、谭中意(线上)。

图片关键词


 


首页
开源培训
开源新闻