COPU会议纪要丨2026.06.23

6月23日,陆主席主持召开COPU例会。
2026《第21届开源中国开源世界高峰论坛》将于6月25-26日在北京中关村展示中心召开!
会议首先发表了陆主席谈本届峰会的主题:
一、开源创新,推动数字化转型与智能化重构
开源运动经过半个世纪浩浩荡荡的发展,已经成为推动全球科技创新的重要力量。
开源已成为当代信息技术(包括人工智能)发展中非常重要的创新与协同方式,以及普惠推广方式,成为深度信息技术和人工智能技术和产业发展的基础和推动力。
世界舆论认为,在人工智能时代,中国倡导并实行的开源战略比西方采用的闭源策略更富远见。
中国开源软件推进联盟(COPU)自2004年成立以来,以开源布道为己任,积极推动本国开源的发展,并大力开展开源的国际合作,20年前邀请全球开源领袖和资深专家60位,组成COPU智囊团的高级顾问,建立全球的开源创新和咨询平台,对我国和全球的开源运动作出了卓越的贡献,中国开源也已跻身于全球开源发展的第一梯队。
在本主题中,深入探讨发展基于开源的深度信息技术(包括容器通信、云原生、区块链、Kubernetes的开发和应用),深入探讨基于开源的人工智能:践行中国倡导的开源战略,探讨AI大模型落地与在国内的模型集群如何关联与布局问题。
二、发展开源、降本、高性价比的AI大模型
探索一条如DeepSeek开发并提出的“低成本、低投资、高效率、高性价比”发展AI的新路径,即探索出一条“开源、降本(到极致,变成白菜价)、算力国产化、高性价比”发展A1新路径。
有人问我,目前中美发展AI大模型谁领先?
美西方认为,美国领先。最近在全球编程能力性能夺冠竞赛中,OpenAI的GPT5.5,Anthropic的ClaudeOpus4.8/4.7,正在轮流夺取王冠(此时中国大批编程模型也上来了,进入编程发展前列,但仍未登顶)。
我认为,要谈论目前中美大模型谁领先问题,必须从AI大模型三个维度来考察:
①从大模型性能维度上看,美国领先,
②从大模型降本维度上看,中国大大领先,
③从大模型调用维度上看,中国领先。
本届峰会将讨论这批主题,结合大模型发展到超大规模或万亿级规模时,美西方如沿用将资源、电力、投资以堆叠方式供给,将导致发展难以为继。这时AI大模型的发展方式将引起广泛争议。
小米MiMOv2.5大模型采用自研(不同于DeepSeek v4)的核心技术,但做到与v4同样的降本到极致水平,这一方面让我们看到国内双雄比翼双飞,另一方面也表示DeepSeek一年多前首创发展AI大模型新路径中的核心技术可被取代,此时美西方也已觉察到中国AI大模型的强势(OpenAI CEO萨姆·奥特曼坦言“成本突然成为AI发展中的一个大问题”),将激发他们展开白热化的竞争。
美国政府作出干预:要求ClaudeFable5和MyThos5突然全球停服,并禁止外籍人员访问。
Anthropic 推出的这两款新品,被业内吹成新一代最强的AI,综合能力甩开同行新品一大截。
最近智谱开发的GML5.2(官方称这是迄今最强的开源模型),面向GLM Coding Plan全量用户正式开放,以取代Claude系列。智谱GML5.2与Anthropic这两款新品相比,在性能上接近,但还存在差距,Fable5技术再先进,非美国公民说不能用就不能用,这为开源的GML5.2取代创造条件。
今后这类争议将成为常态。
三、生成式自回归语言大模型→世界模型→通用人工智能AGl转轨发展。
目前生成式自回归语言大模型(主要开展预训练的Chatbot业务)向世界模型(接触物理世界,过渡)而后直指通用人工智能AGl(全面人工智能)转轨发展。在转轨之初,全面转向后训练主导、自主性强的智能体(AI Agent),成为一个可调用、可编程、可规划、可落地的,具有组织执行能力,能够完成复杂任务的系统。
在本届峰会上,讨论的智能体(AI Agent)的有国际智能体人工智能智能基金会(AAIF)、华为、小米、中兴、COPU以及幕后Deepseek、Kimi、Qwen、GML、MiniMax等,智能体(AI Agent)成为本届峰会的热点,也代表了会上AI 的高水平。
会议发表袁怿的《Harness:面向自主 Agent 系统核心边界之内,方有自主》报告。

为什么需要 Harness Agent
Agent 位于智能交付的最后一公里,从简单的 Chatbot 演进而来,真正面向 AGI/奇点/RSI 的未来。
Harness Agent 的本质:运行时治理
Harness Agent 将每个上下文数组视作一个 Agent,其规模化瓶颈不在于模型“智商”,而在于运行时治理。
治理的本质是对 工作记忆(上下文)的管理。
工程使命从“教 Agent 做什么”转向“为 Agent 划定边界”,让模型在约束内找到最优解。
核心方法是通过 信息减熵 提升准确性与有效性,手段包括:
约束前置
:在 Prompt 中预置能做什么、不能做什么;
评价冻结
:冻结评估函数,防止漂移对齐与奖励黑客;
工作留痕
:状态可查询、错误可见,适配长时间自主运行。
Harness Agent 的三层架构
环境交互层
以 OpenClaw 为例,通过 Gateway 设计实现高吞吐、权限控制、内容分发。Agent 通过 Function Call / Tool Call 影响环境,须与上下文管理层在 Prompt 和 Tool 上紧密联动。
上下文管理层
通过“检查点环绕”方式管理上下文数组。检查点激活时可执行:追加、回退、新对话、压缩、子代理。
记忆与 Query Loop 层
记忆管理
(如 Mem0):将每次对话/执行记录压缩成记忆,用简单数据结构存储。记忆影响范围取决于业务场景,可能从工作记忆升级为全局记忆。通过 Hook 生成和使用记忆,也可委托给一个记忆 Agent,但需注意级联触发导致的状态爆炸。
Query Loop
:模型返回无 Function Call 时退出;有则沙箱执行,与环境交互后更新查询。支持多模型,基于成本由本地模型处理简单问题,远端 API 处理复杂问题。上下文长度以最短窗口模型为上限(木桶原则)。
面向奇点:Agent 的自我进化
最后提出了四种面向奇点的演进场景:
Vibe Coding 开发智能体本身
(如 OpenClaw 社区实践);
从本地 Memory 提炼新 Skill
,扩充 Agent 能力;
生成“端侧模型”
,实现 Function Call / MCP 渐进式加载,甚至提取参数形成“VLA 小脑”,将常用活动从远端大模型过滤掉;
本地算子开发与验证
(如 Auto Research),若新算子能优化端侧模型,则纳入有效改进,形成自主进化闭环。
大会议程全天
