COPU会议纪要丨2026.06.02

2026-06-02 15:59:55 74

6月2日，陆主席主持召开COPU例会。

本次会议宣读了开源高峰论坛的新闻简报和会议议程。

2026《第21届开源中国开源世界高峰论坛》

（国际会议+圆桌会议）将于6月25—26日在北京召开

本届峰会的主题是：

开源创新，推动数字化转型与智能化重构；
发展基于开源的深度信息技术，包括容器通信、云原生、区块链、Kubernetes等；
发展基于开源的人工智能。中国的开源战略：正在探索发展一条低成本、低投入、高效率、高性价比的AI发展新路径；可能不同于西方坚持的闭源策略：以堆砌方式投入巨大资源、电力和资本建设AI的发展道路；

本届峰会将深入讨论基于开源的AI大模型如何落地问题。

在本届峰会上还将探索如何从目前的生成式、自回归语言大模型向真正的AI（AGI）转轨和安全问题。

本届峰会将继承、发扬我们历届峰会传统，邀请国际国内开源、深度信息技术和人工智能的资深专家和青年才俊开会交流。

本届峰会由中国开源软件推进联盟名誉主席、获国际开源领袖称号的陆首群教授发起，由COPU主办。

（本届峰会在中关村展示中心举行）

本届会议初步议程

1. 陆主席致辞

2. Linux基金会执行董事Jim Zemlin报告

3. 国际智能体人工智能基金会（AAIF）AI资深专家报告

4-7.开放原子开源基金会、智源研究院、CSDN、开源中国代表作报告

8.DeepSeek梁文锋报告

9. kimi杨植麟报告

10.宇树科技王兴兴报告

11-20.华为、中兴、阿里千问、阿里平头哥、小米、智谱、京东方、腾讯、麒麟、阶跃星辰等作报告

21.其他

本次会议由COPU评论DeepSeek v4可能改变全球AI发展格局，陆主席谈小米MiMo V2.5大模型降本向DeepSeek v4提出挑战（不同降本措施相同降本效果）。

四评DeepSeek

（DeepSeek v4 可能改变全球AI发展格局

小米MiMo大模型降本向DeepSeek降本提出挑战）

陆首群丨2026.05.07

（2026.05.25 补充修改）

在 DeepSeek v4 公布前，我们于4月21日提前发表了《评 DeepSeek v4》的文章。4月24日，DeepSeek 发布了《DeepSeek v4 预览版》，4月29日，发布了《DeepSeek v4 发行版》。如果将我们的《评论》与 v4《预览版》和 v4《发行版》对照来看，我们的《评论》还是相当精准的，其中一位 DeepSeek 的 AI 专家认为：这篇评论具有前瞻性。

我们在《评论》中指出：DeepSeek v4 最大的优势在于高性价比，最大的贡献便是实现算力国产化。

随着 AI 大模型不断扩大规模或向万亿级 tokens 超大模型发展，美西方采取资源（Tokens）、能源、资金以堆砌的方式建设 AI 大模型，造成资源供给、能源消耗、资金投入的巨大增长，影响到 AI 大模型发展步履维艰或难以为继的地步。我在“一、二、三评DeepSeek”时就指出：中国 DeepSeek 走出了一条低成本、有限资源、高效率、高性价比发展AI 大模型的新路径，今天的DeepSeek v4更是如此，把训练成本降到极致，对照美西方建设 AI 大模型昂贵的价格变成了“白菜价”，势将改变全球 AI 的发展格局，再次引起美西方的关切，5月1日美国官方对 DeepSeek v4 进行评估：① DeepSeek v4 是美国迄今为止评估过最强大的中国 AI 模型，② 它实际性能与美国目前发布的 GPT-5 类似（技术差距不超过 8个月），③ DeepSeek v4 比最低价的 GPT-5 还便宜；美国顶级 AI 企业之一的 Meta 表态：Meta 将以 DeepSeek 的研究方向为榜样；《纽约时报》认为：DeepSeek v4 的开源策略极大地激发全球开发者的创新活动；COPU 评论：这将推动 AI 进入普惠、自主、可控的新阶段。

DeepSeek v4 将推动降本或提高性价比做到极致！

DeepSeek v4 降价的核心是：技术升级 + 国产算力 + 开源战略 + 市场扩张四大因素。

一）技术升级

*DeepSeek v4 采用其首创的多头注意力架构 MLA，

*在采用混合专家模型MoE及其演进时，不断改进其稀疏化机制，

*随后采用混合路由和支持百万 tokens 超长上下文时，继续降本（算力消耗仅为上一代的27%，KV Cache占有降至10%）。

*成本下降来自模型架构革命。

以编程为例：

DeepSeek v4 在最近的编程测试中 (SWE bench Verified)：其性能虽然未能登顶，但也跻身于排行榜前列，这时 Claude Opus 4.6/4.7 编程登顶得分为 1503，DeepSeek v4 pro 得分为 1463，约为Claude 1503分的97.3%，其性能绝对分差40分，相对分差2.7%，与claude 的性能是很近的，已进入编程性能第一梯队。

但v4降本约为claude opus4.6的1/20。

这样，将美西方高昂的AI大模型价格打成了“白菜价”。市场反应印证了这一判断：V4发布后周调用量达3.43万亿tokens，登顶全球调用榜。海外社区也由此形成共识：“Codex、Claude定上限，Deepseek定斩杀线（跟它持平没溢价，落后它就出局）”。

下面讨论 DeepSeek v4 混合路由实现情况：

这时我们将 DeepSeek v4 分成两部分，即v4 Flash (高性价比) 和v4 pro (高性能)。v4 Flash 适用于成本极低、简单任务的场合；v4 pro 适用于复杂推理能力强的场合，适用于多步 Agent 任务，优势明显。

核心目标：90% 以上常规状态取 v4 Flash，仅在必要时升级取 v4 pro。

关键数据备查：

指标	v4 Flash	v4 pro
输入价格 (标准)	0.14 美分 / M token	1.74 美分 / M token
输出价格 (标准)	0.28 美分 / M token	3.48 美分 / M token
总参数	284B	1.6T
激活参数	13B	49B

关于 v4 pro 成本计算 (并与 GPT-5.5 进行降本对比)：

v4 pro (缓存命中场景)，输入价格 0.025 元 / 百万 tokens 超长上下文。
GPT-5.5 输入价格 30 美元 (约 216 元人民币)。
v4 pro (缓存命中) 降价 216 / 0.025 = 近 9000 倍，这个 0.025 元是 v4 pro 在限时2.5折叠加缓存命中后的价格（而常规缓存命中价格为1元/百万token）。
v4 pro (缓存未命中场合)，输入价格 12 元 / 百万 tokens (超长上下文)。
GPT-5.5 输入价格 30 美元 (约 236 元人民币)。
v4 pro (缓存未命中) 降价 12/ 236 = 1 / 18`(约 5.6%)。
如此：MoE 及其稀疏演进降价 + 混合路由降价（与GPT5.5对比）：1/60 x 1/18 = 约1/100。

我们再来讨论v4 Flash VS GPT-5.5 的降价情况：

v4 Flash 输入价格 (标准) = 1 元 / 百万 token；
而 GPT-5.5 输入价格为 30 美元 (折合 216 元人民币) / 百万 tokens，降价超 200 倍。
下面我们再来讨论v4pro输出价格：
v4 pro 输出：24 元 / 百万 tokens；
GPT-5.5 pro 输出：180 美元 (折合 1296 元人民币) / 百万 tokens。
v4 pro 输出降价约为 GPT-5.5 pro 的 1/54。

在百万 Token(M) 极端测试场景中，v4 将单 Token 计算量压低降价到其上一代 (v3.2) 的 27%，显存占用骤减至 90%。

V4 抢滩 Agent 与上下文市场，V4 Pro 在 Agent Coding 评测中获开源榜单第一。在 Human Eval 评分时突破 90%，在SWE bench Verified 测试中达80.6%

二）算力国产化

DeepSeek v4 适配华为昇腾 950 PR 算力卡运行，摆脱英伟达/H200 算力卡高价垄断，使算力全栈从英伟达的CUDA迁移到华为的 CANN上来，立足于华为昇腾 950 PR 和超节点 Atlas 950 Super PoD 集群系统，实现成本腰斩。昇腾 950 单卡7万元是英伟达H200 售价的1/3，单位 token 的算子与电费双下降，推进成本下降 40%，能耗下降 60% 。智源研究院推出FlagOS 的研发成果，使国产算力都能兼容，并都能与 DeepSeek v4 适配，可进一步下降了国产算力成本。

三）开源战略

DeepSeek v4 采用 MIT 开源许可证，实行开源零授权费，打破海外“授权费 + Token费”模式，本地部署还实行零费用和无限使用。缓存命中打 1 折，限制 2.5 折。实行开源：做到开源创新、改进维稳、扩大生态，推动数字化转型、智能化重构，走出一条普惠、便民降价 (或零价) 之路。

四）DeepSeek-V4 降本遇到小米MiMo挑战

小米也可达到DeepSeek V4 同等的降本效果，但它选择降本的措施不同于 V4。在 V4 应对小米挑战时，形成殊途同归的降本逻辑。

小米MiMo大模型与 DeepSeek V4降本对比分析：

维度			小米MiMo-V2.5	DeepSeek V4
宣布时间			2026年5月27日	2026年5月22日
最高降幅			99%	75%
是否永久			是	是
降本价格	输入	缓存命中	0.025元/百万tokens（pro） 0.02元/百万tokens（标准）	0.025元/百万tokens（pro） 0.02元/百万tokens（标准）
		缓存未命中	3.0元/百万tokens（pro） 1.0元/百万tokens（标准）	3.0元/百万tokens（pro） 1.0元/百万tokens（标准）
	输出		6.0元/百万tokens（pro） 2.0元/百万tokens（标准）	6.0元/百万tokens（pro） 2.0元/百万tokens（标准）
核心技术			推理系统工程化：基于SGLang HiCache 架构+滑动窗口注意力机制 SWA，将 KV缓存多级存储间的数据搬运量降至 1/7，可缓存 token 数量提升5倍，成本降至自缓存工程	底层架构创新：多头注意力架构+不断改进稀疏化机制的混合专家模型MoE 及其演进，v4 系列百万级token 长上下文时算力消耗仅为上一代的27%，KV Cache 占用降至 10%，成本下降来自模型架构革命
硬件成本			未明确强调硬件的自主性，依托小米的规模采购。

DeepSeek v4 与小米 MiMo v2.5 降本共同点：尽管两者降本路径不同，但两者共享几个核心逻辑：① 由底层技术推动降本而非烧钱补贴，② 生态卡位优先于短期盈利，③ 都认为大模型 API从“能力溢价”进入“成本约束”阶段，先占市场者赢，④ 国产自主可控。

五）关于 DeepSeek v4 尚存的短板

DeepSeek 在发展中取得了重大成果的同时，在克服其短板的进程中，迄今尚有待处理好其发展中的局限性问题：

关于DeepSeek v4 尚存的短板（正在改进中）：

① 多模态问题：v4主要采用纯文本模型，视觉版本或多模态版本尚在开发中。

② 复杂前端生成：与 Claude 仍有差距

③ 推理吞吐：pro版受高端算力限制（官方承认，下半年昇腾 950 上市后改善）

④ 第三方验证：目前基准测试多为自报，独立榜单尚未全面覆盖。

本次会议由蚂蚁开源技术委员会副主席王旭介绍了开源AI智能体（Agent）领域的趋势。

王旭谈到从去年末到今年初，在 Coding Model 的推动下，让社区确信确信 Agentic 就是答案。

然而数据也揭示了更深层变化：软件的生产模式本身正在被重写。Agent 不再只是聊天框里的对话者，而是开始成为软件的新用户——读文件、调 API、发 PR、做审查，进入真实工作流。报告以 GitHub 和 Hugging Face 数据为锚点，勾勒出 Agentic AI 的三层架构（Agent Infra、Model Infra、Model），指出生态重心正从"如何构建 LLM 应用"转向"Agent 如何进入任务执行"，而 token 也从聊天消耗变成生产资料。在此过程中，开发者并未被替代，而是从执行层移动到定义层——碳基定义目标、设计约束、验证结果，硅基负责执行。最终，报告落脚于 Inclusive AGI 的愿景：智能不应是少数人的特权，它应当是 Available（可获取）、Affordable（可负担）、Inclusive（包容）的公共技术，而开源在这一进程中扮演着不可替代的角色。

最后，他谈到：开源不会自动胜利，但开源仍然有不可替代的位置。

本次会议OpenChain执行总监Mary Wang参与例会，并与会分享了OpenChain的愿景与现状。陆主席也指出，双方可以加强合作。