COPU会议纪要丨2026.06.02

6月2日,陆主席主持召开COPU例会。
本次会议宣读了开源高峰论坛的新闻简报和会议议程。
2026《第21届开源中国开源世界高峰论坛》
(国际会议+圆桌会议)将于6月25—26日在北京召开
本届峰会的主题是:
开源创新,推动数字化转型与智能化重构;
发展基于开源的深度信息技术,包括容器通信、云原生、区块链、Kubernetes等;
发展基于开源的人工智能。中国的开源战略:正在探索发展一条低成本、低投入、高效率、高性价比的AI发展新路径;可能不同于西方坚持的闭源策略:以堆砌方式投入巨大资源、电力和资本建设AI的发展道路;
本届峰会将深入讨论基于开源的AI大模型如何落地问题。
在本届峰会上还将探索如何从目前的生成式、自回归语言大模型向真正的AI(AGI)转轨和安全问题。
本届峰会将继承、发扬我们历届峰会传统,邀请国际国内开源、深度信息技术和人工智能的资深专家和青年才俊开会交流。
本届峰会由中国开源软件推进联盟名誉主席、获国际开源领袖称号的陆首群教授发起,由COPU主办。
(本届峰会在中关村展示中心举行)
本届会议初步议程
1. 陆主席致辞
2. Linux基金会执行董事Jim Zemlin报告
3. 国际智能体人工智能基金会(AAIF)AI资深专家报告
4-7.开放原子开源基金会、智源研究院、CSDN、开源中国代表作报告
8.DeepSeek梁文锋报告
9. kimi杨植麟报告
10.宇树科技王兴兴报告
11-20.华为、中兴、阿里千问、阿里平头哥、小米、智谱、京东方、腾讯、麒麟、阶跃星辰等作报告
21.其他
本次会议由COPU评论DeepSeek v4可能改变全球AI发展格局,陆主席谈小米MiMo V2.5大模型降本向DeepSeek v4提出挑战(不同降本措施相同降本效果)。
四评DeepSeek
(DeepSeek v4 可能改变全球AI发展格局
小米MiMo大模型降本向DeepSeek降本提出挑战)
陆首群丨2026.05.07
(2026.05.25 补充修改)
在 DeepSeek v4 公布前,我们于4月21日提前发表了《评 DeepSeek v4》的文章。4月24日,DeepSeek 发布了《DeepSeek v4 预览版》,4月29日,发布了《DeepSeek v4 发行版》。如果将我们的《评论》与 v4《预览版》和 v4《发行版》对照来看,我们的《评论》还是相当精准的,其中一位 DeepSeek 的 AI 专家认为:这篇评论具有前瞻性。
我们在《评论》中指出:DeepSeek v4 最大的优势在于高性价比,最大的贡献便是实现算力国产化。
随着 AI 大模型不断扩大规模或向万亿级 tokens 超大模型发展,美西方采取资源(Tokens)、能源、资金以堆砌的方式建设 AI 大模型,造成资源供给、能源消耗、资金投入的巨大增长,影响到 AI 大模型发展步履维艰或难以为继的地步。我在“一、二、三评DeepSeek”时就指出:中国 DeepSeek 走出了一条低成本、有限资源、高效率、高性价比发展AI 大模型的新路径,今天的DeepSeek v4更是如此,把训练成本降到极致,对照美西方建设 AI 大模型昂贵的价格变成了“白菜价”,势将改变全球 AI 的发展格局,再次引起美西方的关切,5月1日美国官方对 DeepSeek v4 进行评估:① DeepSeek v4 是美国迄今为止评估过最强大的中国 AI 模型,② 它实际性能与美国目前发布的 GPT-5 类似(技术差距不超过 8个月),③ DeepSeek v4 比最低价的 GPT-5 还便宜;美国顶级 AI 企业之一的 Meta 表态:Meta 将以 DeepSeek 的研究方向为榜样;《纽约时报》认为:DeepSeek v4 的开源策略极大地激发全球开发者的创新活动;COPU 评论:这将推动 AI 进入普惠、自主、可控的新阶段。
DeepSeek v4 将推动降本或提高性价比做到极致!
DeepSeek v4 降价的核心是:技术升级 + 国产算力 + 开源战略 + 市场扩张四大因素。
一)技术升级
*DeepSeek v4 采用其首创的多头注意力架构 MLA,
*在采用混合专家模型MoE及其演进时,不断改进其稀疏化机制,
*随后采用混合路由和支持百万 tokens 超长上下文时,继续降本(算力消耗仅为上一代的27%,KV Cache占有降至10%)。
*成本下降来自模型架构革命。
以编程为例:
DeepSeek v4 在最近的编程测试中 (SWE bench Verified):其性能虽然未能登顶,但也跻身于排行榜前列,这时 Claude Opus 4.6/4.7 编程登顶得分为 1503,DeepSeek v4 pro 得分为 1463,约为Claude 1503分的97.3%,其性能绝对分差40分,相对分差2.7%,与claude 的性能是很近的,已进入编程性能第一梯队。
但v4降本约为claude opus4.6的1/20。
这样,将美西方高昂的AI大模型价格打成了“白菜价”。市场反应印证了这一判断:V4发布后周调用量达3.43万亿tokens,登顶全球调用榜。海外社区也由此形成共识:“Codex、Claude定上限,Deepseek定斩杀线(跟它持平没溢价,落后它就出局)”。
下面讨论 DeepSeek v4 混合路由实现情况:
这时我们将 DeepSeek v4 分成两部分,即v4 Flash (高性价比) 和v4 pro (高性能)。v4 Flash 适用于成本极低、简单任务的场合;v4 pro 适用于复杂推理能力强的场合,适用于多步 Agent 任务,优势明显。
核心目标:90% 以上常规状态取 v4 Flash,仅在必要时升级取 v4 pro。
关键数据备查:
指标 | v4 Flash | v4 pro |
输入价格 (标准) | 0.14 美分 / M token | 1.74 美分 / M token |
输出价格 (标准) | 0.28 美分 / M token | 3.48 美分 / M token |
总参数 | 284B | 1.6T |
激活参数 | 13B | 49B |
关于 v4 pro 成本计算 (并与 GPT-5.5 进行降本对比):
v4 pro (缓存命中场景),输入价格 0.025 元 / 百万 tokens 超长上下文。
GPT-5.5 输入价格 30 美元 (约 216 元人民币)。
v4 pro (缓存命中) 降价 216 / 0.025 = 近 9000 倍,这个 0.025 元是 v4 pro 在限时2.5折叠加缓存命中后的价格(而常规缓存命中价格为1元/百万token)。
v4 pro (缓存未命中场合),输入价格 12 元 / 百万 tokens (超长上下文)。
GPT-5.5 输入价格 30 美元 (约 236 元人民币)。
v4 pro (缓存未命中) 降价 12/ 236 = 1 / 18`(约 5.6%)。
如此:MoE 及其稀疏演进降价 + 混合路由降价(与GPT5.5对比):1/60 x 1/18 = 约1/100。
我们再来讨论v4 Flash VS GPT-5.5 的降价情况:
v4 Flash 输入价格 (标准) = 1 元 / 百万 token;
而 GPT-5.5 输入价格为 30 美元 (折合 216 元人民币) / 百万 tokens,降价超 200 倍。
下面我们再来讨论v4pro输出价格:
v4 pro 输出:24 元 / 百万 tokens;
GPT-5.5 pro 输出:180 美元 (折合 1296 元人民币) / 百万 tokens。
v4 pro 输出降价约为 GPT-5.5 pro 的 1/54。
在百万 Token(M) 极端测试场景中,v4 将单 Token 计算量压低降价到其上一代 (v3.2) 的 27%,显存占用骤减至 90%。
V4 抢滩 Agent 与上下文市场,V4 Pro 在 Agent Coding 评测中获开源榜单第一。在 Human Eval 评分时突破 90%,在SWE bench Verified 测试中达80.6%
二)算力国产化
DeepSeek v4 适配华为昇腾 950 PR 算力卡运行,摆脱英伟达/H200 算力卡高价垄断,使算力全栈从英伟达的CUDA迁移到华为的 CANN上来,立足于华为昇腾 950 PR 和超节点 Atlas 950 Super PoD 集群系统,实现成本腰斩。昇腾 950 单卡7万元是英伟达H200 售价的1/3,单位 token 的算子与电费双下降,推进成本下降 40%,能耗下降 60% 。智源研究院推出FlagOS 的研发成果,使国产算力都能兼容,并都能与 DeepSeek v4 适配,可进一步下降了国产算力成本。
三)开源战略
DeepSeek v4 采用 MIT 开源许可证,实行开源零授权费,打破海外“授权费 + Token费”模式,本地部署还实行零费用和无限使用。缓存命中打 1 折,限制 2.5 折。实行开源:做到开源创新、改进维稳、扩大生态,推动数字化转型、智能化重构,走出一条普惠、便民降价 (或零价) 之路。
四)DeepSeek-V4 降本遇到小米MiMo挑战
小米也可达到DeepSeek V4 同等的降本效果,但它选择降本的措施不同于 V4。在 V4 应对小米挑战时,形成殊途同归的降本逻辑。
小米MiMo大模型 与 DeepSeek V4降本对比分析:
维度 | 小米MiMo-V2.5 | DeepSeek V4 | ||
宣布时间 | 2026年5月27日 | 2026年5月22日 | ||
最高降幅 | 99% | 75% | ||
是否永久 | 是 | 是 | ||
降 本 价 格 | 输 入 | 缓存 命中 | 0.025元/百万tokens(pro) 0.02元/百万tokens(标准) | 0.025元/百万tokens(pro) 0.02元/百万tokens(标准) |
缓存 未命中 | 3.0元/百万tokens(pro) 1.0元/百万tokens(标准) | 3.0元/百万tokens(pro) 1.0元/百万tokens(标准) | ||
输出 | 6.0元/百万tokens(pro) 2.0元/百万tokens(标准) | 6.0元/百万tokens(pro) 2.0元/百万tokens(标准) | ||
核心技术 | 推理系统工程化: 基于SGLang HiCache 架构+滑动窗口注意力机制 SWA,将 KV缓存多级存储间的数据搬运量降至 1/7,可缓存 token 数量提升5倍,成本降至自缓存工程 | 底层架构创新: 多头注意力架构+不断改进稀疏化机制的混合专家模型MoE 及其演进,v4 系列百万级token 长上下文时算力消耗仅为上一代的27%,KV Cache 占用降至 10%,成本下降来自模型架构革命 | ||
硬件成本
| 未明确强调硬件的自主性,依托小米的规模采购。 | |||
DeepSeek v4 与 小米 MiMo v2.5 降本共同点:尽管两者降本路径不同,但两者共享几个核心逻辑:① 由底层技术推动降本而非烧钱补贴,② 生态卡位优先于短期盈利,③ 都认为大模型 API从“能力溢价”进入“成本约束”阶段,先占市场者赢,④ 国产自主可控。
五)关于 DeepSeek v4 尚存的短板
DeepSeek 在发展中取得了重大成果的同时,在克服其短板的进程中,迄今尚有待处理好其发展中的局限性问题:
关于DeepSeek v4 尚存的短板(正在改进中):
① 多模态问题:v4主要采用纯文本模型,视觉版本或多模态版本尚在开发中。
② 复杂前端生成:与 Claude 仍有差距
③ 推理吞吐:pro版受高端算力限制(官方承认,下半年昇腾 950 上市后改善)
④ 第三方验证:目前基准测试多为自报,独立榜单尚未全面覆盖。
本次会议由蚂蚁开源技术委员会副主席王旭介绍了开源AI智能体(Agent)领域的趋势。


然而数据也揭示了更深层变化:软件的生产模式本身正在被重写。Agent 不再只是聊天框里的对话者,而是开始成为软件的新用户——读文件、调 API、发 PR、做审查,进入真实工作流。报告以 GitHub 和 Hugging Face 数据为锚点,勾勒出 Agentic AI 的三层架构(Agent Infra、Model Infra、Model),指出生态重心正从"如何构建 LLM 应用"转向"Agent 如何进入任务执行",而 token 也从聊天消耗变成生产资料。在此过程中,开发者并未被替代,而是从执行层移动到定义层——碳基定义目标、设计约束、验证结果,硅基负责执行。最终,报告落脚于 Inclusive AGI 的愿景:智能不应是少数人的特权,它应当是 Available(可获取)、Affordable(可负担)、Inclusive(包容)的公共技术,而开源在这一进程中扮演着不可替代的角色。
最后,他谈到:开源不会自动胜利,但开源仍然有不可替代的位置。
本次会议OpenChain执行总监Mary Wang参与例会,并与会分享了OpenChain的愿景与现状。陆主席也指出,双方可以加强合作。


本次会议继续讨论如何做好《21届开源中国开源世界高峰论坛》筹备工作。

识别二维码报名参会
参会人员:陆首群、章文嵩、Mary Wang、王旭、安泱、袁怿、谭中意、宋可为、王珊、孟迎霞、鞠东颖、唐小引、张侃、刘澎(线上)、靳虹博(线上)、胡宇(线上)、韩宪平(线上)、陈伟(线上)、陈越(线上)、Anna.AI(线上)。
