COPU会议纪要丨2026.06.02

2026-06-02 15:59:55 45
0602-1.png

62日,陆主席主持召开COPU例会。

本次会议宣读了开源高峰论坛的新闻简报和会议议程。

2026《第21届开源中国开源世界高峰论坛》

(国际会议+圆桌会议)将于6月2526日在北京召开

本届峰会的主题是:

  • 开源创新,推动数字化转型与智能化重构;

  • 发展基于开源的深度信息技术,包括容器通信、云原生、区块链、Kubernetes等;

  • 发展基于开源的人工智能中国的开源战略:正在探索发展一条低成本、低投入、高效率、高性价比的AI发展路径可能不同于西方坚持的闭源策略以堆砌方式投入巨大资源、电力和资本建设AI的发展道路

本届峰会将深入讨论基于开源的AI大模型如何落地问题。

在本届峰会上还将探索如何从目前的生成式、自回归语言大模型向真正的AIAGI)转轨和安全问题。

本届峰会将继承、发扬我们历届峰会传统,邀请国际国内开源、深度信息技术和人工智能的资深专家和青年才俊开会交流。

本届峰会由中国开源软件推进联盟名誉主席、获国际开源领袖称号的陆首群教授发起,由COPU主办。

(本届峰会在中关村展示中心举行)


本届会议初步议程

1. 陆主席致辞

2. Linux基金会执行董事Jim Zemlin报告

3. 国际智能体人工智能基金会(AAIFAI资深专家报告

4-7.开放原子开源基金会、智源研究院、CSDN、开源中国代表作报告

8.DeepSeek梁文锋报告

9. kimi杨植麟报告

10.宇树科技王兴兴报告

11-20.华为、中兴、阿里千问、阿里平头哥、小米、智谱、京东方、腾讯、麒麟、阶跃星辰等作报告

21.其他


本次会议由COPU评论DeepSeek v4可能改变全球AI发展格局,陆主席小米MiMo V2.5模型降本向DeepSeek v4提出挑战(不同降本措施相同降本效果)。

四评DeepSeek

DeepSeek v4 可能改变全球AI发展格局

小米MiMo大模型降本向DeepSeek降本提出挑战)

陆首群丨2026.05.07

2026.05.25 补充修改)

DeepSeek v4 公布前,我们于421日提前发表了《评 DeepSeek v4》的文章。424日,DeepSeek 发布了《DeepSeek v4 预览版》429日,发布了《DeepSeek v4 发行版》。如果将我们的《评论》与 v4《预览版》和 v4发行版》对照来看,我们的《评论》还是相当精准的,其中一位 DeepSeek AI 专家认为:这篇评论具有前瞻性。

我们在《评论》中指出:DeepSeek v4 最大的优势在于高性价比,最大的贡献便是实现算力国产化。

随着 AI 大模型不断扩大规模或向万亿级 tokens 超大模型发展,美西方采取资源Tokens、能源、资金以堆砌的方式建设 AI 大模型,造成资源供给、能源消耗、资金投入的巨大增长,影响 AI 大模型发展步履维艰难以为继的地步我在“一、二、三评DeepSeek”时就指出:中国 DeepSeek 走出一条低成本、有限资源、高效率、高性价比发展AI 大模型的路径,今天的DeepSeek v4更是如此,把训练成本降到极致,对照美西方建设 AI 大模型昂贵的价格变成了白菜价,势改变全球 AI 的发展格局,再次引起美西方的关切51日美国官方对 DeepSeek v4 进行评估:DeepSeek v4 是美国迄今为止评估最强大的中国 AI 模型它实际性能与美国目前发布的 GPT-5 类似(技术差距不超过 8个月),DeepSeek v4 低价的 GPT-5 还便宜美国顶级 AI 企业之一的 Meta 表态:Meta 将以 DeepSeek 的研究方向为榜样纽约时报认为DeepSeek v4 的开源策略极大地激发全球开发者的创新活动COPU 评论这将推动 AI 进入普惠、自主、可控的新阶段。

DeepSeek v4 将推动降本或高性价比做到极致!

DeepSeek v4 降价的核心是:技术升级 + 国产算力 + 开源战略 + 市场扩张四大因素。

一)技术升级

*DeepSeek v4 采用其首创的多头注意力架构 MLA

*采用混合专家模型MoE及其演进时,不断改进其稀疏化机制

*随后采用混合路由和支持百万 tokens 超长上下文时继续降本算力消耗仅为上一代的27%KV Cache占有降至10%

*成本下降来自模型架构革命。

以编程为例

DeepSeek v4 最近的编程测试中 (SWE bench Verified)其性能虽然未能登顶,但也跻身于排行榜前列,这时 Claude Opus 4.6/4.7 编程登顶得分为 1503DeepSeek v4 pro 得分为 1463约为Claude 1503分的97.3%性能绝对分差40分,相对分差2.7%,与claude 的性能是很近的,已进入编程性能第一梯队。

v4降本约为claude opus4.61/20

这样,将美西方高昂的AI大模型价格打成了“白菜价”。市场反应印证了这一判断:V4发布后周调用量达3.43万亿tokens,登顶全球调用榜。海外社区也由此形成共识:“CodexClaude定上限,Deepseek定斩杀线(跟它持平没溢价,落后它就出局)”。

下面讨论 DeepSeek v4 混合路由实现情况:

这时我们将 DeepSeek v4 分成两部分,即v4 Flash (高性价比) v4 pro (性能)v4 Flash 适用于成本极低、简单任务的场合;v4 pro 适用于复杂推理能力强的场合,适用于多步 Agent 任务,优势明显。

核心目标:90% 以上常规状态取 v4 Flash,仅在必要时升级取 v4 pro

关键数据备查:

指标

v4 Flash

v4 pro

输入价格 (标准)

0.14 美分 / M token

1.74 美分 / M token

输出价格 (标准)

0.28 美分 / M token

3.48 美分 / M token

总参数

284B

1.6T

激活参数

13B

49B

关于 v4 pro 成本计算 (并与 GPT-5.5 进行降对比)

  • v4 pro (缓存命中场景)输入价格 0.025 / 百万 tokens 超长上下文。

  • GPT-5.5 输入价格 30 美元 (216 元人民币)

  • v4 pro (缓存命中) 降价 216 / 0.025 = 9000 这个 0.025 元是 v4 pro 限时2.5折叠加缓存命中后的价格(而常规缓存命中价格为1/百万token)。

  • v4 pro (缓存未命中场合)输入价格 12 / 百万 tokens (超长上下文)

  • GPT-5.5 输入价格 30 美元 (236 元人民币)

  • v4 pro (缓存未命中) 降价 12/ 236  = 1 / 18`(5.6%)

  • 如此MoE 及其稀疏演进降价 + 混合路由降价GPT5.5对比)1/60 x 1/18 = 1/100

我们再来讨论v4 Flash VS GPT-5.5 的降价情况:

  • v4 Flash 输入价格 (标准) = 1 / 百万 token

  • GPT-5.5 输入价格为 30 美元 (折合 216 元人民币) / 百万 tokens,降价超 200 倍。

  • 下面我们再来讨论v4pro输出价格:

  • v4 pro 输出:24 / 百万 tokens

  • GPT-5.5 pro 输出:180 美元 (折合 1296 元人民币) / 百万 tokens

  • v4 pro 输出降价约为 GPT-5.5 pro 1/54

在百万 Token(M) 极端测试场景中,v4 将单 Token 计算量压低降价到其上一代 (v3.2) 27%,显存占用骤减 90%

V4 抢滩 Agent 与上下文市场V4 Pro Agent Coding 评测中获开源榜单第一 Human Eval 评分时突破 90%,在SWE bench Verified 测试中达80.6%

二)算力国产化

DeepSeek v4 适配华为昇腾 950 PR 算力卡运行,摆脱英伟达/H200 算力高价垄断,使算力全栈从英伟达的CUDA迁移到华为 CANN上来,立足于华为昇腾 950 PR 和超节点 Atlas 950 Super PoD 集群系统实现成本腰斩。昇腾 950 单卡7万元是英伟达H200 售价1/3,单位 token 的算子与电费双下降,推进成本下降 40%,能耗下降 60% 智源研究院推出FlagOS 研发成果,使国产算力都能兼容,并都能与 DeepSeek v4 适配,进一步下降了国产算力成本。

三)开源战略

DeepSeek v4 采用 MIT 开源许可证,实行开源零授权费,打破海外授权费 + Token模式,本地部署还实行零费用和无限使用。缓存命中打 1 折,限制 2.5 折。实行开源做到开源创新改进维稳、扩大生态,推动数字化转型、智能化重构,出一条普惠、便民降价 () 之路。

四)DeepSeek-V4 降本遇到小米MiMo挑战

小米也可达到DeepSeek V4 同等的降本效果,但它选择降本的措施不同于 V4。在 V4 应对小米挑战时,形成殊途同归的降本逻辑。

小米MiMo大模型 与 DeepSeek V4降本对比分析:

维度

小米MiMo-V2.5

DeepSeek V4

宣布时间

2026527

2026522

最高降幅

99%

75%

是否永久

缓存

命中

0.025/百万tokenspro

0.02/百万tokens(标准)

0.025/百万tokenspro

0.02/百万tokens(标准)

缓存

未命中

3.0/百万tokenspro

1.0/百万tokens(标准)

3.0/百万tokenspro

1.0/百万tokens(标准)

输出

6.0/百万tokenspro

2.0/百万tokens(标准)

6.0/百万tokenspro

2.0/百万tokens(标准)

核心技术

推理系统工程化:

基于SGLang HiCache 架构+滑动窗口注意力机制 SWA,将 KV缓存多级存储间的数据搬运量降至 1/7,可缓存 token 数量提升5倍,成本降至自缓存工程 

底层架构创新:

多头注意力架构+不断改进稀疏化机制的混合专家模型MoE 及其演进,v4 系列百万级token 长上下文时算力消耗仅为上一代的27%KV Cache 占用降至 10%,成本下降来自模型架构革命 

硬件成本

 

未明确强调硬件的自主性,依托小米的规模采购。


DeepSeek v4 与 小米 MiMo v2.5 降本共同点:尽管两者降本路径不同,但两者共享几个核心逻辑:① 由底层技术推动降本而非烧钱补贴,② 生态卡位优先于短期盈利,③ 都认为大模型 API从“能力溢价”进入“成本约束”阶段,先占市场者赢,④ 国产自主可控。

五)关于 DeepSeek v4 存的短板

DeepSeek 在发展中取得了重大成果的同时,在克服其短板的进程中,迄今尚有待处理好其发展中的局限性问题:

关于DeepSeek v4 尚存的短板(正在改进中): 

① 多模态问题:v4主要采用纯文本模型,视觉版本或多模态版本尚在开发中。 

② 复杂前端生成:与 Claude 仍有差距 

③ 推理吞吐:pro版受高端算力限制(官方承认,下半年昇腾 950 上市后改善) 

④ 第三方验证:目前基准测试多为自报,独立榜单尚未全面覆盖。


本次会议由蚂蚁开源技术委员会副主席王旭介绍了开源AI智能体(Agent)领域的趋势。

0602-2.png
0602-3.png
王旭谈到从去年末到今年初,在 Coding Model 的推动下,让社区确信确信 Agentic 就是答案。

然而数据也揭示了更深层变化:软件的生产模式本身正在被重写。Agent 不再只是聊天框里的对话者,而是开始成为软件的新用户——读文件、调 API、发 PR、做审查,进入真实工作流。报告以 GitHub 和 Hugging Face 数据为锚点,勾勒出 Agentic AI 的三层架构(Agent Infra、Model Infra、Model),指出生态重心正从"如何构建 LLM 应用"转向"Agent 如何进入任务执行",而 token 也从聊天消耗变成生产资料。在此过程中,开发者并未被替代,而是从执行层移动到定义层——碳基定义目标、设计约束、验证结果,硅基负责执行。最终,报告落脚于 Inclusive AGI 的愿景:智能不应是少数人的特权,它应当是 Available(可获取)、Affordable(可负担)、Inclusive(包容)的公共技术,而开源在这一进程中扮演着不可替代的角色。

最后,他谈到:开源不会自动胜利,但开源仍然有不可替代的位置。


本次会议OpenChain执行总监Mary Wang参与例会,并与会分享了OpenChain的愿景与现状。陆主席也指出,双方可以加强合作。

0602-4.png
0602-5.png

本次会议继续讨论如何做好《21开源中国开源世界高峰论坛》筹备工作。

0602-6.png

识别二维码报名参会

参会人员:陆首群、章文嵩、Mary Wang、王旭、安泱、袁怿、谭中意、宋可为、王珊、孟迎霞、鞠东颖、唐小引、张侃、刘澎(线上)、靳虹博(线上)、胡宇(线上)、韩宪平(线上)、陈伟(线上)、陈越(线上)、Anna.AI(线上)。

图片关键词



首页
开源培训
开源新闻