已核验 · Jun 29, 2026

智谱 GLM-5.2 开源 + 一条命令部署，强开源 Coding 模型又添一位

3 个信源

Z.AI 于 2026 年 6 月 17 日在 Hugging Face 发布 GLM-5.2：753B 参数、1M token 上下文、MIT 协议；自报 Terminal-Bench 2.1 = 81.0、SWE-bench Pro = 62.1、FrontierSWE = 74.4（自报开源最高）。Hugging Face 在 6 月 26 日发布教程，一条 `hf jobs run` 就能在 HF Jobs 上拉起 OpenAI 兼容的 vLLM 私有接口，按秒计费。

为什么现在讲

GLM-5.2 的开源权重 + HF 一键部署在 10 天内连发，刚好拼成「今天就能跑起来」的实操故事，不需要等任何私有 API。

依据

「国产开源 + 一键部署 + 真有 benchmark」三件齐的稿件在中文 AI 创作者圈长期有传播力，且部署成本（a10g-large 1.50 美元/小时）能讲清楚。

“我刚用一条命令在云上跑起 753B 的开源模型，1M 上下文还不要钱。”

切入角度

把「开源 1M context 的国产千亿模型」和「一条命令部署」拼成一条完整工作流，跑给观众看。

形式

口播短视频

演示想法

贴出 `hf jobs run` 完整命令 + 启动后访问 `https://<job_id>--8000.hf.jobs` 的截图 + 一段 1M 上下文的长文档问答；明确标出 a10g-large 1.50 美元/小时的价格。

平台注意

始终把 benchmark 数字标为「Z.AI 自报」，不要替它宣称「业界第一」。 MIT 协议指的是模型权重；GLM Coding Plan 的高峰 3x / 低谷 2x 配额是商业条款，引用时分开说。 HF Jobs 接口需 HF token 鉴权、按秒计费，绝不能说成「免费公开 API」。模型卡与博客链接分别给出，引用具体成绩时链到博客。

可用说法

Z.AI 于 2026 年 6 月 17 日在 Hugging Face 博客发布 GLM-5.2：参数量 753B，上下文窗口 1M token，MIT 协议，权重同步上线 Hugging Face 与 ModelScope。
GLM-5.2 公布的三项基准成绩为 Terminal-Bench 2.1 = 81.0、SWE-bench Pro = 62.1、FrontierSWE = 74.4，其中 FrontierSWE 为开源模型最高分。
Hugging Face 于 2026 年 6 月 26 日发布官方教程，演示如何用一条命令在 HF Jobs 上启动私有的 OpenAI 兼容 vLLM 接口，并以 Qwen3-4B 和 Qwen3.5-122B-A10B 为例。

证据链

来自新闻

拆解

这份拆解把 GLM-5.2（753B / 1M context / MIT）的开源权重、Hugging Face 上 6 月 26 日的 vLLM on HF Jobs 教程、和按秒计费的 a10g-large 价格串成一条「今天就能跑」的工作流；并把模型权重 MIT 协议与 GLM Coding Plan 的高峰 3x / 低谷 2x 商业条款区分开。

信源

风险

始终把基准成绩归于 Z.AI 的发布文章，并在引用 FrontierSWE 第一的开源排名时注明这是发布方自报。
把开源权重部分（协议、上下文、参数量）和 Coding Plan 定价部分分开讲，不要把计费规则说成协议的一部分。
演示中明确列出每小时单价和 bearer token 要求，绝不能把该接口说成公开或免费。

演示思路

录一段 30 秒终端：输入一条命令、复制返回的 URL、用 curl 打一次 OpenAI 兼容请求
挑 1 份公开技术白皮书（约 800K token），丢进 1M 上下文做总结，对比同样提示下 200K 模型的截断结果
做一张 753B / 1M / MIT 的标签卡，对比 GLM-5.1 与 GLM-5.2 的 Terminal-Bench 2.1 提升（63.5 → 81.0）

智谱 GLM-5.2 开源 + 一条命令部署，强开源 Coding 模型又添一位

为什么现在讲

推荐理由

依据

可用说法

证据链

信源

风险

演示思路