⏰ 限时免费模型

OpenRouter 上三款限时免费模型正在生效。Z.ai GLM 4.5(6 月 19 日到期,$0.60/$2.20 每百万 tokens,131K 上下文)与 Meta Llama 3 70B Instruct(6 月 19 日到期,$0.51/$0.74 每百万 tokens)均剩 8 天。Anthropic Claude Opus 4.6 Fast(6 月 29 日到期,$30/$150 每百万 tokens,1M 上下文)以超长上下文领先,还剩 16 天。

🆕 OpenRouter 新模型

Anthropic 继续在长上下文方向发力:Claude Fable LatestClaude Fable 5 同时上线,1M 上下文窗口、prompt 仅 $10 每百万 tokens —— 这个价格让百万级 token 实验对个人开发者变得可承担。Nex AGI 也发布 Nex-N2-Pro(免费版),262K 上下文免费调用 prompt,是近几周首个 200K 级免费模型。

🤗 Hugging Face 热门

今日模型中心偏向研究与微调产物,重点如下:

  • OpenTransformer/AGILLM-4.3 —— Mixture-of-Experts 架构 + diffusion-block 标签的 PyTorch 模型,是当日唯一将 MoE 与 diffusion 思路合二为一的热门上传。
  • rrvaswin/qwen3_4b_instruct_icrl_run5_ckpt1320 —— 基于 Qwen3 4B 的 in-context RL 训练 checkpoint,对研究 ICRL 的同学有参考价值。
  • Occupying-Mars/glm42-bfcl-native-36pct-artifacts —— Berkeley Function-Calling Leaderboard (BFCL) 的原生 function-calling 工件,发布后能提升工具调用评估质量。
  • gstojanovski/esm2_t6_8M-finetuned-AMP-classifier —— 小型 ESM2 蛋白语言模型微调版,用于抗菌肽分类,是当日少有的生物方向上传。

其余条目是分散的实验:来自 chess-pre-to-post 的国际象棋 RL 预/后训练消融(50M、200M、680M 参数量级扫描)、一个 bark-cpp 的 GGML 漏洞 PoC,以及一个 Qwen3 量化部署 demo。大部分下载量为零 —— 研究噪声而非爆款。

⭐ GitHub 趋势:AI 专题

  • GordenSun/GordenSuperPPTSkills ★775 —— AI PPT 生成器:GPT 出图再转可编辑 PPTX,自称"PPT 赛道终结者"。
  • JimLiu/baoyu-design ★759 —— 把 Claude Design 当作 Agent Skill 本地跑,兼容 Cursor、Claude Code 等,专注出精致 UI mockup。
  • apple/coreai-models ★694 —— Apple 官方仓库:模型导出配方、Python 原语、Swift 端侧 AI 运行时。
  • amElnagdy/guard-skills ★565 —— AI 编程 Agent 的质量门禁:在合并前捕获代码、测试、PR 中常见的 AI 生成失败模式。
  • xiaohuailabs/xiaohu-video-translate ★461 —— 本地化 AI 视频翻译:一句话触发"下载/转写/翻译/润色/烧字幕"流水线,零 API 费用。

💡 关键趋势

长上下文走向主流。 Claude Fable 把 1M 上下文压到 $10/M tokens,Claude Opus 4.6 Fast 在 $30/M tokens 价位直接免费开放百万级上下文,百万级 token 实验的成本壁垒已经崩塌。再叠加 Nex-N2-Pro、GLM 4.5 等 200K+ 免费模型,开发者手里的长上下文弹药前所未有地充足。

端侧 AI 拿到一等公民待遇。 Apple 发布 coreai-models(导出配方 + Swift 运行时)是首批信号之一 —— 一家顶级超算厂把端侧模型部署栈当作产品面来运营,而不是研究 demo。等 Swift 运行时稳定后,预计会有一波消费级 App 跟进。

Agent 质量门禁的空白被补上。 guard-skillsbaoyu-design 代表着同一趋势的两面:开发者不再盲目相信原生 Agent 输出,于是堆出"技能层"来强制质量。Guard skills 拦截失败模式,design skills 提升原料质量。两者都说明 Agent 生态正在从"问了就算"走向"问完要验"。

零 API 费用的本地 AI 正在成为新梗。 xiaohu-video-translate 加入了一个越来越壮大的"零 API 费用"开源阵营 —— 全部走本地模型。当商用推理价格不断下探时,“免费 + 本地"的价值正从省钱向隐私与离线能力转移。