⏰ 限时免费模型 — 最后机会
多款优质模型的免费期即将结束。GLM 4.6 和 Kimi K2 0905 今日到期,而 xAI 的全部 Grok 系列模型 将于明日(5月13日)退出免费 tier:
| 模型 | 到期日 | 上下文长度 | 提示/补全(每千词) |
|---|---|---|---|
| Z.ai: GLM 4.6 | 5月14日 | 204,800 | $0.00039 / $0.0019 |
| MoonshotAI: Kimi K2 0905 | 5月14日 | 262,144 | $0.0004 / $0.002 |
| xAI: Grok 4.1 Fast | 5月15日 | 2,000,000 | $0.0002 / $0.0005 |
| xAI: Grok 4 Fast | 5月15日 | 2,000,000 | $0.0002 / $0.0005 |
| xAI: Grok Code Fast 1 | 5月15日 | 256,000 | $0.0002 / $0.0015 |
| xAI: Grok 4 | 5月15日 | 256,000 | $0.003 / $0.015 |
| xAI: Grok 3 Mini | 5月15日 | 131,072 | $0.0003 / $0.0005 |
| xAI: Grok 3 | 5月15日 | 131,072 | $0.003 / $0.015 |
其中 Grok 4.1 Fast 尤其亮眼——200万 token 上下文窗口,价格却几乎可以忽略不计。
🤗 Hugging Face 热门模型
LLM-OS-Models 团队今日霸榜,发布三款基于 Gemma-4 的终端 SFT 模型,上线数小时内均突破 1100 下载:
- LLM-OS-Models/gemma-4-E2B-Terminal-SFT-Native-Liquid-1Epoch — 1,102 次下载
- LLM-OS-Models/gemma-4-E2B-it-Terminal-SFT-Native-Liquid-2Epoch — 1,095 次下载,3 赞
- LLM-OS-Models/gemma-4-E2B-it-Terminal-SFT-Native-Liquid-1Epoch — 1,103 次下载
此外还有 Kanawut/mask2former(134 下载,语义分割模型)、Koras1k/ast-finetuned-gtzan(音频分类)、ElioChampaney/NOVA-50M(小型语言模型)、sundaycoil/ec2-auto-manager 和 juergengunz/fluxer(4 赞)。
趋势很明显:微调后的 Agent 模型和轻量级领域模型正在获得最多关注。
🚀 OpenRouter 新模型
OpenRouter 新增两款模型:
- Anthropic 的 Claude Opus 4.7 (Fast) — 1,000,000 token 上下文,提示价格仅 $0.00003/千词。经 OptiLLM 优化,在降低延迟的同时保持 Opus 级别的质量。
- Perceptron Mk1 — 32,768 token 上下文,惊人地低至 $0.00000015/千词(每百万 token 仅需 15 美分)。这可能是有史以来 OpenRouter 上最便宜的模型。
⭐ GitHub 热门 AI 项目
本周五个 AI/ML 项目备受社区关注:
- strukto-ai/mirage ⭐2,054 — 面向 AI Agent 的统一虚拟文件系统,TypeScript 编写,让 AI 代理能结构化管理文件系统。
- yaojingang/yao-open-prompts ⭐1,822 — 全面的中文 AI 提示词库,覆盖工作、学习、内容创作、营销和日常生活场景。
- huangserva/3DCellForge ⭐1,698 — AI 驱动的交互式 3D 细胞生成与探索工作室,使用 JavaScript 构建。
- lightseekorg/tokenspeed ⭐972 — 光速级 LLM 推理引擎,Python 编写,不断突破推理性能极限。
- alchaincyf/huashu-md-html ⭐479 — 双向 Markdown↔HTML 流水线,整合 markitdown、Pandoc 等工具。
💡 关键趋势
- Agent 优先微调:Gemma-4 终端 SFT 模型表明社区正快速转向专用 Agent 微调——针对工具使用和终端交互专门优化的模型。
- 超低成本推理:Perceptron Mk1 的 $0.00000015/千词 和 Grok 4.1 Fast 的 $0.0002/千词 标志着 AI 成本新低。降价竞赛仍在继续。
- 开源 Agent 基础设施:mirage 为 AI Agent 构建文件系统,tokenspeed 优化推理性能——开源生态正在为自主 AI Agent 完善全栈基础。
- 双语与多模态扩展:Yao Open Prompts(中文)和 3DCellForge(生物可视化)展示了 AI 在语言和科学领域的不断拓展。