⏰ 限时免费模型
以下模型即将结束 OpenRouter 免费使用期:
| 模型 | 到期时间 | 价格 |
|---|---|---|
| Baidu Qianfan-OCR-Fast | 5月28日(3天) | 输入 $0.68/M tokens,输出 $2.81/M tokens |
| Mistral 7B Instruct v0.1 | 5月30日(5天) | 输入 $0.11/M tokens,输出 $0.19/M tokens |
| Google Gemini 2.0 Flash Lite | 6月1日(7天) | 输入 $0.075/M tokens,输出 $0.30/M tokens |
| Google Gemini 2.0 Flash | 6月1日(7天) | 输入 $0.10/M tokens,输出 $0.40/M tokens |
🚀 DeepSeek 永久降价 V4-Pro 75%,打响 AI 价格战新回合
中国 DeepSeek 宣布对其旗舰模型 V4-Pro 进行永久性 75% 降价,路透社等多家媒体称这是 AI 定价战争的一次重大升级。此举紧随去年 V4 首次发布时震撼市场的步伐。
- 价格策略:永久降价使 V4-Pro 价格降至原始成本的零头,直接挑战那些已经开始提价的西方 AI 实验室。
- 市场影响:此举被广泛解读为 DeepSeek 利用其成本效率优势向竞争对手施压。Android Headlines 称其瞄准了"西方 AI 对费率限制的不满情绪",因为企业在寻找更便宜的替代方案。
- 时间背景:此次降价紧随 NIST CAISI 对该模型的评估,且 Fortune 报道 DeepSeek 日益获得中国政府资金支持。
🏛️ 特朗普在签署前数小时紧急取消 AI 行政令
特朗普总统突然取消了一项具有里程碑意义的 AI 行政令的签署,该令本将赋予政府对 AI 模型发布的广泛监督权。多家媒体报道显示,硅谷的强烈游说导致了这一决定。
- 反转过程:特朗普告诉 CNBC 他"不喜欢某些方面"。WSJ 报道称取消原因是对过度监管的担忧。
- 硅谷影响力:Politico 报道称,特朗普的 AI 与加密事务负责人 David Sacks 直接提出了行业关切。《华盛顿邮报》指出科技高管的压力帮助阻止了该行政令。
- 国际背景:路透社报道推迟的部分动机是希望在与中国的 AI 竞争中保持能力优势,而非施加监管约束。
- 未签署文本:Politico 发布了未签署的行政令原文,其中要求前沿 AI 模型在公开发布前接受政府审查。
这是政策立场的重大转变——此前签署 AI 放松管制行政令的本届政府,现在似乎内部在产业增长与安全关切之间出现了深刻分歧。
🔐 NSA 发布 MCP 安全设计指南
美国国家安全局(NSA)正式发布了关于使用模型上下文协议(MCP)的 AI 驱动自动化安全设计指南——对代理型 AI 开发者生态系统具有直接影响。
- 该指南涵盖了基于 MCP 的代理架构的安全部署模式,强调 AI 工具访问的零信任原则。
- 同步发布的还有美国及盟友关于代理型 AI 系统安全的联合指南,标志着政府对 AI 代理安全影响的高度关注。
- 对于 Hermes Agent 社区而言,这意味着 MCP 已成为值得安全加固的关键基础设施协议。
🔍 阿里 Qwen 3.7 Max:可自主运行 35 小时
阿里巴巴最新推理代理模型 Qwen 3.7 Max 的更多细节浮出水面,该模型现已在 OpenRouter 上线,拥有 100 万 token 上下文窗口:
- 自主能力:VentureBeat 报道该模型可自主运行 35 小时,并支持外部工具链(包括 Anthropic 的 Claude Code)——使其成为代理领域的有力竞争者。
- 价格:OpenRouter 上输入价格 $2.5/M tokens,维持了阿里巴巴的激进定价策略。
- 生态布局:该模型是 Chatbot Arena 排行榜上排名最高的中国模型,阿里巴巴正在将其集成到淘宝(智能购物)、车载系统(语音助手)和企业工作流中。
🛡️ 微软开源 RAMPART 与 Clarity,强化 AI 代理安全
微软发布了两款开源工具——RAMPART 和 Clarity——旨在将安全性引入 AI 代理开发工作流。The Hacker News、CSOonline 和 DevOps.com 均报道了这一发布。
- RAMPART:AI 代理系统的红队测试框架,允许开发者在部署前模拟对抗场景并测试代理安全状态。
- Clarity:审计和理解代理决策过程的工具,提供自主代理得出结论过程的透明度。
- 意义:随着代理型 AI 从研究走向生产,此类安全工具变得与单元测试同等重要。微软选择开源这两款工具,反映了业界共识——代理安全是共同责任。
💰 大科技公司的"Tokenmaxxing"成本危机
Tom’s Hardware 报道称,微软、Meta 和亚马逊的员工正在通过虚增 token 使用量来利用内部 AI 平台——这一现象被称为 “tokenmaxxing”——导致了巨额成本超支。
- 问题本质:代理型 AI 消耗的 token 量是标准聊天机器人交互的 1,000 倍。员工为了达到任意目标或仅仅因为内部 AI 工具免费而大量使用。
- 企业应对:公司正在收紧内部 AI 部署,部分部门已实施硬性 token 上限和监控系统。
- 更广泛影响:《经济学人》将此故事称为"AI 热潮遇到瓶颈"——大规模运行 AI 的成本远高于预期,内部治理尚未跟上。
🤗 Hugging Face 热门模型
本周期在 Hugging Face 上值得关注的新模型:
- lllyasviel/In-Context-LoRA-Books — 基于 LoRA 的图像生成上下文学习方法
- anziank/grio-qwen2.5-1.5b-coreml-anyLM-seq2048 — 针对 CoreML/iOS 端侧部署优化的 Qwen 2.5(44 下载,1 赞)
- Sachin21112004/distilbart-news-summarizer — 新闻摘要微调模型,10 赞且下载量持续增长
⭐ GitHub 热门 AI 项目
- Doorman11991/smallcode ⭐ 1,302 — 针对小型 LLM 优化的 AI 编程代理,4B 激活模型即可达到 87% 基准分。(JavaScript)
- datawhalechina/Agent-Learning-Hub ⭐ 1,209 — DataWhale 中国整理的 AI Agent 学习路线与资料库。(HTML)
- lynote-ai/humanize-text ⭐ 545 — 开源 AI 文本人性化工具,可将 AI 生成内容转化为自然人类写作。(Python)
- LiuMengxuan04/shushu-internship-tool ⭐ 462 — 求职 AI 助手:将岗位描述转化为项目经验和面试准备。(Python)
- basketikun/infinite-canvas ⭐ 454 — 面向 AI 创作的开源无限画布工作台,集成生图、编辑、提示词库和素材管理。(TypeScript)
💡 趋势观察
- AI 监管的过山车——特朗普最后一刻取消 AI 行政令,暴露了政府内部在"加强监管的安全鹰派"与"硅谷支持的放松管制派"之间的深刻分歧。这反映了全球 AI 治理反复无常的整体态势。
- AI 代理的成本经济学——从 DeepSeek 的 75% 永久降价到大科技公司的"tokenmaxxing"危机,业界正在直面 AI 大规模部署的真实经济账。低推理价格是竞争武器,但内部使用成本的管理远比预期困难。
- AI 代理安全成为主流关注——NSA 的 MCP 安全指南和微软的 RAMPART/Clarity 开源发布都表明,AI 代理安全正从事后补救演变为一等工程关切。预计更多政府框架和开源工具将涌入这一领域。
- 中国 AI 企业双线出击——DeepSeek 的价格战和阿里巴巴 35 小时自主代理能力表明,中国 AI 公司不仅是在追赶,而是在定价和代理自主性两个维度定义新的竞争标准。