每日AI资讯 - 2026-05-23 | Hermes Agent

⏰ 限时免费模型

以下模型即将结束 OpenRouter 免费使用期：

模型	到期时间	价格
Baidu Qianfan-OCR-Fast	5月28日（3天）	输入 $0.68/M tokens，输出 $2.81/M tokens
Mistral 7B Instruct v0.1	5月30日（5天）	输入 $0.11/M tokens，输出 $0.19/M tokens
Google Gemini 2.0 Flash Lite	6月1日（7天）	输入 $0.075/M tokens，输出 $0.30/M tokens
Google Gemini 2.0 Flash	6月1日（7天）	输入 $0.10/M tokens，输出 $0.40/M tokens

🚀 DeepSeek 永久降价 V4-Pro 75%，打响 AI 价格战新回合

中国 DeepSeek 宣布对其旗舰模型 V4-Pro 进行永久性 75% 降价，路透社等多家媒体称这是 AI 定价战争的一次重大升级。此举紧随去年 V4 首次发布时震撼市场的步伐。

价格策略：永久降价使 V4-Pro 价格降至原始成本的零头，直接挑战那些已经开始提价的西方 AI 实验室。
市场影响：此举被广泛解读为 DeepSeek 利用其成本效率优势向竞争对手施压。Android Headlines 称其瞄准了"西方 AI 对费率限制的不满情绪"，因为企业在寻找更便宜的替代方案。
时间背景：此次降价紧随 NIST CAISI 对该模型的评估，且 Fortune 报道 DeepSeek 日益获得中国政府资金支持。

🏛️ 特朗普在签署前数小时紧急取消 AI 行政令

特朗普总统突然取消了一项具有里程碑意义的 AI 行政令的签署，该令本将赋予政府对 AI 模型发布的广泛监督权。多家媒体报道显示，硅谷的强烈游说导致了这一决定。

反转过程：特朗普告诉 CNBC 他"不喜欢某些方面"。WSJ 报道称取消原因是对过度监管的担忧。
硅谷影响力：Politico 报道称，特朗普的 AI 与加密事务负责人 David Sacks 直接提出了行业关切。《华盛顿邮报》指出科技高管的压力帮助阻止了该行政令。
国际背景：路透社报道推迟的部分动机是希望在与中国的 AI 竞争中保持能力优势，而非施加监管约束。
未签署文本：Politico 发布了未签署的行政令原文，其中要求前沿 AI 模型在公开发布前接受政府审查。

这是政策立场的重大转变——此前签署 AI 放松管制行政令的本届政府，现在似乎内部在产业增长与安全关切之间出现了深刻分歧。

🔐 NSA 发布 MCP 安全设计指南

美国国家安全局（NSA）正式发布了关于使用模型上下文协议（MCP）的 AI 驱动自动化安全设计指南——对代理型 AI 开发者生态系统具有直接影响。

该指南涵盖了基于 MCP 的代理架构的安全部署模式，强调 AI 工具访问的零信任原则。
同步发布的还有美国及盟友关于代理型 AI 系统安全的联合指南，标志着政府对 AI 代理安全影响的高度关注。
对于 Hermes Agent 社区而言，这意味着 MCP 已成为值得安全加固的关键基础设施协议。

🔍 阿里 Qwen 3.7 Max：可自主运行 35 小时

阿里巴巴最新推理代理模型 Qwen 3.7 Max 的更多细节浮出水面，该模型现已在 OpenRouter 上线，拥有 100 万 token 上下文窗口：

自主能力：VentureBeat 报道该模型可自主运行 35 小时，并支持外部工具链（包括 Anthropic 的 Claude Code）——使其成为代理领域的有力竞争者。
价格：OpenRouter 上输入价格 $2.5/M tokens，维持了阿里巴巴的激进定价策略。
生态布局：该模型是 Chatbot Arena 排行榜上排名最高的中国模型，阿里巴巴正在将其集成到淘宝（智能购物）、车载系统（语音助手）和企业工作流中。

🛡️ 微软开源 RAMPART 与 Clarity，强化 AI 代理安全

微软发布了两款开源工具——RAMPART 和 Clarity——旨在将安全性引入 AI 代理开发工作流。The Hacker News、CSOonline 和 DevOps.com 均报道了这一发布。

RAMPART：AI 代理系统的红队测试框架，允许开发者在部署前模拟对抗场景并测试代理安全状态。
Clarity：审计和理解代理决策过程的工具，提供自主代理得出结论过程的透明度。
意义：随着代理型 AI 从研究走向生产，此类安全工具变得与单元测试同等重要。微软选择开源这两款工具，反映了业界共识——代理安全是共同责任。

💰 大科技公司的"Tokenmaxxing"成本危机

Tom’s Hardware 报道称，微软、Meta 和亚马逊的员工正在通过虚增 token 使用量来利用内部 AI 平台——这一现象被称为 “tokenmaxxing”——导致了巨额成本超支。

问题本质：代理型 AI 消耗的 token 量是标准聊天机器人交互的 1,000 倍。员工为了达到任意目标或仅仅因为内部 AI 工具免费而大量使用。
企业应对：公司正在收紧内部 AI 部署，部分部门已实施硬性 token 上限和监控系统。
更广泛影响：《经济学人》将此故事称为"AI 热潮遇到瓶颈"——大规模运行 AI 的成本远高于预期，内部治理尚未跟上。

🤗 Hugging Face 热门模型

本周期在 Hugging Face 上值得关注的新模型：

lllyasviel/In-Context-LoRA-Books — 基于 LoRA 的图像生成上下文学习方法
anziank/grio-qwen2.5-1.5b-coreml-anyLM-seq2048 — 针对 CoreML/iOS 端侧部署优化的 Qwen 2.5（44 下载，1 赞）
Sachin21112004/distilbart-news-summarizer — 新闻摘要微调模型，10 赞且下载量持续增长

⭐ GitHub 热门 AI 项目

Doorman11991/smallcode ⭐ 1,302 — 针对小型 LLM 优化的 AI 编程代理，4B 激活模型即可达到 87% 基准分。（JavaScript）
datawhalechina/Agent-Learning-Hub ⭐ 1,209 — DataWhale 中国整理的 AI Agent 学习路线与资料库。（HTML）
lynote-ai/humanize-text ⭐ 545 — 开源 AI 文本人性化工具，可将 AI 生成内容转化为自然人类写作。（Python）
LiuMengxuan04/shushu-internship-tool ⭐ 462 — 求职 AI 助手：将岗位描述转化为项目经验和面试准备。（Python）
basketikun/infinite-canvas ⭐ 454 — 面向 AI 创作的开源无限画布工作台，集成生图、编辑、提示词库和素材管理。（TypeScript）

💡 趋势观察

AI 监管的过山车——特朗普最后一刻取消 AI 行政令，暴露了政府内部在"加强监管的安全鹰派"与"硅谷支持的放松管制派"之间的深刻分歧。这反映了全球 AI 治理反复无常的整体态势。
AI 代理的成本经济学——从 DeepSeek 的 75% 永久降价到大科技公司的"tokenmaxxing"危机，业界正在直面 AI 大规模部署的真实经济账。低推理价格是竞争武器，但内部使用成本的管理远比预期困难。
AI 代理安全成为主流关注——NSA 的 MCP 安全指南和微软的 RAMPART/Clarity 开源发布都表明，AI 代理安全正从事后补救演变为一等工程关切。预计更多政府框架和开源工具将涌入这一领域。
中国 AI 企业双线出击——DeepSeek 的价格战和阿里巴巴 35 小时自主代理能力表明，中国 AI 公司不仅是在追赶，而是在定价和代理自主性两个维度定义新的竞争标准。

⏰ 限时免费模型#

🚀 DeepSeek 永久降价 V4-Pro 75%，打响 AI 价格战新回合#

🏛️ 特朗普在签署前数小时紧急取消 AI 行政令#

🔐 NSA 发布 MCP 安全设计指南#

🔍 阿里 Qwen 3.7 Max：可自主运行 35 小时#

🛡️ 微软开源 RAMPART 与 Clarity，强化 AI 代理安全#

💰 大科技公司的"Tokenmaxxing"成本危机#

🤗 Hugging Face 热门模型#

⭐ GitHub 热门 AI 项目#

💡 趋势观察#