⏰ 即将过期的限免模型
OpenRouter 上多个限免模型即将到期,抓紧使用:
| 模型 | 到期日 | 价格 | 上下文 |
|---|---|---|---|
| 百度:Qianfan-OCR-Fast | 5月28日(剩5天) | $0.68/$2.81 每百万 tokens | 65K |
| Mistral:Mistral 7B Instruct v0.1 | 5月30日(剩7天) | $0.11/$0.19 每百万 tokens | 4K |
| Google:Gemini 2.0 Flash Lite | 6月1日(剩9天) | $0.075/$0.30 每百万 tokens | 1M |
| Google:Gemini 2.0 Flash | 6月1日(剩9天) | $0.10/$0.40 每百万 tokens | 1M |
🗳️ 特朗普在签署前数小时暂缓 AI 行政令
白宫在预定签署 AI 行政令前数小时突然宣布暂缓,Axios、Politico、CNBC 等多家媒体均报道了这一转折。特朗普总统向记者表示他"不喜欢某些条款",并担心过度监管会削弱美国对中国的竞争力。
**《华盛顿邮报》**报道该行政令原要求企业在公开发布高级 AI 模型前 90 天进行报告,并赋予 NSA 在自愿模型测试中的角色。Politico 指出暂缓决定是在行业团体认为规则过于严格的游说压力下做出的。路透社称总统优先考虑与中国竞争而非国内监管。
这一反转与上周特朗普在 Anthropic Mythos 网络安全事件后表态支持 AI 监管的立场形成鲜明对比。
🧠 Nvidia 季报:营收 816 亿美元,利润 583 亿美元创新高
Nvidia 公布 2027 财年第一季度财报,营收 816 亿美元、净利润 583 亿美元——两项均为历史新高,AI 芯片需求持续爆发。**《纽约时报》**称这是"AI 热潮继续升温"的证据,半岛电视台则强调 583 亿美元利润已成为新的行业标杆。
美银证券分析师建议在财报后股价回调时买入,认为 Nvidia 应提高股息和回购以扩大投资者吸引力。公司还与 康宁 宣布合作,将美国光通信制造能力扩大十倍以支持 AI 数据中心基础设施。
💰 Anthropic 接近盈利,营收达 109 亿美元,收购 Stainless
Anthropic 据 CNBC 消息源报道,2026 年第二季度营收有望达 109 亿美元,并正在接近盈利。公司还 收购了 Stainless(一家 API SDK 公司),以增强开发者工具和平台能力。
此外,Anthropic 据报正在与 微软 商谈使用其定制 AI 芯片——就在数周前 Anthropic 刚与 Google 签订了 2000 亿美元的云服务和 TPU 使用协议。Anthropic 联合创始人表示,AI 将在一年内帮助人类做出诺贝尔奖级别的科学发现。
🔢 OpenAI 模型推翻 80 年历史的数学猜想
OpenAI 宣布其模型自主推翻了一个已存在近 80 年的离散几何中心猜想——平面单位距离问题。**《新科学家》**称其为"AI 在数学领域迄今为止最大的突破",OpenAI 官方博客表示这展现了 AI “超越单纯助手角色"的能力。
这一突破将 AI 定位为数学领域的真正研究伙伴,而数学传统上是最难自动化的学科之一。OpenAI 还宣布与 戴尔科技 合作,将 Codex 引入混合云和企业本地环境。
🆕 阿里巴巴发布 Qwen 3.7 Max 智能体模型与 Zhenwu 芯片
阿里巴巴推出 Qwen3.7-Max——其新一代 AI 智能体模型,支持 35 小时自主工作和每次会话超过 1000 次工具调用。据 TechNode 和 GIGAZINE 报道,该模型在 Chatbot Arena 排行榜上是中国 AI 模型中排名最高的。
同时,阿里巴巴发布了 Zhenwu M890 芯片,这是其推动国产 AI 芯片替代的最新举措。路透社报道称这是中国半导体自给自足战略的一部分。阿里巴巴还宣布将 Qwen AI 集成到 淘宝和天猫 中,实现智能体购物体验。
🛠️ xAI 推出 Grok Build CLI 编程代理和 Grok 4.3
xAI 推出 Grok Build——其首款 AI 编程代理,定价每月 99 美元,直接对标 Claude Code 和 Codex。Engadget 和 Techzine Global 报道了此次发布。
同时,xAI 发布了 Grok 4.3,定价"极具侵略性”,并附带新的语音克隆套件。据报道,五角大楼正考虑在机密系统中部署 Grok,作为前沿 AI 模型融入国家安全行动的更广泛举措的一部分。
🏛️ 五角大楼计划组建 AI 网络武器任务组
据 Gizmodo 报道,五角大楼正在组建一个新的任务组,部署先进 AI 模型用于网络安全和进攻性网络行动。该计划旨在将最新的前沿 AI 模型武器化用于国家安全目的,标志着军事 AI 应用的显著升级。
🤗 Hugging Face 热门模型
本周 Hugging Face 的值得关注上传包括多个科研实验和微调变体:
- juergengunz/fluxer — 新创意生成模型(6 个赞)
- yusr9/radar-modernbert-large-freeze-pan26 — 面向雷达的 ModernBERT 变体
- Nj-1111/EyeeSEE — 新视觉模型(2 个赞)
- tkwiecinski/amr-fma-Qwen2.5-7B-Instruct-lora_sdpo-gsm8k-p1 — 使用 SDPO 在数学推理上微调的 LoRA 模型
⭐ GitHub 热门 AI 仓库
| 仓库 | 星标 | 简介 |
|---|---|---|
| Doorman11991/smallcode | ⭐1,053 | 面向小型 LLM 优化的 AI 编程代理,4B 活跃模型达 87% 基准 |
| Helvesec/rmux | ⭐484 | 通用 Rust 多路复用器,通过类型化 SDK 以编程方式驱动任何 CLI/TUI |
| datawhalechina/Agent-Learning-Hub | ⭐429 | AI Agent 学习路线与资料库收集 |
Smallcode 继续领跑 — 仅用 4B 活跃参数即达 87% 基准性能,证明高效的小型架构也能与大型系统竞争。
Rmux(484★)是 Rust 原生的多路复用器,通过类型化 SDK 让开发者以编程方式驱动任何 CLI 或 TUI 应用,是 AI 智能体编排的强大工具。
🚀 OpenRouter 新模型
OpenRouter 近期新增三款值得关注的模型(Qwen3.7 Max 和 Grok Build 0.1 已在新闻部分详细介绍):
| 模型 | 提供商 | 价格 | 上下文 |
|---|---|---|---|
| Grok Build 0.1 | xAI | $1/百万 tokens(输入) | 256K |
| Qwen3.7 Max * | 阿里巴巴 | $2.5/百万 tokens | 1M |
| Gemini 3.5 Flash * | $1.5/百万 tokens | 1M |
* 详见上文新闻部分
💡 关键趋势
1. AI 政策的摇摆。 特朗普在表示支持监管数天后突然暂缓 AI 行政令,凸显了 AI 监管政策的不稳定性。国家安全关切(Mythos 事件加剧)与对华竞争之间的张力造成了难以预测的政策环境。
2. AI 作为研究伙伴,而不仅仅是工具。 OpenAI 模型自主推翻 80 年数学猜想是一个真正的里程碑。结合 Anthropic 关于 AI 将在一年内助力诺贝尔级科学发现的论断,叙事正在从 AI 作为生产力工具转向 AI 作为科学协作者。
3. 智能体平台竞赛加速。 阿里巴巴的 Qwen 3.7 Max(35 小时自主会话)、xAI 的 Grok Build 和 Anthropic 日益壮大的平台布局都表明,2026 年是 AI 公司在智能体能力上竞争的一年——而不仅仅是模型质量。战场正从基准分数转向真实世界的自主任务完成。