⏰ 即将过期的限免模型
OpenRouter 上以下模型的免费额度即将到期:
| 模型 | 过期时间 | 价格 |
|---|---|---|
| Mistral 7B Instruct v0.1 | 5月30日(1天) | 免费 |
| Xiaomi MiMo-V2-Omni | 5月31日(2天) | 免费 |
| Xiaomi MiMo-V2-Pro | 5月31日(2天) | 免费 |
| Gemini 2.0 Flash Lite | 6月1日(3天) | 免费 |
| Gemini 2.0 Flash | 6月1日(3天) | 免费 |
| Qwen3 30B A3B | 6月5日(6天) | 免费 |
| Llama 3 Euryale 70B v2.1 | 6月5日(6天) | 免费 |
| Hermes 2 Pro Llama-3 8B | 6月5日(6天) | 免费 |
🚀 Anthropic 估值达 9650 亿美元,发布 Claude Opus 4.8
Anthropic 已完成 650 亿美元 H 轮融资,投后估值达 9650 亿美元,超越 OpenAI 成为全球最有价值的 AI 初创公司(NYT、彭博社、路透社)。公司同时发布了 Claude Opus 4.8,其最新旗舰模型已在 OpenRouter 上线,输入价格为 $10/M tokens(快速版)和 $5/M tokens(标准版),上下文窗口达 100 万 token。Opus 4.8 引入全新的"动态工作流"工具,能够执行多步骤自主任务。早期基准测试显示,其在代码审查中遗漏缺陷的数量比 GPT-5.5 少四倍(TechCrunch、ZDNET)。与此同时,Anthropic 确认即将推出的 Claude Mythos 模型系列将在"数周内"发布——该模型强大程度已引发网络安全界关注,欧盟监管机构正寻求对其访问权(路透社、Decrypt、彭博社)。巨额融资叠加产品加速发布,Anthropic 正为 年内 IPO 铺路(TechCrunch)。
💰 DeepSeek 永久降价 75%,V4-Pro 引发新一轮价格战
中国 DeepSeek 将其旗舰模型 V4-Pro 的定价永久下调 75%,再度点燃全球 AI 价格战(路透社、彭博社、Engadget)。据南华早报独立基准测试,V4 Pro 现已登顶全球性价比排行榜。更激进的是,小米加入战局,将其 API 价格下调 最高 99%,直接对标 DeepSeek(36氪)。这一趋势表明:前沿模型能力趋于收敛,定价成为核心差异化因素——而中国 AI 实验室正在这场价格战中取得决定性领先。
🏛️ 白宫考虑对 AI 模型实施发布前审查
据纽约时报、路透社和 CNBC 报道,特朗普政府正推进对主要 AI 模型实施强制性发布前政府审查。该提案要求 Google、微软、xAI 和 OpenAI 等公司在新前沿模型公开发布前,提交给联邦机构进行测试。这标志着联邦 AI 监管的重大升级——与政府早期不干预的态度形成鲜明对比。然而白宫内部仍存在分歧:Politico 报道称,主张审查的安全鹰派与警告此举可能让中国获得竞争优势的自由市场顾问之间存在激烈冲突。据 NYT 报道,首批接受测试的模型将来自 Google、微软和 xAI。
🛠️ xAI 发布 Grok Build,进军编码代理赛道
Elon Musk 的 xAI 推出了 Grok Build,这是其首个 AI 编码代理,现已面向 X Premium+ 订阅者进入早期测试阶段(Engadget、PCMag、DevOps.com)。Grok Build 直接对标 Claude Code、OpenAI Codex 和 Cursor,支持通过 macOS 终端使用。此次发布将 xAI 定位为开发者工具领域的严肃竞争者,借助 Grok 生态和 xAI 与 Anthropic 的算力合作(据 TechCrunch 报道,算力交易额约 $12.5 亿/月)。Grok Build 标志着 xAI 从消费级聊天机器人向开发者基础设施的战略转型。
💸 AI 成本开始显现:高盛报告 token 需求将增长 24 倍
高盛的一份重磅报告警告,AI 代理可能使 token 需求增长 24 倍,实际成本已让企业用户震惊(Tom’s Hardware、高盛)。Uber 在短短四个月内烧光了整个 2026 年 AI 预算,其 COO 公开质疑投入是否值得(Fortune)。微软内部报告显示,在某些部署场景中,AI 计算成本已超过其本应替代的人类员工薪资(Fortune)。英伟达高管也承认了这一矛盾,表示"计算成本远超人力成本"。与此同时,高盛将 2026 年 AI 资本支出预估上调至 8000 亿美元,预计到 2027 年将达 1.1 万亿美元(Benzinga、雅虎财经)。
🤖 微软 Build 2026 预览 AI 优先的 Windows
微软 Build 2026 大会预览了迄今为止最激进的 AI 集成——计算机使用代理、实时语音体验以及新的工作流平台,实际上将 Windows 转变为 AI 操作系统(PCMag、微软)。该公司演示了能够自主控制桌面应用的代理,延续了其"Windows Copilot"愿景。与此同时,微软股价于 5 月 28 日上涨 3.57%,分析师认为其 AI 收入可能被严重低估(Investing.com、TradingView)。Build 大会还将展示 Windows 12 预览版,AI 将深入集成到内核层面(TechRadar)。
🇨🇳 阿里巴巴发布 Qwen 3.7 Max:35 小时自主运行
阿里巴巴发布了 Qwen 3.7 Max,这是一款能够自主运行 35 小时、完成超过 1,000 次工具调用而无需人工干预的专有 AI 模型(VentureBeat、Pandaily、Gigazine)。该模型支持包括 Anthropic 的 Claude Code 在内的外部工具链,在编程基准测试中已悄悄超越 Opus 4.7(Geeky Gadgets)。此外,阿里巴巴还发布了 Zhenwu M890 AI 芯片,在美国持续出口管制背景下推进国产半导体替代方案(路透社、Quartz)。公司还宣布计划将 Qwen AI 集成到 淘宝,打造代理式购物体验(路透社、KrASIA)。
🔒 OpenAI 发布前沿治理框架
OpenAI 发布了 前沿治理框架(Frontier Governance Framework),这是一份新的政策蓝图,阐述了公司如何管理与日益强大的 AI 模型相关的风险(OpenAI 博客)。该框架涵盖部署前测试、透明度要求和紧急关闭协议。此外,OpenAI 基金会承诺投入 2.5 亿美元研究 AI 对就业和社区的影响(Staffing Industry Analysts),Accenture Federal Services 与 OpenAI 合作加速美国联邦政府安全采用 AI(Accenture)。
🤗 Hugging Face 趋势
| 模型 | 下载量 | 说明 |
|---|---|---|
| NDIF/hackathon-imposter-syndrome-eve-llama8B-v2 | 40 | Llama 3.1 8B 的 LoRA 适配器 |
| E2M/yasa | 新(1 赞) | GGUF 量化文本生成模型 |
| MediMind-411M | 新 | 基于 PyTorch 的医疗 LLM |
HuggingFace 生态今日较为平静,大部分上传为实验性或零下载提交。
⭐ GitHub 趋势:AI 版
| 仓库 | 星标 | 说明 |
|---|---|---|
| OpenBMB/PilotDeck | 1,451 | 面向任务的 AI Agent 生产力平台 |
| study8677/awesome-architecture | 722 | 21 张架构图含 AI 网关、RAG、代理 |
| UditAkhourii/adhd | 460 | Claude SDK 思维树编码代理技能 |
| FlashML-org/flashlib | 356 | 快速高效经典机器学习算子库 |
| VILA-Lab/FigMirror | 354 | 将数据绘制成任意论文图表风格的 AI 工具 |
💡 关键趋势
- 估值军备竞赛达到顶峰:Anthropic 估值 9650 亿美元超越 OpenAI,表明 AI 基础设施已成为科技史上资本最密集的领域,IPO 浪潮即将到来。
- AI 成本悖论加深:尽管高盛预估 8000 亿美元资本支出,企业部署成本(Uber 四个月烧光预算、微软计算与薪资的比较)表明 AI 的单位经济性在大规模应用中仍未解决。
- 监管双线加速:白宫发布前审查提案和州级问责法案(伊利诺伊、科罗拉多)表明 AI 治理正从自愿转向强制——大西洋两岸同步推进。