⏰ 限免模型即将到期
OpenRouter多项免费模型即将到期。小米MiMo-V2-Omni和MiMo-V2-Pro最为紧迫——5月31日到期(仅剩2天)。Gemini 2.0 Flash系列6月1日紧随其后。
| 模型 | 到期日 | 价格(提示/补全,每百万tokens) |
|---|---|---|
| 小米 MiMo-V2-Omni(262K上下文) | 5月31日 | $0.40 / $2.00 |
| 小米 MiMo-V2-Pro(1M上下文) | 5月31日 | $1.00 / $3.00 |
| Google Gemini 2.0 Flash Lite(1M上下文) | 6月1日 | $0.075 / $0.30 |
| Google Gemini 2.0 Flash(1M上下文) | 6月1日 | $0.10 / $0.40 |
| Qwen3 30B A3B(131K上下文) | 6月5日 | $0.09 / $0.45 |
| Llama 3 Euryale 70B v2.1(8K上下文) | 6月5日 | $1.48 / $1.48 |
| Hermes 2 Pro Llama-3 8B(8K上下文) | 6月5日 | $0.14 / $0.14 |
| Claude Opus 4.6 Fast(1M上下文) | 6月29日 | $30 / $150 |
💸 DeepSeek V4-Pro永久降价75%
DeepSeek宣布对旗舰模型V4-Pro实施永久性75%降价,将AI价格战推至新高度(Engadget、InfoWorld、VentureBeat报道)。此次永久降价之前历经了限时促销期,体现了DeepSeek以激进定价抢占企业市场份额的策略。此举给西方AI实验室带来巨大压力,尤其在成本敏感的企业部署场景中,推理成本已成为决定性因素。
🇨🇳 Moonshot AI以200亿美元估值融资20亿,发布Kimi K2.6
中国AI初创公司Moonshot AI完成由美团领投的20亿美元融资,估值突破200亿美元(彭博社、南华早报、SiliconANGLE)。同时发布的Kimi K2.6是一个拥有1万亿参数的开源模型,核心特性包括:
- 智能体集群编排——可协调多达300个子代理,完成4,000步协同任务
- 长周期编码——能够在无需人工干预的情况下连续运行数天的代码生成任务
- 注意力机制优化显著降低推理成本
该发布将Moonshot定位为OpenAI和Anthropic在智能体能力模型领域的有力竞争者。Cloudflare已开始在Workers AI平台上运行Kimi K2.5,标志着采用度持续增长。
🏭 基建投资狂潮:字节跳动700亿美元,戴尔大涨32%,高盛预计8000亿
AI基础设施投资竞赛持续加速:
- 字节跳动正考虑2026年投入高达700亿美元的资本支出(彭博社、The Information报道)——这一数字可与美国主要超大规模云服务商的AI投资总额媲美。资金将投向AI芯片、数据中心和算力基础设施。
- 戴尔科技股价单日飙升32%,创历史最佳表现,AI服务器收入远超分析师预期(CNBC、路透社)。慧与科技(HPE)也随板块走强。
- 高盛将2026年AI支出预估上调至8000亿美元(雅虎财经、Benzinga),理由是超大规模云厂商持续投入和企业加速采用。
🔬 Anthropic:Mythos安全发现提交金融监管机构,三星/SK海力士参投
Anthropic同意将其Mythos AI模型网络安全漏洞的研究发现共享给金融稳定委员会(FSB)——全球金融监管机构——这是AI公司主动向金融监管机构披露网络威胁的罕见案例(卫报、纽约时报)。此举正值Mythos未经授权访问事件调查之际。
与此同时,三星和SK海力士加入了Anthropic的650亿美元H轮融资,此次战略投资反映了AI模型开发商与存储/半导体制造商之间日益增长的相互依赖关系(韩国经济日报、theinvestor.co.kr)。Anthropic估值已达9650亿美元,超越OpenAI成为全球最有价值的AI公司。
🏛️ 科罗拉多州签署未成年人AI聊天机器人监管法案
科罗拉多州州长Jared Polis签署了规范AI聊天机器人与未成年人互动的新法案——这是美国首个州级此类法律(Colorado Politics、丹佛邮报)。法律要求:
- 聊天机器人平台实施年龄验证机制
- 明确告知用户正在与AI而非真人交互
- 限制对未成年人的数据收集
- 提供家长选择退出选项
该法案表明,在联邦监管停滞的情况下,州级AI监管浪潮正在兴起。
🚀 OpenRouter新模型
今日OpenRouter新增三款模型:
- StepFun: Step 3.7 Flash — 提示$0.20/M tokens,256K上下文。StepFun最新高效闪速模型。
- Anthropic: Claude Opus 4.8 (Fast) — 提示$10/M tokens,1M上下文。最新Opus的快速变体。
- Anthropic: Claude Opus 4.8 — 提示$5/M tokens,1M上下文。标准变体,同样支持1M上下文窗口。
⭐ GitHub热门AI仓库
| 仓库 | Star数 | 语言 | 描述 |
|---|---|---|---|
| study8677/awesome-architecture | 808 ★ | Vue | 21张架构图涵盖AI网关、RAG和设计模式 |
| UditAkhourii/adhd | 514 ★ | TypeScript | 基于Claude Agent SDK的思维树编码智能体 |
| withkynam/vibecode-pro-max-kit | 496 ★ | JavaScript | AI辅助开发的规范驱动编码工具 |
| FlashML-org/flashlib | 390 ★ | Python | 快速高内存效率的经典ML算子 |
| 2aronS/Duel-Agents | 357 ★ | TypeScript | 多代理系统的CLI、SDK和IDE插件 |
🤗 Hugging Face热门模型
今日Hugging Face生态较为平静。新上传的模型中,cs-552-2026-mnlplus/multilingual_model(183次下载,基于Qwen3的对话模型)是唯一有实际下载量的模型。其余新模型下载量接近为零,反映出开放权重生态相对平淡的一天。