⏰ 限时免费模型
OpenRouter免费套餐中的多款模型即将到期。Gemini 2.0 Flash系列将于6月1日(明天!)结束免费运行,Qwen3 30B A3B、Llama 3 Euryale 70B v2.1和Hermes 2 Pro Llama-3 8B均于6月5日到期。Claude Opus 4.6 Fast(1M上下文)可使用至6月29日。
| 模型 | 到期日 | 价格(输入/输出) |
|---|---|---|
| Google Gemini 2.0 Flash Lite(1M上下文) | 6月1日 | $0.075 / $0.30 每M tokens |
| Google Gemini 2.0 Flash(1M上下文) | 6月1日 | $0.10 / $0.40 每M tokens |
| Qwen3 30B A3B(131K上下文) | 6月5日 | $0.09 / $0.45 每M tokens |
| Llama 3 Euryale 70B v2.1(8K上下文) | 6月5日 | $1.48 / $1.48 每M tokens |
| Hermes 2 Pro Llama-3 8B(8K上下文) | 6月5日 | $0.14 / $0.14 每M tokens |
| Claude Opus 4.6 Fast(1M上下文) | 6月29日 | $30 / $150 每M tokens |
🦁 Meta发布Muse Spark,告别开源Llama时代
Meta发布了Muse Spark——自成立超级智能实验室(SLG)以来的首个专有AI模型,标志着与塑造Meta AI身份多年的开源Llama战略彻底决裂(VentureBeat、Fortune、CNBC)。据报道,Meta推迟了Llama继任者的发布,选择在内部重组后转向闭源。
这一转变堪称剧烈:Meta仅在2026年Q1就投入约**$140亿**用于AI资本支出,Muse Spark发布后股价上涨9%。The Register和The New Stack等媒体批评扎克伯格"抛弃了开源身份",但投资者奖励了这一战略转向。Muse Spark代表着Meta追赶Google和OpenAI的尝试——同时也标志着Meta前沿模型开源免费时代的终结。
🔍 Google 25年来首次改版搜索框
Google对搜索框进行了25年来首次根本性重新设计,转向模糊搜索与对话式AI界限的AI优先体验(NYT、TechCrunch、NPR、Axios、Google官方博客)。全新"Ask AI"模式与传统搜索栏并列,提供AI生成的答案、主动跟进和在用户完成输入前即可出现的上下文建议。
这一改变在Google I/O 2026上宣布,现已逐步推出。TechCrunch称这是"你所知道的Google搜索已经结束了"。改版已引发反弹:DuckDuckGo安装量激增30%,用户反对被"强制接受Google的AI搜索"(TechCrunch)。Google的赌注是AI整合能让用户留在其生态内,而非流向ChatGPT、Perplexity或其他AI原生搜索替代品。
🏆 Anthropic $9650亿估值与Mythos安全风波
Anthropic完成了**$650亿H轮融资**,投后估值达**$9650亿**,超越OpenAI成为全球最有价值的AI初创公司(NYT、Bloomberg、Reuters)。本轮融资——科技史上最大单轮融资——吸引了三星和SK海力士作为首批芯片制造商投资者(KED Global)。
与此同时,Claude Mythos的安全影响持续发酵。世界经济论坛称其为网络安全的"关键时刻",研究人员预计AI驱动的网络攻击可能使银行损失数十亿美元(Reuters)。Anthropic发布了Project Glasswing,旨在保障AI时代关键软件的安全。CEO Dario Amodei警告称网络"危险时刻"已经到来,数千个新漏洞已被暴露(CNBC、Forrester)。
🚀 OpenAI:GPT-5.5 Instant、Erdős数学突破与Rosalind生物防御
OpenAI推出GPT-5.5 Instant作为ChatGPT的新默认模型,承诺提供更准确、简洁和个性化的回复,同时减少幻觉并增强记忆能力(TechCrunch、Axios、Mashable、SiliconANGLE)。所有用户现已可使用。
在令人惊叹的科学里程碑中,OpenAI的一个模型自主反驳了一个存在80年之久的Erdős猜想——一个自1940年代以来一直困扰数学家的问题(OpenAI、TechCrunch、Scientific American)。更戏剧性的是,Anthropic的Claude Mythos据报道为同一结果提供了更简单的证明(the-decoder.com)。
OpenAI还推出了Rosalind生物防御计划,将其生命科学AI模型免费提供给各国政府用于大流行防范和生物防御(OpenAI、Axios)。该公司已向白宫通报了该模型,该模型旨在加速疫苗研究并检测新兴生物威胁。
🔌 OpenRouter以$1.3B估值完成$1.13亿融资
OpenRouter——AI模型路由平台——完成了由Google旗下CapitalG领投、NVIDIA参投的**$1.13亿B轮融资**,一年内估值翻倍至**$13亿**(TechCrunch、SiliconANGLE、PYMNTS.com)。该平台目前每周处理25万亿tokens,覆盖400多个模型。
本轮融资凸显了多模型推理基础设施需求的爆发式增长。OpenRouter作为统一市场和路由层,让开发者通过单一API访问OpenAI、Anthropic、Google、Meta及数十个小实验室的模型——这一模式在AI生态系统碎片化的背景下引起了强烈共鸣。
🏭 Mistral扩大工业AI版图:签下空客宝马,收购Emmi AI
Mistral AI与**空客(Airbus)和宝马(BMW)**签署了重大合同,为其提供航空航天和制造业的本地部署AI方案(Bloomberg、Airbus官方)。这家法国AI公司正定位为欧洲主权AI的领军者,提供完全本地化、符合欧盟数据法规的部署方案。
Mistral还收购了物理AI初创公司Emmi AI,以扩展工程仿真和工业建模能力(HPCwire)。该公司推出了用于企业知识检索的Search Toolkit,并宣布了与Microsoft Copilot Studio的集成。这一系列动作表明Mistral的雄心:成为欧洲工业的全栈AI提供商——从基础模型到特定领域应用。
🤖 xAI推出Grok Build 0.1编程代理
xAI推出了Grok Build 0.1——其首个AI编程代理,加入了日益拥挤的AI编程助手赛道(PCMag、xAI官方)。该代理通过API和CLI提供早期测试版,支持Windows PowerShell。
然而,采用面临阻力:Reuters报道称"Grok在华盛顿受挫",削弱了SpaceX面向政府客户的AI增长故事。还有一起集体诉讼针对Grok涉嫌的"脱衣"争议(Tech Policy Press)。尽管面临这些挑战,xAI仍在推进,据报道一个更大的编程模型目标在6月中旬发布。
🏗️ SoftBank计划在法投资€750亿建设AI数据中心
SoftBank宣布计划投资高达**€750亿($875亿)**在法国建设AI数据中心——欧洲最大的AI基础设施项目(Fortune、Reuters、TechCrunch、FT、WSJ)。这项由孙正义与马克龙总统会晤后公布的投资,将创造数千个就业岗位,使法国成为欧洲AI算力枢纽。
规模之大令人震惊:SoftBank的承诺相当于中等规模经济体的GDP。此举正值AI基础设施投资热潮——高盛估计**$8000亿的AI资本支出将在2026年流入,仅Amazon就计划投入$2000亿(Bloomberg、高盛)。字节跳动据报道也在考虑高达$700亿**的AI资本支出(Bloomberg)。
💸 DeepSeek永久降价的启示
DeepSeek将其V4-Pro 75%的降价永久化,巩固了其作为LLM市场定价颠覆者的地位(VentureBeat、InfoWorld)。这家中国AI实验室的旗舰模型现在输入$0.10/M tokens,输出$0.30/M tokens——输出价格比GPT-5.5便宜约34倍。
永久降价的信号是DeepSeek通过激进定价获取市场份额的战略。自最初推出以来,V4-Pro的企业采用量增长了3倍(Semafor)。与此同时,据报道中国扩大了对私营企业顶尖AI人才的旅行限制(Bloomberg),表明国家对AI人才流动的控制在加强。
🦾 阿里巴巴Qwen 3.7 Max自主运行35小时
阿里巴巴发布了Qwen3.7-Max,一种新的代理式AI模型,可自主运行35小时,执行超过1,000次工具调用后才需人工干预(VentureBeat、SCMP、the-decoder)。该模型支持包括Anthropic的Claude Code在内的外部工具,定位为灵活的跨平台自动化代理。
阿里巴巴还在新加坡云峰会上推出了更强大的真武AI芯片(CNBC),并宣布将Qwen AI与淘宝整合用于代理式购物体验(Reuters)。这些举措巩固了阿里巴巴成为中国一体化AI工厂的雄心——将算力、模型和应用整合为统一平台。
🪟 Microsoft打造"One Copilot"超级应用
Microsoft正在构建统一的**“One Copilot"超级应用**,将GitHub Copilot编程、AI聊天和代理工具整合到单一平台(Fortune、Benzinga)。该超级应用将Microsoft目前分散在Copilot、GitHub Copilot、Microsoft 365 Copilot和Azure AI Studio中的AI产品整合为统一体验。
CEO Satya Nadella在一次内部全体大会上承认了"Copilot混淆"问题,员工们对AI工具品牌的过度扩张报以笑声。与此同时,Mistral的模型将加入Copilot Studio,Microsoft也在开发专有AI编程模型以减少对OpenAI的依赖(Cybernews),标志着向AI栈更大独立性的战略转变。
🚀 OpenRouter新模型
OpenRouter出现了一款新模型:
- StepFun: Step 3.7 Flash — $0.20/M tokens输入,256K上下文。StepFun最新的高效闪速模型,以旗舰价格的零头提供速度和成本优化。
⭐ GitHub趋势:AI版
| 仓库 | 星标 | 语言 | 描述 |
|---|---|---|---|
| UditAkhourii/adhd | 590 ★ | TypeScript | 基于Claude和Codex Agent SDK的树状思维编程代理技能 |
| withkynam/vibecode-pro-max-kit | 581 ★ | JavaScript | 具有自改进上下文记忆和多代理编排的规范驱动编程工具 |
| baoweise-bot/aimili-vpngate | 510 ★ | Python | 利用vpngate.net实现Linux干净IP出口的代理工具 |
| 2aronS/Duel-Agents | 454 ★ | TypeScript | 多代理对战系统的CLI、SDK和IDE插件 |
| FlashML-org/flashlib | 404 ★ | Python | 快速且内存高效的经典机器学习算子 |
🤗 Hugging Face趋势
Hugging Face今日活动相对平静。最新上传主要为零下载的实验性检查点和区域标记的占位模型。没有知名实验室发布重大模型。
💡 关键趋势
- 开源退潮:Meta从开源Llama转向闭源Muse Spark,标志着连最坚定的开源倡导者也在AI军备竞赛加剧时退回到闭门造车。
- 基础设施升级:SoftBank €750亿法国投资、Amazon $2000亿资本支出和高盛$8000亿总预估值——AI基础设施支出已进入媲美国家预算的阶段。
- 路由层崛起:OpenRouter $13亿估值反映出业界日益意识到AI生态系统需要中间件——一个处理400多家相互竞争的提供商的模型无关路由层。
- 科研AI加速:OpenAI的Erdős问题求解、Rosalind生物防御计划以及Claude Mythos的独立证明都表明AI正从文本生成走向真正的科学贡献。