⏰ 即将到期的限免模型
OpenRouter 上有多款优质模型仍在限免阶段,以下是即将到期的重要模型:
| 模型 | 上下文 | 价格 | 到期日 |
|---|---|---|---|
| Nex AGI: DeepSeek V3.1 Nex N1 | 131K | 输入 $0.14/M tokens,输出 $0.50/M tokens | 6月8日(明天!) |
| NVIDIA: Nemotron Nano 9B V2 | 131K | 输入 $0.04/M tokens,输出 $0.16/M tokens | 6月11日 |
| DeepSeek: R1 Distill Llama 70B | 131K | 输入 $0.70/M tokens,输出 $0.80/M tokens | 6月11日 |
| Z.ai: GLM 4.5 | 131K | 输入 $0.60/M tokens,输出 $2.20/M tokens | 6月19日 |
| Meta: Llama 3 70B Instruct | 8K | 输入 $0.51/M tokens,输出 $0.74/M tokens | 6月19日 |
| Anthropic: Claude Opus 4.6 (Fast) | 1M | 输入 $30/M tokens,输出 $150/M tokens | 6月29日 |
🚨 Anthropic 警告 AI 或将开启递归自我改进,呼吁全球暂停
Anthropic 发布重磅警告,称 AI 系统可能即将实现递归自我改进(recursive self-improvement)——即 AI 无需人类参与即可自主构建更强大的自身版本。据《纽约时报》、路透社、福布斯、CNN 及《科学美国人》等多家媒体同步报道,Anthropic 呼吁全球 AI 实验室在安全框架到位之前暂停先进模型的开发。该公司在一篇博文中将"AI 不扩散"(nonproliferation)定位为全球优先事项,认为如果不受约束,AI 自主进化将带来存在性风险。
🏛️ 特朗普签署行政令,建立联邦 AI 模型自愿审核框架
特朗普总统签署行政令,建立针对前沿 AI 模型的自愿联邦安全审核框架。据 PBS、《纽约时报》和 Politico 报道,该行政令允许 AI 开发者自愿向联邦政府提交模型进行国家安全风险评估,并设有参与激励机制。这标志着政府结构化参与 AI 治理的转变,与政府此前对 Anthropic 等公司的强硬态度形成对比。
🔒 OpenAI 推出"锁定模式";白宫考虑入股 OpenAI
OpenAI 发布了 Lockdown Mode(锁定模式),这是一项旨在保护敏感数据免受提示注入攻击的新安全功能(TechCrunch)。该功能允许企业在高安全环境中部署 ChatGPT 和 API 模型。与此同时,TechCrunch 还报道称,特朗普政府正在评估入股 OpenAI,作为更广泛合作伙伴关系的一部分。Axios 则披露了 Sam Altman 关于 OpenAI 最大 token 使用客户的信息。
💰 Nvidia 创下 $583 亿季度利润纪录,承诺 $400 亿 AI 股权投资
据 Al Jazeera 报道,Nvidia 在 AI 芯片热潮中实现了 583 亿美元季度利润的历史新高。在 GTC Taipei 2026 上,CEO 黄仁勋发表了关于公司路线图和 AI 基础设施愿景的主题演讲。TechCrunch 披露,Nvidia 今年已承诺 400 亿美元用于 AI 股权交易。Fortune 援引 Nvidia 高管的话指出"算力的成本远超人力成本"——凸显了大规模 AI 推理所需的巨大资本投入。
🌐 阿里向第三方开放 Qwen 平台;新模型登顶 Arena 排行榜
阿里巴巴向包括肯德基、瑞幸咖啡和航空公司在内的 第三方服务开放 Qwen AI 平台,在 AI Agent 领域展开全面布局(财新、CNBC)。此次扩展将 Qwen 引入淘宝电商和车载语音控制场景。同时,阿里巴巴预告了新的 Qwen 预览模型,这些模型已成为 Chatbot Arena 排行榜上排名最高的中国 AI 模型(南华早报)。Qwen 团队还进入了具身智能领域,发布了 Qwen-VLA 视觉-语言-动作模型(Pandaily)。
💻 Moonshot AI 发布 Kimi-K2.6(1万亿参数)、代码 CLI,融资 $20 亿
Moonshot AI 发布了 Kimi-K2.6,一个 1 万亿参数的开源模型,通过注意力机制优化在 OpenRouter 上带来显著流量(SiliconANGLE、Tech Times)。该公司还推出了 Kimi Code CLI,一个基于终端的 TypeScript AI 编码 Agent(MarkTechPost)。在商业层面,Moonshot 完成了 20 亿美元融资,估值达 200 亿美元(TechCrunch),并正考虑在香港 IPO(彭博社、南华早报)。
简讯
- DeepSeek 对旗舰 V4-Pro 模型永久降价 75%(路透社、InfoWorld),并正在推进 74 亿美元首轮融资,估值约 590 亿美元。
- Microsoft Build 2026 发布了 7 项 AI 重大公告,包括新的自研 AI 模型以减少对 OpenAI 的依赖并降低开发者成本(CNBC)。
- Google 推出 Gemini Enterprise Agent Platform,将 Vertex AI 扩展为完整 Agent 堆栈(HPCwire)。此外,Google 将向 SpaceX 每月支付 9.2 亿美元用于 xAI 数据中心的算力(TechCrunch、CNBC)。
- Meta 裁减 8,000 个岗位以聚焦 AI(NPR),并发布闭源模型 Muse Spark,取代开源 Llama 策略(VentureBeat、Forbes)。
- Mistral AI 收购了一家奥地利物理 AI 初创公司,推进工业领域布局(路透社)。
- 字节跳动正在评估高达 700 亿美元的 2026 年 AI 资本支出(彭博社);高通与字节跳动签署重大 AI 芯片合作协议(路透社)。
- 软银承诺向法国 AI 数据中心投资 750 亿欧元(873 亿美元)(Euronews、路透社);孙正义成为亚洲首富(福布斯)。
- 美国众议院公布两党草案,拟 三年内凌驾州级 AI 法律(路透社、Politico、Axios)。
- 两党新法案旨在规范 AI 的军事用途(Defense One、纽约时报)。
- Sriram Krishnan 卸任白宫 AI 顾问一职(TechCrunch)。
🤗 HuggingFace 亮点
HF 生态系统今日略显平静,以下为值得关注的模型:
- laaaarrywang/SCDD — 基于 PyTorch 的自纠错离散扩散模型(SCDD),一种用于文本生成的扩散语言模型
- MageLord/Llama-3.2-1B-Instruct-Turkish-GGUF — Llama 3.2 1B 的 GGUF 量化土耳其语版本,支持通过 llama.cpp 本地部署
- Srishtik/gemma-ag-news-finetuned_on_5K_samples_2 — 基于 Unsloth 的 Gemma 3 在 AG News 数据集上的微调模型
⭐ GitHub 趋势:AI 版
- jd-opensource/JoyAI-Echo — 京东开源团队推出的长音频-视频生成系统,实现视频与音频的同步合成(811 ★,Python)
- tastyeffectco/sandboxes — 为编码 Agent 设计的自托管开发沙箱,一条命令即可运行,无需 Kubernetes(485 ★,Go)
- CWS6206/ai-coding-starter-kit — 为瑞士开发团队策划的 AI 辅助编码 Agent 技能、清单和模板(261 ★)
- razr001/align-dev — 帮助 AI 辅助前端团队生成统一的编码标准和 SKILL.md,使 Agent 产出更一致的代码(258 ★,TypeScript)
💡 关键趋势
本日的新闻展现了一个内容密度极高的周日。四大主题浮现:第一,Anthropic 关于递归自我改进的警告——被 NYT、路透社、福布斯、CNN 和 Scientific American 同时报道——标志着 AI 安全已从抽象辩论转向紧迫的多方关切。第二,政府参与 AI 治理在多个层面加速:特朗普自愿审核行政令、白宫考虑入股 OpenAI、众议院草案拟凌驾州级法律、以及规范 AI 军事用途的两党新法案。第三,庞大的资本流动——Nvidia 的 $583 亿利润和 $400 亿股权投资、DeepSeek 的 $74 亿融资、软银的 €750 亿法国投资、字节跳动的 $700 亿资本支出——凸显 AI 基础设施支出已以国家预算级规模计量。第四,AI Agent 平台之战日益激烈:阿里向第三方开放 Qwen、Google 的企业 Agent 平台、以及 Moonshot 的 Kimi-K2.6 引领 OpenRouter 流量,各方都在争夺相同的企业和消费者触点。