⏰ 限免模型倒计时

OpenRouter 上多款限免模型即将到期。NVIDIA Nemotron Nano 9B V2DeepSeek R1 Distill Llama 70B 将在 6月11日 到期,定价分别为 $0.04/$0.16 每百万 token 和 $0.70/$0.80 每百万 token。Z.ai GLM 4.5(6月19日,$0.60/$2.20 每百万 token)和 Meta Llama 3 70B Instruct(6月19日,$0.51/$0.74 每百万 token)也即将结束。Anthropic Claude Opus 4.6 Fast(100万上下文)免费至6月29日,定价 $30/$150 每百万 token。

🍎 苹果 WWDC 2026:Siri 接入 Gemini,AI 全面升级

苹果在 WWDC 2026 上发布了由 Google Gemini 驱动的大幅升级版 Siri,基于一份价值 10 亿美元的 Gemini 合作协议,同时推出了 iOS 27 和全新的 Apple Intelligence 功能。新款 Siri AI 运行在 Google 基础设施上,但苹果澄清该助手"不是贴牌的 Google Gemini"——其 AI 模型不含 Gemini Assistant 代码,仅利用 Gemini 的云计算能力。值得注意的是,苹果正面临 2.5 亿美元关于 WWDC AI 演示夸大功能的虚假广告诉讼和解案。同时,苹果押注更便宜的端侧 AI 以吸引小型开发者的策略也引发了业界关注。

🎮 Anthropic 发布 Claude Fable 5:面向公众的游戏生成版 Mythos

Anthropic 发布了 Claude Fable 5,这是 Claude Mythos 架构的面向公众版本,可一键生成可玩的视频游戏。TechCrunch 报道称 Fable 5 能制作"出奇有趣"的游戏——从平台跳跃到解谜冒险,全部通过自然语言提示生成。该模型已在 OpenRouter 上线,拥有 100 万上下文,定价为 $10/M tokens 输入。这标志着 Anthropic 首次推出面向消费者的创意编程工具,与竞争对手的同类型产品形成竞争。

🔬 Nvidia 与 SK 海力士达成合作,拓展韩国 AI 生态

Nvidia 宣布与 SK 海力士达成多年技术合作伙伴关系,共同开发面向 AI 工厂的先进内存解决方案,并与多家韩国巨头签署协议以加速 AI 发展。合作涵盖 HBM4 内存开发及韩国 AI 基础设施建设。与此同时,Nvidia CEO 黄仁勋拒绝了美国参议院关于 AI、中国和出口管制问题的作证邀请,加剧了这家芯片巨头与华盛顿政策制定者之间的紧张关系。

💰 软银承诺投资 750 亿欧元建设核能法国数据中心

软银宣布计划投资高达 750 亿欧元(约 820 亿美元),在法国建设由核能供电的 AI 数据中心——这是法国吸引的总计 1080 亿美元外国投资浪潮的一部分。这些数据中心将利用法国丰富的核电网供电,这是软银 CEO 孙正义在日本 AI 热潮中重返日本富豪榜首的战略举措。

🏛️ 台湾考虑加强对华 AI 芯片销售限制;加州和康涅狄格州出台 AI 法律

台湾正在探索对华 AI 芯片销售的新限制措施,以配合美国的出口管制,标志着全球半导体供应链进一步收紧。在美国国内,加州州长纽森签署了首个关于 AI 劳动力影响的行政令,康涅狄格州则通过了全面的 AI 监管法案,对高风险 AI 系统施加新要求。在联邦层面缺乏全面立法的背景下,州级 AI 治理正加速推进。

🚀 DeepSeek V4 预览版需求旺盛,估值目标 590 亿美元

DeepSeek 的 V4 模型预览版被 TechCrunch 评价为"缩小了与前沿模型的差距",在美国企业寻求更廉价 AI 替代方案的推动下采用率飙升——该初创公司登上了 Ramp 的 6 月热门软件供应商榜单。公司目前在首轮融资中目标估值高达 590 亿美元,远超此前报道的 70 亿美元。这一发展加剧了中美 AI 竞赛,外交关系委员会称 DeepSeek V4 是"中美 AI 竞争的新阶段"。

🔄 Google 下调 AI Plus 订阅价格;Gemini CLI 升级为 Antigravity

Google 大幅下调了 AI Plus 订阅计划的价格并翻倍提升了存储空间,在 AI 订阅价格战中发出明确信号。此外,公司宣布将 Gemini CLI 迁移至新的 “Antigravity CLI”,标志着开发者工具层面的重大转型。Marvell 也推出了面向下一代数据中心的 102.4Tbps AI 优化交换机。

简讯

  • OpenAI 已秘密提交 IPO 申请,FT 报道称其计划在上市前对 ChatGPT 进行"超级应用"式改造。Sam Altman 的眼部扫描公司 World(原 Worldcoin)据报道正在裁员。
  • 阿里巴巴 计划将 Qwen AI 集成到淘宝中实现 AI 购物助手功能,同时预告了新的 Qwen 预览版——在 Arena 排行榜上位列中国 AI 模型首位。
  • 月之暗面 (Moonshot AI) 正在解除离岸架构以推进 IPO,而 Cursor 承认其新编程模型基于 Moonshot 的 Kimi 架构构建。
  • Super Micro 宣布 70 亿美元融资计划以支持其 AI 订单积压,股价下跌 10%。
  • MCP 生态持续成熟:Pinterest 部署了生产级 MCP 系统用于 AI 代理工作流,Autodesk 帮助推动 MCP 企业级就绪。
  • 全球 AI 支出预计 2026 年增长 47%。
  • Anthropic 翻倍提升了 Claude Cowork 的免费使用额度,继续在印度等地进行全球扩张。

🤗 Hugging Face 热门模型

今日 Hugging Face 上值得关注的模型包括:unsloth/North-Mini-Code-1.0-GGUF 通过 Unsloth 量化将高效代码生成带入 GGUF 格式;weathon/kto_review_qwen35_9b 将 KTO 对齐训练应用于 Qwen 3.5。其他上传包括 johannesmichalke/place-pencil-v1.1-rlt-online-v2(RL 训练生成模型)和 Shamima/babylm-2026-multilingual-v3-quality-filter(BabyLM 数据过滤)。今日 HF 生态活动较为平静,GGUF 和对齐训练模型反映了当前模型效率优化的趋势。

🚀 OpenRouter 新模型

除上文介绍的 Claude Fable 5 外,Nex AGI: Nex-N2-Pro 已在 OpenRouter 免费套餐上线,支持 262K 上下文,为开发者提供了探索长上下文应用的零成本入口。

⭐ GitHub 趋势:AI 版

  • JimLiu/baoyu-design ★648 — 本地运行 Claude Design 作为 Agent Skill,为 Cursor、Claude Code 等工具生成 UI 原型。
  • GordenSun/GordenSuperPPTSkills ★640 — AI PPT 生成:生成豪华图片格式 PPT 并转换为完全可编辑的 PPTX。
  • amElnagdy/guard-skills ★519 — AI 生成代码的质量关卡:在 Agent 驱动开发中捕捉测试、安全和逻辑中的失败模式。
  • apple/coreai-models ★398 — Apple 端侧 AI 的模型导出、Python 工具和 Swift 运行时库,与 WWDC AI 战略相呼应。
  • xiaohuailabs/xiaohu-video-translate ★361 — AI 视频翻译工具:下载、转录、翻译、字幕、烧录一条龙,全本地零 API 费用。

💡 趋势总结

平台战争白热化——苹果的 Gemini 合作、Google 的订阅降价、Anthropic 的 Fable 5 发布,都显示 AI 公司在开发者和消费者市场上的激烈竞争。州级监管加速——加州、康涅狄格州和台湾在同一天推进 AI 治理措施,填补联邦政策真空。基础设施投资创新高——软银 750 亿欧元的法国数据中心、Super Micro 的 70 亿美元融资、Marvell 的 102.4Tbps 交换机,都指向一个无减速迹象的超大规模资本支出周期。苹果终于加入 AI 对话——WWDC 2026 标志着苹果最激进的 AI 转型,既利用 Google 的基础设施又保持品牌独立性。