🚀 OpenAI、新フラッグシップモデル「GPT-5.5 “Spud”」をリリース
OpenAIは最新のフラッグシップ大規模言語モデル GPT-5.5(コードネーム"Spud")を正式にリリースしました。本モデルはChatGPTのデフォルトモデルとなり、APIでも利用可能です。初期ベンチマークでは、推論・コーディング・長文脈タスクにおいてGPT-5からの大幅な改善が確認されています。
同時にOpenAIは、GPT-5.5を搭載したサイバーセキュリティプラットフォーム Daybreak を発表。ソフトウェアの脆弱性を自動的に発見・検証し、従来のツールと比較して7倍以上の欠陥を発見したと報告されています。注目すべきは、OpenAIがGPT-5.5自身にリリースパーティーの計画を任せたことです。
さらに低レイテンシー版の GPT-5.5 Instant もリリースされ、Databricksは早期にエンタープライズエージェントワークフローへの統合を発表しました。
⚠️ Anthropic、ハッキング能力が高すぎる「Mythos」モデルの公開を保留
Anthropicは「史上最も強力なAIモデル」とされる Mythos を開発しましたが、その卓越したサイバーセキュリティ攻撃能力を懸念し公開を保留しています。NYT、Axios、Fortuneの報道によると、Mythosは主要システム全体で数千ものゼロデイ脆弱性を発見し、AppleのmacOSセキュリティスタックも突破しました。
この決定はサイバーセキュリティコミュニティに衝撃を与えています。米国の銀行はMythosが特定した脆弱性の修正を急いでおり、Anthropicはグローバル金融監視機関と調査結果を共有しています。The GuardianやNYTは、Mythosがサイバーセキュリティの「決算の時」なのか、技術流出時の潜在的脅威なのかを問う複数の記事を掲載しています。
🏛️ 米ホワイトハウス、AIモデルの公開前審査を検討
ホワイトハウスは、高度なAIモデルに対する公開前の政府審査を義務付ける提案を検討しています。NYTが初めて報じ、Reuters、Bloomberg、CNBCもこれを確認しました。この計画では、Google、Microsoft、xAIなどのモデルが公開前に連邦政府のセキュリティテストを受ける可能性があります。
この提案には賛否両論の反応があり、一部の政策専門家は必要な安全策と評価する一方、アメリカン・エンタープライズ研究所は「悪い政策」と批判しています。Politicoの複数の報道によると、ホワイトハウスの「組織力不足」にAIロビイストが懸念を抱いており、政府はすでに一部モデルのパイロットテストを開始しています。
💰 OpenAI、ChatGPT Proに銀行口座連携のパーソナルファイナンス機能を提供
OpenAIは ChatGPT Pro サブスクライバー向けにパーソナルファイナンスダッシュボードを展開し、銀行口座の接続とAIによる財務分析を可能にしました。ユーザーはChatGPTインターフェース内で支出を追跡し、財務に関する質問をし、パーソナライズされた推奨を得られます。
TechCrunchが最初に報じたこの機能は、ChatGPTをMintやYNABのようなアプリと競合する消費者向け金融ツールとして位置づけています。Plaidなどのミドルウェアを介した読み取り専用の銀行アクセスを採用しています。
🔧 Google、MarvellとカスタムAI推論チップの開発で提携へ
Alphabetは Marvell Technology とカスタムAI推論チップの設計・製造について高度な協議を行っていると、ReutersとThe Informationが報じています。この動きにより、GoogleのAIハードウェアサプライチェーンは自社TPU(Broadcomとの提携)に加えて多様化し、Nvidia GPUへの依存度を低減できます。
このニュースを受けてMarvellの株価は急上昇しました。これらのチップは推論ワークロード(すでにトレーニング済みのモデルを実行)に焦点を当てており、Nvidiaが依然として支配的だが競争が激化している分野です。
🎬 Runwayが3億1500万ドルを調達、GoogleやOpenAIのAI動画分野に挑戦
AI動画生成スタートアップ Runway は3億1500万ドルの資金調達ラウンドを完了し、GoogleのVeoやOpenAIのSoraに対抗する姿勢を示しています。CNBCによると、Runwayの最新モデルは主要な動画生成ベンチマークでGoogleとOpenAIの両方を上回っています。
また、Runwayは1000万ドルのBuildersプログラムを開始し、初期段階のAIスタートアップを支援することで、コアの動画ツールを超えたエコシステム構築の野心を示しています。
📚 arXiv、AIが執筆した論文の投稿者を1年間禁止へ
プレプリントリポジトリ arXiv は、主にAIが執筆した論文を提出したことが判明した著者に対して1年間の投稿禁止処分を科す厳格な新ポリシーを発表しました。TechCrunch、The Verge、404 Mediaが報じたこの措置は、AI生成の「粗悪な論文」が学術投稿に氾濫していることを受けたものです。
この禁止令は、大規模言語モデルを使用して実質的なコンテンツを生成し、意味のある人間の貢献がない論文に適用されます。編集や文法支援のための通常のAI利用は引き続き許可されます。
🤖 マイクロソフトAI責任者「18ヶ月以内にすべてのホワイトカラー業務が自動化される可能性」
マイクロソフトのAI責任者 Mustafa Suleyman 氏は、AIが18ヶ月以内にすべてのホワイトカラーのデスクワークを自動化できるようになると予測しました。Fortuneのインタビューで、Suleyman氏はほとんどの知識作業がAIエージェントによって処理され、人間は監督と創造的役割に移行する未来を描きました。
この大胆な予測はテック業界で議論を巻き起こしており、一部のアナリストはタイムラインの現実性に疑問を呈する一方、モデル改善の急速なペースを裏付けとして指摘する声もあります。
⏰ 期間限定無料モデル(近日終了)
OpenRouterで提供されている以下の無料枠モデルがまもなく終了します:
| モデル | 期限 | 価格 | コンテキスト長 |
|---|---|---|---|
| Arcee AI: Trinity Large Preview | 5月22日(残2日) | $0.15/$0.45 100万トークンあたり | 131K |
| Mistral: Mistral 7B Instruct v0.1 | 5月30日(残10日) | $0.11/$0.19 100万トークンあたり | 4K |
| Google: Gemini 2.0 Flash Lite | 6月1日(残12日) | $0.075/$0.30 100万トークンあたり | 1M |
| Google: Gemini 2.0 Flash | 6月1日(残12日) | $0.10/$0.40 100万トークンあたり | 1M |
🤗 Hugging Faceで注目のモデル
今サイクルで注目すべきHugging Faceの新モデル:
- PeterPanonly/Qwen2.5-VL-3B-Instruct-Thinking-SubQ — GRPOでファインチューニングされた視覚言語モデル、サブクエスチョン推論に最適化
- juergengunz/fluxer — コミュニティで人気(5いいね)、FluxモデルのLoRAまたは派生版と見られる
- yalen-ai/distilbert_pii_ner_yalen — Yalen AIによる個人識別情報(PII)固有表現認識モデル、ONNX展開に対応
- iamseungpil/metacot-h200-rod-pt-R10v2-0512 — H200ハードウェア上でのMeta-CoTトレーニングチェックポイント
⭐ GitHubトレンド:AI版
- yaassin12/DeepSeek-V4-Pro-App ⭐ 617 — DeepSeek V4 ProのC++製デスクトップアプリ、1.6T MoEアーキテクチャ、100万トークンコンテキスト、エージェンティックコーディング機能を搭載
- mikesheehan54/Claude-Code-Design-AI ⭐ 404 — Claude Codeを使用したTypeScript製AI UI/UXアーキテクト:スクリーンショットからReact、Tailwind CSS、shadcn/uiへの変換を実現
💡 主要トレンド
本日のニュースは、あらゆる面で加速する業界の姿を描き出しています:フロンティアモデルのリリース(GPT-5.5、Mythos)、規制圧力(ホワイトハウスの公開前審査)、ハードウェアの多様化(Google × Marvell)、コンシューマーAIの拡大(ChatGPTファイナンス)。特にMythosの事例は、サイバーセキュリティにおいて非常に強力であるがゆえに開発者が公開を控えたという点で、責任ある能力開発に関するグローバルな議論を引き起こす転換点となっています。