GoogleのGemma 3が登場

また、OpenAIがエージェント作成向けの幅広いSDKをリリース

⚡️ 見出し

🤖 AI

Nvidiaの「Project Osprey」がCoreWeaveの台頭を加速 - Nvidiaの戦略的取り組み「Project Osprey」は、クラウドサービスプロバイダーCoreWeaveの急成長に重要な役割を果たした。[The Information]。

Rekaが「Reka Flash」AIモデルを発表 - AI企業Rekaが、新たなAIモデル「Reka Flash」を発表。処理速度と効率の向上を目的としている。[Reka.ai]。

Metaが初の自社開発AIトレーニングチップのテストを開始 - Metaは、パフォーマンス向上と外部供給への依存低減を目的に、自社開発のAIトレーニングチップのテストを開始。[Reuters]。

AnthropicのClaudeが売上成長を牽引、「Manus」人気を支える - AnthropicのAIモデルClaudeは、人気AIエージェント「Manus」を支えながら、同社の収益成長を大きく押し上げている。[The Information]。

中国のManus AIがAlibabaのQwenチームと提携、拡大を目指す - Manus AIは、AlibabaのQwenチームと戦略的提携を結び、AI能力の向上と増加するユーザー需要への対応を図る。[Reuters]。

AIブームの陰でガジェット市場が低迷:「まさに血の海」 - AIの進化が従来のデバイスを圧倒し、消費者向けガジェット市場が停滞。業界全体に深刻な課題をもたらしている。[Bloomberg]。

GoogleがOpenAIのライバルAnthropicにさらに10億ドルを投資 - Googleは、AIスタートアップAnthropicへの投資をさらに10億ドル追加し、AI業界の競争を激化させている。[The New York Times]。

🦾 新興テクノロジー

アメリカは新たな労働経済を見失っている – ロボティクス編 Part 1 - 米国は、ロボティクスや自動化技術の導入不足により、進化する労働経済で遅れを取るリスクがある。[SemiAnalysis]。

上院議員Lummisが「Bitcoin Act」を再提出、米国政府が800億ドル分のBTC購入を検討 - 上院議員Cynthia Lummisが、米国政府が戦略的準備金として800億ドル分のビットコインを購入することを提案する法案を再提出。[Decrypt]。

🤳 ソーシャルメディア

LinkedInがAI広告ターゲティング機能を拡充 - LinkedInは、広告プラットフォームを強化し、AI駆動のターゲティング機能を追加。広告のリーチと効果を向上させる。[Social Media Today]。

🔬 研究

AI検索には引用の問題がある - 調査によると、現在のAI検索エンジンはニュースソースの正確な引用が苦手であり、情報の信頼性に懸念が生じている。[Columbia Journalism Review]。

⚖ 法律

Harveyにエージェント機能が登場 - Harveyは、新たなAIエージェントを発表。法律専門家と協力し、文書作成やリサーチ業務を効率化することを目的としている。[Harvey.ai]。

🔌 これに接続して

Googleは、これまでの成功を踏まえたオープンAIモデルの次世代版「Gemma 3」を発表した。Gemma 3は、Geminiモデルと同じ研究と技術を基盤に構築されており、責任あるAI開発を促進しながら、最先端のパフォーマンスと効率性を提供することを目指している。新モデルは開発者や研究者向けのアクセシビリティ向上に重点を置き、推論能力の向上や複数のAIフレームワークとの統合を強化している。

  • 大規模モデルサイズ & 強化されたパフォーマンス: Gemma 3は従来のバージョンよりもスケールアップし、より高い効率性と多様なAIタスクにおける高品質な応答を実現。

  • ハードウェア最適化の向上: NVIDIA GPUやGoogle Cloud TPU上で効率的に動作するよう設計されており、デプロイコストを削減しながら高いパフォーマンスを維持。

  • 責任あるAI & 安全性の強化: Googleは、機密データのフィルタリング、人間のフィードバックを活用した強化学習(RLHF)、対抗テストなどを導入し、倫理的なガイドラインに沿った出力を保証。

  • 開発者ツールとのシームレスな統合: JAX、PyTorch、TensorFlowなどのフレームワークと互換性があり、Google AI Studio、Vertex AI、Hugging Faceなどのプラットフォーム上で簡単に展開可能。

👐 Gemma 3は、コーディング支援、マルチモーダル推論、リアルタイムAI対話など、幅広いアプリケーションをサポートし、より大規模な独自モデルに匹敵する競争力を持つ。また、効率性の向上にも注目が集まる。

OpenAIは、自律型AIエージェントの開発を簡素化する新たな開発ツール群を発表。これにより、企業や開発者が高度なAI機能をアプリケーションに統合し、生産性と効率性を向上させることが可能になる。

  • Responses API: Chat Completions APIのシンプルさと高度なツール利用機能を統合。Web検索、ファイル検索、コンピュータ操作などのタスクをシームレスに実行可能なエージェントの構築を支援。

  • 組み込みツール: Web検索、ファイル検索、コンピュータ操作の機能をAPIに統合し、リアルタイム情報の取得、ファイルの検索・処理、デバイス上でのタスク実行を自動化。

  • Agents SDK: 単一エージェントおよびマルチエージェントワークフローの管理を支援し、タスクの調整を効率的に行うための開発ツールを提供。

  • 可観測性ツール: エージェントのワークフローを監視し、パフォーマンスの分析やデバッグ、最適化を容易にする監視機能を統合。

  • Assistants APIからの移行: OpenAIは2026年半ばまでにAssistants APIを廃止し、より多機能なResponses APIへの移行を推奨。

🤖 2025年は「エージェントの時代」と言われてきたが、ついに本格化!先週、中国のManusが(透明性の欠如はあるものの)印象的なデモを披露したが、OpenAIは開発者向けの強力なツール群を提供することで、同様の能力を持つエージェントの開発を後押ししている。

Luma AIは、従来の拡散モデルの限界を超え、生成AIモデルを強化する新しい事前学習手法「Inductive Moment Matching(IMM)」を発表。IMMは、リッチなマルチモーダルデータの可能性を最大限に引き出し、サンプリング効率と安定性を向上させることを目的としている。

  • サンプリング効率の向上: IMMは、拡散モデルと比較してより高品質なサンプルを生成しつつ、10倍以上のサンプリング効率を実現。

  • 安定したトレーニングダイナミクス: 一貫性モデルとは異なり、特殊なハイパーパラメータ調整が不要であり、単一の目的関数を用いることでさまざまな環境での安定性を確保。

  • 革新的な推論アプローチ: 推論時に現在のタイムステップとターゲットタイムステップの両方を処理することで、各イテレーションの柔軟性を高め、最先端のパフォーマンスと効率性を実現。

  • 優れた性能指標: ImageNet 256x256データセットにおいて、IMMは8ステップでFrechet Inception Distance(FID)1.99を達成し、拡散モデル(2.27 FID)やFlow Matching(2.15 FID)を上回る。CIFAR-10データセットでは、2ステップで1.98 FIDを記録し、スクラッチから学習したモデルとして最先端の結果を示した。

  • オープンアクセスリソース: Luma AIは、IMMのコード、チェックポイント、技術論文を公開し、さらなる研究と開発を促進。

🔄 IMMは、従来の拡散モデルを超えてマルチモーダルデータの可能性を最大限に引き出す、新たな生成事前学習のパラダイムシフトをもたらす。これにより、マルチモーダルインテリジェンスの分野がさらに前進することが期待される。

 🆕 更新

📽️ 毎日デモ

🗣️ 対話