- 電時流⚡️
- Posts
- OpenAI、o3を発表、GPT-5は予定より遅延
OpenAI、o3を発表、GPT-5は予定より遅延
また、Googleは新たにAI専用の検索タブを計画中

⚡️ 見出し
🤖 AI
AIはMarc Benioffの友でもあり敵でもある - SalesforceのCEOであるMarc Benioffが、AIがもたらす技術業界での課題と機会の両面を乗り越えています。[The Information].
Backflip、テキストを物理的な現実に変えるAIモデルを発表。NEAとAndreessen Horowitzから3000万ドルの支援を受ける - スタートアップのBackflipが、テキストの説明を具体的なオブジェクトに変換するAIモデルを発表し、著名なベンチャーキャピタルから3000万ドルの資金を調達しました。[Business Wire].
OpenAI、Googleを凌ぎ出版社との提携を進める - OpenAIは主要出版社との提携を獲得し、AIコンテンツ分野でGoogleに対する競争優位性を確立しています。[The Information].
🦾 新興技術
トランプ氏、AI担当官にSriram Krishnan氏を任命。MAGAからの反発 - ドナルド・トランプ次期大統領が、チェンナイ出身のベンチャーキャピタリストSriram Krishnan氏をホワイトハウスのAI政策顧問に任命し、MAGA支持者の間で議論を巻き起こしています。[Times of India].
NHTSA、自動運転車規制の枠組みを推進 - 米国家道路交通安全局(NHTSA)が、自動運転車に関する規制枠組みの確立に向けて大きな一歩を踏み出しました。[The Verge].
🤳 ソーシャルメディア
MrBeast、ギザの大ピラミッドで100時間のYouTube動画撮影を計画 - YouTuberのMrBeastがギザの大ピラミッドで100時間の動画撮影を行う壮大なプロジェクトを発表しました。[Newsweek].
Instagram、AI動画生成ツールのプレビューを公開 - Instagramが、ユーザー生成コンテンツを一新するAI駆動の動画編集機能を予告しました。[Social Media Today].
Bluesky、スポーツ愛好者向けの有望なSNSプラットフォームに - Blueskyが、スポーツファンが代替ソーシャルメディア体験を求めるための有望なプラットフォームとして浮上しています。[Bloomberg].
🔬 研究
どうやらこれがAIを脱獄する方法らしい - 研究者たちは、AIの安全対策を回避する方法を実証し、現行のAIシステムに潜む脆弱性を明らかにしました。[404 Media].
⚖ 法律
Google、司法省の検索配信訴訟への是正提案を発表 - Googleは、司法省による独占禁止訴訟への対応として、検索配信の取り組みに調整を加える提案を発表しました。[Google Blog].
アルバニア、ティーンエイジャー殺害事件を受けTikTokを1年間禁止 - アルバニアは、ティーンエイジャーの悲劇的な死を受けて、TikTokの影響が若者の暴力に及ぼす影響を懸念し、1年間の禁止を発表しました。[Reuters].
🎱 その他
テキサス・インスツルメンツ、CHIPS法の支援を受け16億ドルを獲得 - テキサス・インスツルメンツが、半導体製造を強化するためのCHIPS法による16億ドルの資金を確保しました。[Bloomberg].
ブリタニカ、AIを活用 - ブリタニカ百科事典が、コンテンツ作成とキュレーションのプロセスを向上させるためにAIを統合しました。[The New York Times].
🔌 これに接続して
OpenAIは、AIの推論力と問題解決能力を向上させることを目的とした「o3」および「o3-mini」モデルを発表しました。このモデルは現在テスト段階にあり、2025年1月に「o3-mini」、その後「o3」の完全版がリリースされる予定です。

高度な推論能力: o3は、論理的で段階的な問題解決を要するタスクで優れた性能を発揮します。
精度の向上: 推論ベンチマークで従来モデルの3倍のスコアを達成。
テスト段階: OpenAIは、2025年1月10日まで外部テスターの申し込みを受け付けています。
名称の決定: 商標権の問題を避けるため、「o2」という名前はスキップされました。
安全性の革新: 熟考型アライメントなどの機能により、モデルの信頼性が向上。
Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3
— OpenAI (@OpenAI)
7:16 PM • Dec 20, 2024
🧠 o3は、AI推論分野でOpenAIのリーダーシップを強化しており、この分野での覇権を確固たるものにする動きと見られています。ただし、GoogleのFlashモデルとの競争が激化しています。
OpenAIが開発中のGPT-5(コードネーム: Orion)は、進捗の遅れやコスト増加の影響を受け、その完成と実効性に不確実性が生じています。

開発期間の延長: 開発開始から18ヶ月以上が経過しており、2024年中頃のリリースが期待されていましたが、予期せぬ課題により延期されています。
リソース不足: データ不足の可能性が懸念されており、目標とする知能レベルの実現が困難になる恐れがあります。
財政的影響: GPT-5の開発に伴うコスト増加がOpenAIの予算を圧迫しており、プロジェクトの持続可能性が問われています。
戦略的パートナーシップ: Microsoftがこのモデルの2024年中頃のリリースを期待していることから、プロジェクトの重要性が浮き彫りになっています。
技術的野心: GPT-5は、ChatGPTで確立された基盤をもとに、AI能力を大幅に進化させることを目指しています。
Why no GPT-5? Because training runs are falling short of expectations
— Tsarathustra (@tsarnick)
10:59 AM • Dec 22, 2024
⏱️ 競合他社がOpenAIのリードを各分野で急速に縮めている中、新モデルの早期リリースが求められています。「収穫逓減の時代」がAI業界に訪れるのではないかという議論も行われていますが、2025年がこの業界にとって現実を直視する年になる可能性があります。
Googleは、AI生成の回答を専用タブで提供する「AIモード」を検索エンジンに導入する計画を進めています。

専用AIタブ: 「AIモード」は、「すべて」「画像」「動画」といった既存のカテゴリに加え、AI生成回答用の専用インターフェースを提供します。
会話型インターフェース: このモードはGoogleのGemini AIチャットボットに似たチャット形式での検索体験を提供します。
情報元の統合: AI生成の回答には関連するウェブページのリンクが含まれ、ユーザーが元のコンテンツにアクセスできるようにします。
追跡質問機能: AIモード内の検索バーにより、ユーザーは追跡質問を行い、トピックをさらに深掘りすることができます。
音声コマンド対応: 将来のアップデートでは、音声コマンドを使用したAIモードとのインタラクションが可能になる予定です。
𝐆𝐨𝐨𝐠𝐥𝐞 𝐀𝐈 𝐌𝐨𝐝𝐞 𝐂𝐨𝐦𝐢𝐧𝐠 𝐒𝐨𝐨𝐧
According to The Information, Google is planning to introduce a new "AI Mode" feature to its search engine, which will be accessible through a dedicated tab within the results page. This feature allows users to interact with AI in… x.com/i/web/status/1…— TechBuzzRecap (@TechBuzzRecap)
5:47 AM • Dec 22, 2024
🔎 Googleの現実的な一手と言えるでしょう。今年初め、Geminiによるサマリーが全検索に追加されたことへの反発は大きなものでした。リンクのインデックス形式と要約形式の両方が現代の検索において役割を果たすことは間違いありません。
🆕 更新
Metaは、Ray-Ban Metaスマートグラスをアップデートし、リアルタイムAIビデオ処理とライブ言語翻訳を搭載しました。
注目ポイント
ユーザー体験の向上: リアルタイムAIビデオにより、ユーザーは周囲の情報を即座に得ることができ、状況認識が強化されます。
シームレスなコミュニケーション: 英語、スペイン語、フランス語、イタリア語に対応したライブ翻訳が、言語の壁を超えた会話を可能にします。
機能の統合: 音楽識別機能のShazam統合により、グラスの機能性が拡張されます。
ハンズフリーの利便性: 音声コマンドとAIアシスタントにより、手を使わずに技術と対話可能。
競争力の向上: これらの進化により、Metaのスマートグラスはウェアラブル技術市場でトップの選択肢となります。
TencentのHunyuanVideoモデルは、オープンソースでローカル実行可能なAI動画生成ツールを提供開始。24GBのVRAM GPUなどのハードウェアで実行可能で、柔軟な微調整機能と非検閲の出力対応により、創造的でフィルタリングのない動画プロジェクトにアクセス可能です。
注目ポイント
アクセシビリティ: 無料配布とローカルハードウェア対応により、幅広い実験が可能。
カスタマイズ性: 微調整やLoRA互換性により、特定のタスクに最適化できます。
創造的可能性: 非検閲対応とリアルなレンダリングにより、芸術的・実験的用途が広がります。
コスト効率: 多くのクラウドサービスを必要とせず、適切なハードウェアがあれば運用コストを削減。
トレンド指標: 個人クリエイターを支援するオープンAIツールへのシフトを反映。
📽️ 毎日デモ
This is crazy.
You can create these attention-grabbing catwalks and showcase your products in completely new ways.
The best part is that you only need two tools.
— Halim Alrasihi (@HalimAlrasihi)
5:49 PM • Dec 23, 2024
AIコンテンツツールは、私たちが期待していた「オールインワン」ソリューションに向けて着実に進化しています。以下のYouTubeデモでは、話題の2つのツールに関する詳細な機能を掘り下げています。
🗣️ 対話
Veo 2は発売から1週間以上経った今でもX上で注目を集めており、AIへの期待感はワークフローを自動化するエージェントの可能性に焦点を移しています。
Google Veo 2 is insane.
You can create stunning visuals just from texts.
No cameras, no actors, no sets, just words to cinema (with editing).
Should Hollywood be worried?
10 wild examples:
— Min Choi (@minchoi)
6:36 PM • Dec 23, 2024
The future of AI in operations isn’t just about automating tasks—it’s about transforming internal work into scalable, flexible workflows.
@kimberlywtan explains how AI is fulfilling RPA’s promise: youtube.com/watch?v=O6DtzL…
— a16z (@a16z)
1:44 PM • Dec 23, 2024
All you need it @cursor_ai Full Autonoumous Agentic demo! 🥳 cursorrules in comment
Using Yolo mode and my cursorrules Cursor becomes a generalist Agent, writes its own tools and executes the automatically, performs any task imaginable! 🚀
🌟 Yolo Mode: Turn this on under… x.com/i/web/status/1…
— echo.hive (@hive_echo)
7:15 PM • Dec 22, 2024