電時流⚡️
Posts
ついに読む価値のあるGPT-4.5のレビューが登場

ついに読む価値のあるGPT-4.5のレビューが登場

また、Amazonが独自のハイブリッド推論モデルを開発中との報道

Jack Lajoie
March 05, 2025 • 読了時間4 minutes

⚡️ 見出し

🤖 AI

裁判所、イーロン・マスクのOpenAI営利化阻止の要求を却下、しかし裁判は歓迎 - 連邦裁判所は、OpenAIの営利化を阻止するイーロン・マスクの要求を却下したが、マスクがOpenAIとCEOのサム・アルトマンに対して提起した契約違反の訴訟を迅速に進めることを提案した。[Associated Press]

Nvidia支援のCoreWeave、AI開発プラットフォームWeights & Biasesを買収へ - CoreWeaveは、AIモデルのトレーニングサービスとクラウドインフラを統合するため、Weights & Biasesを約17億ドルで買収する計画。[Reuters]

AmazonのAWS、新たにエージェント型AIに特化したチームを設立 - Amazon Web Servicesは、ユーザーの指示なしにタスクを自動化できるエージェント型AIの開発に特化した新チームを設立し、顧客に新たな可能性を提供することを目指す。[Reuters]

Turnitin、新プラットフォーム「Canvas」で学生のAI活用を支援 - Turnitinは、学生が承認されたAIツールを活用しながら課題を進めることを可能にするオンラインプラットフォーム「Turnitin Clarity」を発表。教育者はAI支援を受けた作業を監視・評価できる。[Axios]

Googleの「Pixie」アシスタント、Pixel 10で「Pixel Sense」として登場か - Googleは、Pixel 10向けに「Pixel Sense」を導入予定と報道。これは、Googleアプリのデータを活用して文脈に応じた予測を提供するオンデバイスAIアシスタントで、完全オフライン動作によりプライバシーを確保する。[Android Authority]

AIモデル、楔形文字を精密に複製可能に - 研究者らが「ProtoSnap」と呼ばれるAI技術を開発し、古代の楔形文字をタブレットの画像から精密に複製できるように。これにより、楔形文字の自動コピーや解読が促進される。[Phys.org]

🤳 ソーシャルメディア

デジタルサービス法（DSA）：TikTok、欧州でのコンテンツ管理に関する第4回透明性レポートを公開 - TikTokは、欧州におけるコンテンツ管理の透明性レポートを発表。約1,800万件の違反コンテンツを削除し、透明性向上のための新たな指標を導入した。[TikTok Newsroom]

YouTube、特定のオンラインギャンブルサイトの言及を禁止へ - YouTubeは、3月19日からクリエイターが非Google認可のギャンブルサービスについて言及、ロゴ表示、リンク掲載することを禁止。特に若年層の保護を目的とする。[The Verge]

🔬 研究

Aya Vision：AIが「見られる世界」を拡張 - Cohereの研究部門「Cohere For AI」は、世界3,000人以上の研究者と協力して「Aya Vision」というデータセットを開発。多言語対応と非西洋言語のデータ不足解消を目指す。[Cohere]

NextGenAI：AI研究と教育を加速するコンソーシアムが発足 - OpenAIは、15の主要研究機関と協力し「NextGenAI」を設立。研究の飛躍的進展と教育分野でのAI活用促進のため、5,000万ドルの資金提供とツールの提供を約束。[OpenAI]

DiffRhythm：爆速かつシンプルなエンドツーエンド楽曲生成AI - 研究者らが「DiffRhythm」というモデルを発表。潜在拡散技術を活用し、ボーカルと伴奏を含むフル楽曲を10秒以内で生成可能。高い音楽性と明瞭さを維持する。[ASLP Lab]

⚖ 法律

Google、米政府に対し企業分割回避を要請 - Googleは、検索および広告技術を巡る反トラスト訴訟の中で、米政府に対し企業の分割措置を避けるよう説得。経済および国家安全保障への影響を懸念。[Reuters]

🎱 その他

NothingのPhone 3A / 3A Pro、AIによる情報整理機能「Essential Space」を搭載 - Nothing Phone 3Aおよび3A Proは、AIを活用して重要な情報を効率的に整理できる「Essential Space」を導入。価格は379ドルから。[The Verge]

🔌 これに接続して

GPT-4.5について

Zvi Mowshowitz氏がGPT-4.5のリリースについて分析し、その知能が実質的な飛躍なのか、高コストの失敗なのか、または全く別のものなのかを検討している。最終的に、GPT-4.5は言語的知能、文脈適応、そして美的感覚に優れているものの、推論やコード生成には向かないと結論付けている。OpenAIの戦略、価格設定、そしてこのモデルが「フロンティアモデル」に分類されるかどうかについても議論が巻き起こっている。

異なる種類の知能: GPT-4.5は、執筆の質、美的感覚、文脈認識に優れているが、従来の推論能力には欠けるとされる。サム・アルトマン氏自身も「推論モデルではない」と警告しており、主要なベンチマークでトップに立つことはない。
価格とアクセスの問題: モデルのコストが高く、OpenAIがAPI提供を続けるかどうか決めかねていることから、その計算コストの持続可能性が疑問視されている。Mowshowitz氏は、GPT-4.5が実際にはかなり前に訓練されていたが、コストの問題でリリースが遅れた可能性があると指摘する。
ベンチマークと評価の課題: GPT-4.5の強みを標準的なベンチマークでは測れない。ニュアンスや「センス」が求められるタスクでは優れた成果を出すが、数学や技術的な評価では期待外れとされる。業界には、このようなモデルを適切に測定するためのツールが不足しているという批判もある。
賛否の分かれる評価: Tyler Cowen氏のように「思慮深い人と話しているようだ」と絶賛する声がある一方で、動作の遅さ、高コスト、能力面での限界を批判し、OpenAI初の大失敗と見る意見もある。
今後のAIモデルへの影響: GPT-4.5のリリースは、OpenAIの戦略的方向性に疑問を投げかける。Mowshowitz氏は、このモデルの強みが、今後は単一の万能AIではなく、複数の特化型モデルが統合される未来を示唆している可能性があると述べている。

i've been testing gpt 4.5 for the past few weeks.
it's the first model that can actually write.
this is literally the 9/11 for writing
(this is the output when I asked to generate a nobel-grade poem)
— orph (@orphcorp)
9:58 PM • Feb 27, 2025

🧩 GPT-4.5は期待されたような革命的な進化ではないかもしれないが、高品質で文脈を考慮したテキストを生成できることから、AIの評価基準が単なる論理や推論能力だけでなく、人間らしい対話や説得力にシフトしつつあることを示唆している。

Amazon、独自のAI推論モデルを開発中か

Amazonは「Nova」というコードネームの新AIモデルを開発しており、推論能力を強化し、OpenAIやAnthropicと競争することを目指している。このモデルは「ハイブリッド推論」アプローチを採用し、高速な応答と複雑な思考の両方を実現する設計となっている。Novaは2025年6月までにリリースされる見込み。

ハイブリッド推論アプローチ: Novaのアーキテクチャは、簡単な質問には迅速に答え、複雑な問題にはより深い分析を行うことを可能にする。
競争戦略: AmazonはNovaを、コード生成、関数呼び出し、数学的推論のベンチマークでトップ5に入ることを目標にしており、OpenAIのGPTシリーズやAnthropicのClaude 3.7 Sonnetと直接競合するモデルとして位置付けている。
コスト効率の向上: Novaの開発チームは、既存のAIモデルよりもコストを抑えつつ、高性能を実現することに注力している。これにより、企業や開発者にとってより手頃な選択肢となる可能性がある。
リーダーシップと開発体制: このプロジェクトはAmazonのAGI（汎用人工知能）チームが主導し、リーダーはRohit Prasad氏。AmazonのAI戦略の中核を担うプロジェクトとなっている。

Amazon is reportedly developing a cost-efficient, hybrid-architecture “reasoning” model under its Nova brand to compete with models like OpenAI’s o3-mini, DeepSeek’s R1, and Anthropic’s Claude 3.7 Sonnet, with a potential launch as soon as June
— Tibor Blaho (@btibor91)
7:48 PM • Mar 4, 2025

🚀 NovaはAmazon Web Services（AWS）に統合される予定で、プラットフォームのAI機能を強化し、顧客に高度な推論能力を提供することを目指している。

世界初の「合成生物知能」、人間の脳細胞で稼働

Cortical Labsは、シリコンハードウェアと人間の脳細胞を統合した世界初の商用「生物コンピューター」CL1を発表。この合成生物知能（SBI）システムは、従来のAIモデルよりも適応力が高く、持続可能でエネルギー効率に優れている。CL1は今後数カ月以内に利用可能になる予定。

高速学習と適応: CL1の脳細胞ニューラルネットワークは、従来のシリコンベースのAIチップよりも迅速かつ柔軟に学習し、大規模言語モデルの訓練に優れた性能を発揮。
統合設計: CL1は、安定したハードウェアと最適化された「ウェットウェア」—培養された人間の脳細胞—を組み合わせ、リアルタイムで制御可能なニューラルネットワークを実現。
サーバースタック展開: Cortical Labsは30台のユニットで構成される生物ニューラルネットワークサーバースタックを構築中で、近日中に稼働予定。
倫理的議論: CL1の開発は、人間の細胞をコンピュータに組み込むことの倫理的な問題を引き起こしている。

it's here!
cortical labs just launched the first commercial biological computer
human neurons directly integrated onto silicon chips. programmable and adaptive, living computation
synthetic biological intelligence
1/
— vittorio (@IterIntellectus)
3:49 PM • Mar 4, 2025

🧠 これは『マトリックス』の見過ぎでは？シリコンベースのコンピュータより効率が悪いことを祈るばかり…🤣😳🦠

🆕 更新

we are likely going to roll out GPT-4.5 to the plus tier over a few days.
there is no perfect way to do this; we wanted to do it for everyone tomorrow, but it would have meant we had to launch with a very low rate limit.
we think people are gonna use this a lot and love it.
— Sam Altman (@sama)
11:23 PM • Mar 4, 2025

Woow Google has just transformed data analysis
Gemini in Colab can now plan, analyze, visualize and write Python code autonomously.
This dataset of over 65,000 rows was processed without a hitch 🔥
More below
— Paul Couvert (@itsPaulAi)
7:18 PM • Mar 4, 2025

Excited to announce Claude 3.7 Trend Finder 🔦
Use Anthropic's new model to monitor & extract trends on blogs and socials with @firecrawl_dev and the X API.
It collects posts from key influencers and sites, tracks the latest trends, and then pings you on Slack or Discord.
— Caleb Peffer (Hiring!) (@CalebPeffer)
5:02 PM • Mar 4, 2025

📽️ 毎日デモ

Wow. This is one of the best AI hybrid commercials I've ever seen.
Rufus Blackwell shot this partially live-action (opening and closing shots) and did a ton of keyframe AI animation.
They probably saved $100K and four weeks of VFX work by doing this as a hybrid commercial.
— PJ Ace (@PJaccetturo)
5:58 PM • Mar 4, 2025

🗣️ 対話

That was a lot of fun! So exciting to be working with the most brilliant students and collaborators in spatial intelligence and robotic learning 🤩
— Fei-Fei Li (@drfeifei)
2:33 AM • Mar 5, 2025

I mined Andrej Karpathy's "How I use LLMs" video for some addition things he does and I've updated the diagram.
Using multiple LLMs as an "LLM council"
Consults multiple LLMs by asking them the same question and synthesizes the responses. For example, when seeking travel… x.com/i/web/status/1…
— Carlos E. Perez (@IntuitMachine)
10:40 AM • Mar 4, 2025

NVIDIA is a $3 trillion giant, controlling 80% of the AI chip market.
No one could touch them.
Then came Groq... A tiny hardware startup that claimed they could outperform NVIDIA’s AI chips.
Nobody believed them. This story is wild: 👇
— EyeingAI (@EyeingAI)
11:37 AM • Mar 4, 2025