- 電時流⚡️
- Posts
- AnthropicのCEO、ダリオ・アモデイ、「解釈可能性」についての考えを語る
AnthropicのCEO、ダリオ・アモデイ、「解釈可能性」についての考えを語る
また、PerplexityのCEO、アラヴィンド・スリニヴァスがGoogleとの戦争について語る

⚡️ 見出し
🤖 AI
Meta、チャットボットの性的・暴力的なライン超えに苦戦 – MetaのAIチャットボットは、性や暴力に関わるユーザーインタラクションの管理に予想外の課題に直面している。[WSJ]
無馬車自動車とAI – このエッセイは、自動車に関する初期の誤解と、今日のAIに対する誤解を比較している。[Koomen.dev]
チャット・ハウスへようこそ:AIチャットボットのコワーキングスペース – 新たなスタートアップが、AIエージェントと人間が一緒に「働く」コワーキングスペースを開設。[TechCrunch]
イーロン・マスクのxAI Holdings、200億ドル調達交渉中 – マスクのAI企業が、競争の激しいAI市場で大規模な資金調達を目指している。[Bloomberg]
AIアニメーションスタートアップCheehoo、Greycroftから1,000万ドル調達 – CheehooがAI駆動型アニメーションプラットフォーム拡大のための資金を確保。[TechCrunch]
新しいAI計算:Googleの80%コスト優位 vs OpenAIのエコシステム – Googleの運用コスト優位性とOpenAIのエコシステム中心のアプローチを比較。[VentureBeat]
オーストラリアのラジオ局、平日日中にAI DJを導入 – オーストラリアの局が平日番組の司会にAI DJを起用。[The Verge]
中国の習近平主席、AI開発の自立強化を呼びかけ – 習近平国家主席が、米国との競争激化の中でAIの国内開発推進を訴えた。[Reuters]
Lightrun、AIを活用した本番環境デバッグツールで7,000万ドル調達 – Lightrunがリアルタイムデバッグツール拡充のため資金を確保。[TechCrunch]
2023年に最も熱かったAI職種、すでに時代遅れに – かつてAI開発に不可欠だった役職が、急速な進化により不要になりつつある。[WSJ]
インド、エージェンティックAI専門家不足に直面 – インドが自律的意思決定ができるAI人材の需要急増に対応できず苦戦。[Economic Times]
AI製品の実際の効果を測る:正しい評価指標の開発方法 – AIプロダクト評価のための効果的な指標設定ガイド。[VentureBeat]
🦾 新興テクノロジー
ビットコイン価格高騰もマイナーには恩恵少なく – ビットコイン価格上昇にもかかわらず、高い運用コストに苦しむマイナーたち。[Bloomberg]
ナイキ、NFTバーチャルシューズ巡りRTFKTを提訴 – ナイキがNFTスニーカーを巡る知的財産権侵害でRTFKTを訴訟。[The Verge]
関税ショックでビットコインの価値保存機能が実証され始める – 新たな関税措置が経済不安の中でビットコインの価値保存機能を強調。[CoinDesk]
Waymo、個人向け自動運転車サービスを拡大 – Waymoが消費者向け長期自動運転サービスを発表。[The Verge]
🤳 ソーシャルメディア
AI時代のSEOベストプラクティス(インフォグラフィック) – AI主導の検索環境に適応するためのSEO戦略ガイド。[Social Media Today]
🔬 研究
エッジデバイス向け畳み込み型マルチハイブリッドモデル – Liquid AIがエッジデバイスでのAI性能最適化のための新アーキテクチャを提案。[Liquid AI]
⚖ 法務
Ziff DavisとIGN、著作権侵害でOpenAIを提訴 – Ziff DavisとIGNが、OpenAIによるコンテンツ無断使用を訴える。[VentureBeat]
Ziff DavisによるOpenAI訴訟、大きな判例となる可能性 – Ziff Davisの著作権訴訟が持つ広範な影響を分析。[NYT]
MyPillow CEOの弁護士、AI生成の架空判例を引用し批判される – 裁判官が、AIによって捏造された判例を引用した弁護士を厳しく非難。[Ars Technica]
🎱 その他
反海賊版キャンペーンが違法フォント使用の疑い – 著作権保護を訴えるキャンペーンが、皮肉にも無許可フォントを使用した疑惑。[Ars Technica]
🔌 これに接続して
AnthropicのCEO、ダリオ・アモデイは、AIモデルがますます高性能になる中で、その内部メカニズムを理解することが安全性確保のために極めて重要だと主張している。彼は、解釈可能性研究の具体的な技術アプローチを示し、初期のAIアラインメント研究に匹敵する規模での大規模な分野横断的努力を提唱している。

アモデイは、モデルの「特徴」を発見し、それぞれを個別に解釈し、それらがどのように行動に組み合わさるかを理解するという3つの主要な研究方向性を提案している。
彼は、フロンティア級モデルに対しては手作業による検査では不十分であるため、スケーラブルかつ自動化された解釈可能性技術の必要性を強調している。
特徴を「概念ニューロン」のように捉えるといった擬人的アナロジーは、有用ではあるがあくまで不完全なヒューリスティクスであり、文字通りの真実ではないと位置づけている。
本稿は、モデル能力と解釈可能性研究の間で「競争」を促し、安全性がモデルの力に追いつくよう求めている。
深い解釈可能性を達成できなければ、表向きは無害に見えるモデル目標からでも壊滅的なミスアラインメントが生じ得るとアモデイは警告している。
The Urgency of Interpretability: Why it's crucial that we understand how AI models work
— Dario Amodei (@DarioAmodei)
9:16 PM • Apr 24, 2025
🧠 アモデイの主張は、AI安全性に関する議論の枠組みを微妙に転換している。モデルを事後的に制御しようとするのではなく、解釈可能性を安全なスケーリングのための積極的な基盤と捉え、古典的なソフトウェア工学におけるデバッグツールの成熟過程になぞらえている。
PerplexityのCEO、アラヴィンド・スリニヴァスは、Googleに真っ向から挑戦するべく、会話型検索をブラウジング体験に深く統合したAIネイティブブラウザを開発するという同社の野望について語った。彼はGoogleの構造的制約を批判し、Perplexityのモデルの方がユーザー意図に沿っていると主張している。

スリニヴァスは、Perplexityのプロダクトが検索を超えて、ウェブブラウジング自体を対話として扱うものになると述べている。
Googleの広告収益モデルが、真に革新的な情報検索を受け入れる妨げになっていると批判している。
Perplexityは、スピード、情報源の透明性、幻覚(誤情報)リスクの最小化をGoogleや従来型AIチャットボットとの差別化要素にしている。
同社は、検索結果リンクをクリックするのではなく、反復的な会話を通じて情報をナビゲートするブラウザを目指している。
スリニヴァスは、次なる「ブラウザ戦争」は単なる技術力ではなく、信頼とユーザー需要への整合性がカギになると示唆している。
Yes. Google has a rule that only preloaded apps can get access to wake word detection APIs. That’s the challenge in implementing “Hey Perplexity”. Those that can listen to low power audio and classify reliably. Otherwise you’re forced to keep your app listening all the time which
— Aravind Srinivas (@AravSrinivas)
11:29 PM • Apr 25, 2025
🧭 Perplexityのアプローチは、より広範な再編成の一端を反映している。検索エンジンが単なるインデックスポータルからAIコンパニオンへと進化しつつある今、次の時代を制するのは、単に大量のデータを保有することではなく、信頼でき透明な対話モデルを通じてユーザーの忠誠を獲得することにかかっているのかもしれない。
開発者サイモン・ウィリソンは、O3という新しいオープンソースツールが、AI言語モデルとオープンジオデータを組み合わせて、近隣の素晴らしい撮影スポットをどのように特定するかを紹介している。O3は、SNS投稿やオンラインコンテンツを解析して、興味深いがあまり知られていないスポットを抽出・提示する。

O3は、大規模言語モデル(LLMs)を使って、乏しいメタデータやオンライン言及からもっともらしい記述タグを「幻覚」させる。
OpenStreetMapやWikimedia Commonsからデータを取り込み、プロプライエタリソースに依存せずに写真スポットデータベースを拡充している。
ユーザーが具体的な地名ではなく、雰囲気やビジュアルテーマでロケーションを検索できるよう、意味検索を実装している。
提案されたロケーションの情報源をユーザーに明示するなど、透明性を重視している。
O3は完全にオープンソースで運営され、発見を企業プラットフォームに集中させるのではなく、地域コミュニティや趣味の愛好家に力を与えることを目指している。
OpenAI o3's ability to guess locations from images is the most dystopian thing I've ever seen.
These images are regular, nondescript pictures from India most locals wouldn't identify.
o3 zooms, reads text, searches and reasons for up to >10 minutes!
Then I tried GeoGuessr...
— Deedy (@deedydas)
4:28 AM • Apr 28, 2025
👁️ この種のデモは、プライバシーが幻想であることを改めて実感させる。ある程度デジタルに接続しているだけでも、これまでとは違う感覚の不安を引き起こすのかもしれない。もしかすると、まだ単に慣れていないだけなのだろうか?
🆕 更新
Introducing ERNIE X1 Turbo & ERNIE 4.5 Turbo!
Building on the success of ERNIE X1 and 4.5, the upgraded ERNIE X1 Turbo and 4.5 Turbo deliver results faster and cheaper. Both models stand out for their multimodal capabilities, strong reasoning and low costs.
For X1 Turbo, input
— Baidu Inc. (@Baidu_Inc)
3:05 AM • Apr 25, 2025
A much improved Grok-powered algorithm is coming. Should help a lot.
— Elon Musk (@elonmusk)
4:19 AM • Apr 26, 2025
📽️ 毎日デモ
Imagine AI turning a photo into a playable 3D world. 🌍
On @60Minutes, our Research Scientist @jparkerholder joined CEO @demishassabis to demo Genie 2's image-to-3D world creation – exploring the possibilities it could bring to how AI learns. ↓
— Google DeepMind (@GoogleDeepMind)
10:18 AM • Apr 28, 2025
🗣️ 対話
I think part of the reason we are suddenly seeing this general shift in model personas towards increasingly humanlike behavior is that a lot of the big labs looked at character ai's engagement numbers a while back and decided maybe they were too hasty on anthropomorphism.
— Andrew Curran (@AndrewCurran_)
6:10 PM • Apr 27, 2025
Well, @CommunityNotes FTW!
— Aravind Srinivas (@AravSrinivas)
11:29 PM • Apr 27, 2025