🎬 アドビのFireflyが登場

Adobe Premiere Proに統合されたFireflyが登場し、ビデオプロフェッショナルたちに既存のワークフロー内でAI機能をもたらしました。

ザ・デイリー・カレント ⚡️

クリエイティブな人々、ビルダー、先駆者、そして常に境界領域へとさらに踏み込んでいく思想的リーダーたちへようこそ。

Adobeのファイアフライはビデオクリエイターに新たな力を与えますが、大規模言語モデルは依然として数学的難問と格闘しています。GmailユーザーがAI駆動のフィッシング詐欺に直面する中、AnthropicのDario AmodeiはAIが社会を向上させるユートピアを夢見ています。最後に、OpenAIは展開するAIの物語において、自身が悪役ではなくヒーローであることを確実にするため、自らの存在に関わる問いと向き合わなければなりません。

🔌 これらのヘッドラインに注目:

  1. 🎬 Fireflyが到着:Adobe Premiere Pro内のAIビデオモデルをご紹介

  2. 🧠 大規模言語モデルにおける数学的推論の限界を理解する

  3. 🛡️ Gmailセキュリティアラート:AIハックが数十億人を標的に

  4. 🤖 「愛の恵みの機械」- Dario Amodei(Anthropic創設者)がエッセイを執筆

  5. 🤔 意見:OpenAIはこれらの質問に答えられれば、善の力となり得る

AdobeがFireflyをPremiere Proに統合したことは、AIをプロフェッショナルなビデオ制作ワークフローに組み込む慎重かつ重要な一歩を表しています。現在の実装で注目すべきは「Generative Extend」機能で、ユーザーが既存のクリップ(編集中のもの)を最大2秒まで延長できるようになりました。

  • 延長されたクリップは720pまたは1080pの24 FPSで生成可能

  • 生成されたコンテンツの照明、カメラの動き、構図などの要素を調整可能

  • 生成されたビデオにはContent Credentialsが含まれ、AIの関与について透明性を提供

  • Adobeは今後、より高い解像度、フレームレート、HDRコンテンツ、そして追加のアスペクト比のサポートを拡大する予定

Adobeは常に、幅広いビデオ生成機能を提供するのではなく(もっともFireflyはそれも行いますが)、特定の編集上の課題に対処するためにAIを展開する立場にありました。Text-to-VideoとImage-to-Videoツールは、9月に最初に発表され、現在Firefly webアプリで限定公開ベータ版としてリリースされています。

Appleが発表したこの研究論文は、現在のGSM8Kベンチマーク結果の信頼性に疑問を投げかけ、LLMの推論能力の脆弱性を浮き彫りにしています。この研究結果は、これらのモデルが形式的な推論ではなく確率的なパターンマッチングに依存しているという仮説を支持しており、LLMにおけるトークンバイアスとパターンマッチングに関する以前の研究と一致しています。

  • この研究には20以上のオープンモデル(2Bから27Bのパラメータ)と、GPT-4やO1などの最先端のクローズドモデルが含まれていました。

  • 一見関連しているが最終的には無関係な情報(GSM-NoOp)を追加すると、最先端のモデルでさえ大幅なパフォーマンス低下を引き起こします。

  • LLMは同じ質問の異なるインスタンス間で大きなパフォーマンスの変動を示します。

  • 結果は、現在のLLMが本物の論理的推論に苦戦し、代わりに洗練されたパターンマッチングに依存していることを示唆しています。

この研究の結果は、論理的推論を必要とするタスクに対するAIモデル開発のアプローチを根本的に再考する必要性を示唆しているかもしれません。現在のトランスフォーマーアーキテクチャが複雑なタスクの処理に限界を示していることから、AIシステムで真の形式的推論能力を実現するために、今後の研究では新しいアーキテクチャや訓練パラダイムを探求する必要があるかもしれません。

最近のGmailセキュリティ侵害は、AIを活用して非常に説得力のあるフィッシング詐欺を作り出す、洗練された多層的な攻撃を示しました。この攻撃は、複数のチャネルにわたって正当なGoogleのコミュニケーションを模倣するために先進技術を使用したことで際立っています。

  • 人間のような自然な話し方やコールセンターの環境を模した背景ノイズを含む、驚くほど本物らしいAI生成の音声通話を利用

  • AIを使用して、説得力のあるGoogleのブランディングとフォーマットを持つパーソナライズされたフィッシングメールを作成

  • 偽のアカウント回復通知、なりすまし電話、カスタマイズされたメールなど、複数の接点を調整して緊急性と正当性の感覚を生み出す

  • 被害者の反応に基づいてリアルタイムで戦術を適応させる機械学習を活用し、攻撃をより動的で検出しにくいものに

AIは攻撃者の能力を向上させる一方で、検出と予防の改善の機会も提供します。Googleが7日以内にこの脅威を特定し無効化したという迅速な対応は、適切に実装された場合のAIがサイバーセキュリティ防御を強化する可能性を示しています。

AIのユートピア創造の可能性を謳うAmodeiは、生物学と健康、神経科学とメンタルヘルス、経済発展と貧困、平和とガバナンス、そして仕事と意味という5つの主要分野に焦点を当てています。Amodeiは典型的な誇大宣伝を超えて、主に現在の問題中心の実用的なAIアプリケーションに焦点を当てようとしています。

  • AIは「圧縮された21世紀」と呼ばれる、50-100年分の生物学的進歩を5-10年に圧縮する可能性がある

  • AmodeiはAIの影響を分析するためのフレームワークとして「知能への限界収益」を導入

  • AIは「生物学的自由」を可能にし、体重、外見、生殖に対する人々のコントロールを与える可能性がある

  • AIの支援により、発展途上国の経済発展は年間GDP成長率20%を見込める

Amodeiのビジョンは楽観的ですが、強力なAIの民主的なコントロールにかかっており、複雑な倫理的および地政学的課題に対処するためにはAI企業と政府の緊密な協力が必要です。

利益と目的のバランスを取ることがOpenAIの未来の中心です。OpenAIが善の力となる可能性は、そのガバナンス、説明責任、影響力に関する重要な質問に答える能力にかかっています。

  • OpenAIは企業憲章で目的を明確に定義し、どのようにステークホルダーにサービスを提供し、誰とビジネスを行わないかを特定する必要がある

  • 同社は独立した第三者基準を用いた透明性のある年次監査済みのインパクトレポートを約束する必要がある

  • OpenAIのコミットメントを執行するための堅牢な法的構造が必要で、特別な意思決定権を持つ信託を通じて可能かもしれない

  • OpenAIの現在の安全性とセキュリティ委員会は真の独立性を欠いており、意のままに解散される可能性がある

  • 同社のエネルギー消費は気候変動の進展に大きな影響を与える可能性があり、再生可能エネルギー源へのコミットメントが必要

これらの倫理的およびガバナンスの課題に対処するOpenAIの成功は、AI業界全体の先例となり、責任あるAI開発のグローバルスタンダードを形作る可能性があります。

私はB Corp運動の共同創設者として、ビジネスを善の力として使用することに専念する9,000以上の企業のコミュニティのモデル利益法人法案の作成を手伝いました。私はPatagoniaのYvon Chouinardを含む多くのビジネスリーダーと共にその可決を支持しました。だからこそ、OpenAIのアプローチが不十分だと分かるのです。

 Andrew Kassoy - B Lab共同創設者