- 電時流⚡️
- Posts
- テンセントがAIビデオ分野に参入、SpotifyがGoogle NotebookLMを統合
テンセントがAIビデオ分野に参入、SpotifyがGoogle NotebookLMを統合

⚡️ クイックニュース
🤖 人工知能
Amazonが新世代のファンデーションAIモデル「Nova」を発表 - このスイートには、テキスト、画像、ビデオ処理のための理解モデル、および画像とビデオ作成のためのクリエイティブコンテンツ生成モデルが含まれており、すべてAmazon Bedrockを通じて利用可能です [AWS News Blog]
ElevenLabsが会話型AIプラットフォームを発表 - 新プラットフォームでは、カスタマイズ可能な声、性格、知識ベースを持つAIエージェントの作成と展開が可能です [ElevenLabs]
Exa AI LabsがExa-1をリリース - 新しい「スロー・ウェブ検索」は、AIの検索競合の増加するリストに新たな名前を加えました [Twitter]
アップル、中国ユーザー向けバイドゥAIモデルの適応に課題 - テック大手は中国市場向け製品へのバイドゥAI技術の統合に苦戦しており、中国のiPhoneユーザー向けAI機能のリリースが遅れる可能性があります [The Information]
🎨 クリエイティブ&カルチャー
HailuoAIが印象的な性能を持つ新AIモデルを発表 - 安定性と繊細な表現のために最適化された Hailuo I2V-01-Live は、幅広いアーティスティックスタイルをサポートします [Twitter]
Cameoがクリエイターにフォーカスを移行 - セレブリティビデオメッセージングプラットフォームが、CameoXという新プラットフォームでソーシャルメディアクリエイターへの方向転換を図ります [Yahoo Finance]
TikTok Shopがブラックフライデーで1億ドルの売上を達成 - プラットフォームでは30,000以上のライブストリームショッピングセッションが開催され、ファッション、美容、ホーム製品が最も人気のカテゴリーとなりました [Business Insider]
₿ 暗号資産&ブロックチェーン
トランプ、ポール・アトキンスをSEC委員長に指名 - 前大統領が元SEC委員を最高規制職に推薦しました [The Hill]. 市場の変動により暗号資産の清算が5億8,800万ドルに達する - 暗号資産価格が急激な変動を経験する中、レバレッジポジションの強制決済が大量に発生しました [Yahoo Finance]
⚖ 法律&規制
EU裁判所顧問、Googleの28億ドルの反トラスト罰金を支持 - 欧州司法裁判所の法務官が、オンラインショッピングにおける反競争的行為の疑いでGoogleに課された多額の罰金の維持を勧告しました [Financial Times]
EU委員会、デジタルサービス法に基づきTikTokに追加情報を要請 - 欧州委員会は、進行中のルーマニア選挙に関連して、情報操作に関するTikTokのリスク管理実践について詳細を求めています
🧪 研究
MITの研究者が超高速AI計算のためのフォトニックチップを開発 - 新しいチップはディープニューラルネットワークのすべての主要な計算を光学的に実行し、要求の厳しいアプリケーションのためのより高速で省エネルギーなディープラーニングを可能にする可能性があります
🎱 ランダム
Metaは選挙中の誤情報の1%未満がAIによるものと発表 ****- Metaは次期政権への好意的なアピールを意識しているようです [Meta Newsroom]
🔌 詳細をチェック
中国のビデオゲームおよびソーシャルメディア大手のテンセントは、同社のHunyuan人工知能基盤モデルをベースとした強力な新しいテキスト動画生成ツール「HunyuanVideo」を最近発表しました。この発表は、テンセントがAI動画生成分野に参入し、国内のライバル企業やOpenAIのSoraなどの国際的なプレーヤーに挑戦することを示しています。

このモデルは中国語と英語の両方で720p解像度の高品質な動画を生成します。
HunyuanVideoは企業および個人ユーザーに無料で提供され、様々なプラットフォームからアクセス可能です。
大量のGPU VRAM(45-60GB)を必要とし、5秒の動画生成に最大15分かかる場合があります。
テンセントのツールは、快手(Kuaishou)、アリババ、そしてOpenAIのSoraなどの国際的なプレーヤーと競合しています。
And Just Like That - Tencent just dropped an excellent open-source video model!
IT LOOKS AWESOME
The final gap that we had in open-source AI - namely a video-gen model - is now closed 😀
AS USUAL, CHINA RULES
— Bindu Reddy (@bindureddy)
2:49 PM • Dec 3, 2024
I can’t believe this will be open-sourced!
Tencent, one of China’s biggest tech companies, has just unveiled a crazy video-to-video AI model.
It can animate both human movements and facial expressions with incredible realism and natural flow.
Here are four examples:
— el.cine (@EHuanglu)
6:32 PM • Dec 3, 2024
🚀 HunyuanVideoをオープンソース化することで、テンセントはAI動画生成技術のイノベーションを加速し、現在競争が激化している分野で正当なプレーヤーとしての地位を確立することを目指しています。
Spotifyは2024年版Wrapped機能を発表し、GoogleのNotebookLMを活用したパーソナライズドAIポッドキャストという新機能を追加しました。この革新的なコラボレーションは、年間の聴取振り返り体験に新たな次元をもたらします。

Spotifyの2024年版Wrappedは、GoogleのNotebookLM技術を使用したパーソナライズドAIポッドキャストを特徴としています。
「Your Spotify Wrapped AI Podcast」では、2つのAIホストがユーザーの聴取振り返りをガイドします。
アメリカ、イギリス、オーストラリアなど、対象国の適格ユーザーが英語で利用可能です。
「Your Music Evolution」データストーリーやプレミアムユーザー向けのAI生成プレイリストなどの新機能が追加されています。
今回初めてオーディオブックがWrapped振り返りに含まれています。
BREAKING 🚨: Spotify launches Wrapped AI podcast with Google’s @notebooklm
AI Audio Overview hosts will be able to recap your year on Spotify for a limited time in addition to AI playlists and AI DJ features coming along 👀
— TestingCatalog News 🗞 (@testingcatalog)
12:59 PM • Dec 4, 2024
🎵 SpotifyとGoogleのこのコラボレーションは、ユーザー体験のパーソナライズ化における重要な一歩を示しており、AI技術と音楽ストリーミングを融合させて、リスナーが年間の音声体験を振り返るためのユニークで魅力的な方法を生み出しています。
「Buy with Pro」と呼ばれるPerplexityのAIショッピングエージェントは、2024年11月中旬のデビュー以来、いくつかの問題を抱えています。これらの問題は、AIパワードショッピングアシスタントを実装する際の課題を浮き彫りにしています:

処理速度の遅さ:購入完了まで数時間かかり、確認が最大8時間後に届くことがあります。
在庫の不正確さ:AIがリアルタイムの在庫状況を正確に反映できず、入手不可能な商品の購入を試みることがあります。
非従来型の支払いプロセス:ユーザーは小売業者ではなくPerplexityに直接支払いを行うため、表示された在庫と実際の在庫に不一致が生じる可能性があります。• プライバシーの懸念:人間のチェッカーがプロセスに関与し、ユーザーの購入情報や住所にアクセスする可能性があります。
小売業者との関係の問題:AIが許可なく小売業者のウェブサイトをスクレイピングしているように見え、購入やリターンに関する問題が発生する可能性があります。
Perplexity has a Cyber Monday buying guide on the home page of the app and a call out to snap a photo to shop.
— Michelle Grant (@MGTalksRetail)
3:14 AM • Dec 3, 2024
🤖 これらの課題にもかかわらず、PerplexityのAIショッピングエージェントはAIアシストeコマースに向けた野心的な一歩を示しています。しかし、信頼できる消費者ツールとなるためには、速度、精度、小売業者との関係において大幅な改善が必要です。
📸 クリエイターコーナー
Runwayの新しいビデオキーフレーミングプロトタイプ
本日、Runway AIは、アーティストやコンテンツクリエイターのクリエイティブプロセスに革新をもたらす、新しいビデオキーフレーミングプロトタイプを発表しました。このイノベーティブなツールにより、ユーザーはアイデアをマッピングし、独特で直感的な方法でビデオに変換することができます。
Today we’re sharing an early video keyframing prototype that treats creative exploration like a search process of all latent artistic possibilities. One which allows you to simultaneously navigate this vast space with both precise control as well as serendipitous nonlinear… x.com/i/web/status/1…
— Runway (@runwayml)
8:21 PM • Dec 2, 2024
主な機能
非線形的な発見
このプロトタイプは、ユーザーが非線形的な方法でクリエイティブなアイデアを探索し、偶発的な発見や予期せぬつながりを可能にします。
画像からビデオへの変換
ユーザーは個々の画像を地図上の点のように接続し、それらの間にスムーズな遷移を作成して、一貫性のあるビデオを形成できます。
潜在空間の探索
このツールは「潜在空間」と呼ばれる概念を活用しており、これは創造的可能性の広大な見えない世界です。ユーザーはこの空間を探索して新しいアイデアを発見し、つなげることができます。
グラフベースのインターフェース
プロトタイプはグラフのようなインターフェースを採用しており、各点は画像を表し、接続線はこれらの画像がどのようにビデオに変換されるかを決定します。
柔軟な編集
ユーザーは全体的なナラティブを維持しながら画像の側面を修正し、元の画像を大きく変更することなくサプライズを追加し、テキストプロンプトを使用して画像スタイルを変更できます。
Runway's new prototype is a leap forward in generative AI, using keyframe graphs to enable creators to control and explore diverse video narratives efficiently.
video from @runwayml— Creative Agents (@creative0agents)
3:43 AM • Dec 3, 2024
クリエイターへのメリット
強化された探索:このツールはユーザーが生成前に潜在空間でビデオを視覚化することを可能にし、ストーリーテリングプロセスの洗練を支援します。
非線形的思考:多くのクリエイターの非線形的な思考プロセスに対応し、複数の方向に分岐して探索することができます。
カスタマイズ可能なワークスペース:ユーザーは自由にアイデアを整理し、類似のコンセプトをグループ化したり、実験のために展開したりできます。
スタイル実験:プロトタイプはユーザーが様々なスタイルやパスでビデオをプレビューすることを可能にし、広範な探索と好みのオプションの保存を促進します。
Runway AIは今後数ヶ月かけて、このツールへのアクセスを段階的に展開し、ユーザーがクリエイティブワークフローに統合し、芸術的なビジョンを拡大する機会を提供する予定です。
🤔 最終的な考察
AIビデオ分野がますます混雑する中、Runwayは再びこの分野のリーダーとしての地位を明確にしています。ビデオ生成だけでなく、新しい形式のビデオ組み立ても開発することは非常に理にかなっています。優れた映像の取得がより簡単になるにつれて、質の高いコンテンツを作成する上での課題は変化しており、実験には絶好の時期です。
AI will disrupt Hollywood.
Kling AI V1.5 is insanely amazing at image-to-video.
The quality is top-notch! An amazing showcase of @Kling_ai magic
— Haider. (@slow_developer)
10:15 PM • Dec 4, 2024
Every time Runway launches new features, I keep scanning for "Avatars can walk across room naturally"
"Avatars will not super saturate in colors as video goes on"
"Avatars will retain facial features and not morph into a new person through your ten second clip"
I dream big 🤣… x.com/i/web/status/1…
— Foggy X (@FoggyXMusic)
7:04 PM • Dec 4, 2024
#AI Short film using Midjourney for images, Runway for video and Eleven Labs for voice over. Subtitles created using Cap Cut.
Hope you like it!
— Rikype (@RikypeTW)
6:48 PM • Dec 4, 2024
~ JL