電時流⚡️
Posts
Google DeepMindの新しい自律型AIロボットのアップデートが驚異的

Google DeepMindの新しい自律型AIロボットのアップデートが驚異的

また、サイモン・ウィリソンが「バイブコーディング」についての考えを共有

Jack Lajoie
March 13, 2025 • 読了時間4 minutes

⚡️ 見出し

🤖 AI

アリババ、感情を読み取るAIモデルを発表しOpenAIに対抗 - Alibabaグループは、感情を読み取ることができる新しいAIモデルを発表し、OpenAIの技術を超えることを目指している。[Bloomberg]

スペイン、AI生成コンテンツのラベル付け違反に巨額の罰金を導入 - スペイン政府は、AI生成コンテンツにラベルを付けない企業に対し、最大3,500万ユーロまたは世界売上高の7%の罰金を科す法案を承認。ディープフェイクの拡散を抑制する狙い。[Reuters]

学校がAIを活用して生徒を監視、プライバシーとセキュリティの懸念が浮上 - 米国の学校では、GaggleなどのAI監視ツールを導入し、生徒のオンライン活動を監視。暴力防止を目的とするが、プライバシーやセキュリティのリスクに関する議論を引き起こしている。[Associated Press]

AIユニコーン企業がインド進出、Motiveが数百人を採用へ - フリート管理スタートアップのMotive Technologiesは、インドの従業員数を倍以上に増やす計画。AIユニコーン企業も大手テック企業とともにインド市場を拡大中。[Bloomberg]

TSMC、Intelのファウンドリー事業の合弁計画をNvidia・AMD・Broadcomに提案 - TSMCはIntelのファウンドリー部門を共同運営する合弁事業を提案し、Nvidia・AMD・Broadcomに出資を打診。TSMCの持ち株比率は50%未満に制限される見込み。[Reuters]

🦾 新興技術

自動運転ソフトウェア企業Applied Intuition、評価額150億ドルで資金調達交渉中 - 自動運転車向けシミュレーションソフトを開発するApplied Intuitionが、評価額150億ドルでの資金調達を交渉中。前年の評価額から2倍以上に跳ね上がる見通し。[The Information]

🤳 ソーシャルメディア

BeReal、日本市場で成功、CEOが語る - ソーシャルメディア「BeReal」が日本市場で人気を獲得。ユーザーはそのリアルな交流モデルを支持していると、同社CEOが語る。[Nikkei Asia]

Google、Honeyのアフィリエイトリンク問題を受けChrome拡張機能ポリシーを変更 - Googleは、PayPalのHoney拡張機能がユーザーの利益なしにアフィリエイトリンクを差し替えていたとされる問題を受け、Chrome拡張機能のポリシーを変更。透明性とユーザー利益の確保を義務化。[The Verge]

⚖ 法律

FTC、Microsoftに対する広範な独占禁止法調査を進行中 - 米連邦取引委員会（FTC）は、MicrosoftのAI事業を巡り、競争上の不正行為があるかどうかを調査。独占禁止法違反の可能性を検討している。[Bloomberg]

🎱 その他

Amazonによる買収が破談、iRobotの将来に不安 - ルンバのメーカーiRobotが、財務問題により今後の事業継続に「重大な疑義がある」と表明。Amazonによる買収が失敗に終わったことが影響。[Bloomberg]

Microsoft、今年はXbox携帯ゲーム機を発売せず、Asusが代わりに開発か - Microsoftは今年、新型Xbox携帯ゲーム機を発売しないが、Asusが類似製品を開発中との報道。市場のギャップを埋める可能性がある。[The Verge]

🔌 これに接続して

Google DeepMindの新AIモデルがロボットの能力を強化

Google DeepMindは、ロボットの実世界での複雑な作業能力を拡張する2つの高度なAIモデル「Gemini Robotics」と「Gemini Robotics-ER」を発表。これらのモデルにより、ロボットは未学習の状況でも環境を理解し、適応的に行動できるようになる。

Gemini Robotics は、Gemini 2.0モデルを基盤に、視覚・言語・動作を統合。紙を折る、ボトルキャップを開けるなど、多様な状況を理解し正確な動作を実行できる。
Gemini Robotics-ER（Embodied Reasoning）は、空間認識や作業の順序立てなど、高度な推論能力を強化し、弁当箱を効率よく詰めるようなタスクを実行可能。
安全性重視：動作前にリスクを評価し、安全かつ責任あるロボット行動を確保。
業界連携：Apptronik、Agile Robots、Agility Robotics、Boston Dynamics、Enchanted Toolsと協力し、より知的で適応力の高いロボットの開発を目指す。

This is wild.
Google just unleashed Gemini Robotics, bringing AI into the physical world.
Robots can now see, think, and ACT in real-time.
10 mind-blowing things Gemini Robotics can do:
— Min Choi (@minchoi)
4:15 PM • Mar 12, 2025

🦾 ロボットの普及が進まなかった要因の一つは、対応可能な作業範囲が狭く、開発コストに見合わなかったこと。しかし、今回の技術革新は、より適応性・応答性の高いロボットを実現する重要な一歩となる。

LLMを活用してコードを書く方法

Simon Willisonが、大規模言語モデル（LLM）をコーディングに活用する際の経験や戦略を共有。LLMは生産性向上に貢献するが、適切な使い方を理解することが重要だと強調している。

現実的な期待を持つ：LLMは高度なオートコンプリートのようなものであり、「自信過剰なペアプログラミングアシスタント」と捉えると、その長所を活かしながら誤りに注意できる。
学習データの制限を考慮：LLMは特定の時点までのデータで訓練されているため、最新のライブラリの更新や変更には対応できない場合がある。
コンテキストの管理：LLMの出力は提供する情報に大きく依存するため、適切に会話を構成し、関連情報を明確に伝えることが重要。
対話的な活用：LLMとのやり取りを重ねることで、出力の修正や最適化を図り、より良いコードを生成できる。
テストと検証：LLMが生成したコードは、統合前にしっかりテストし、要件を満たしているか確認することが必須。

Vibe coding is literally the future
— Peter (@peterwong_xyz)
7:15 PM • Mar 7, 2025

🛠️ Willisonの結論はシンプル：LLMを万能な解決策ではなく、協力ツールとして使うことで、直感的なサポートを得つつ、コード品質を維持できる。

Snap、独自の生成AIを活用した「AIビデオレンズ」を発表

Snapchatが、AIを活用してビデオに生成要素を追加できる新機能「AIビデオレンズ」を導入。よりクリエイティブなコンテンツ制作が可能になる。

プラチナ会員限定：現在、AIビデオレンズはSnapchatのプラチナ会員向けに提供されている。
初期レンズの種類：肩に現れるキツネ、頭の周りを動くアライグマ、ズームアウト時に前景に咲く花の3種類を用意。
毎週アップデート：Snapは毎週新しいAIレンズを追加予定。
独自の生成AIモデルを採用：Snapの社内開発による生成AIを活用。

We’re introducing the first of our new advanced AI video Lenses available exclusively for Snapchat Platinum! These Lenses, powered by our latest in-house built generative video model, bring some of the most cutting edge AI tools available today to Snapchatters through a familiar… x.com/i/web/status/1…
— Snap Inc. (@Snap)
4:17 PM • Mar 12, 2025

🤳 Snapchatはこれまでも「フィルター」機能を提供してきたが、今回のAIビデオレンズはさらに進化したもの。既存製品を強化しながら、ユーザーにユニークな体験を提供する好例といえる。今後も、AIによる「新機能の進化」が各社の競争力を高める要素になりそうだ。

🆕 更新

Native image generation with Gemini 2.0 Flash is now available to all developers via an experimental release in the Gemini API and Google AI Studio!!
The chat based image editing and creation is so much fun to play with 🧵
— Logan Kilpatrick (@OfficialLoganK)
4:02 PM • Mar 12, 2025

The first world-class clean AI video model is here.
Marey by Moonvalley—built for filmmakers, trained exclusively on licensed data. Brought to you by the leading minds in AI and film.
The future starts now. Join the waitlist: bit.ly/MV_waitlist
— Moonvalley (@moonvalley)
4:02 PM • Mar 12, 2025

Mirage is LIVE
Generate energetic, high-converting ads with people that don’t exist — complete with animated body language and micro-expressions — using Mirage, the first foundation model built to generate UGC-style content.
Get started with a script or an audio file, then… x.com/i/web/status/1…
— Captions (@getcaptionsapp)
4:33 PM • Mar 12, 2025

📽️ 毎日デモ

🗣️ 対話

Highest intelligence compression we have seen in any open model. (Also beats o3-mini). Multimodal. Multilingual. Tool calls. Weights on huggingface. So many reasons to be excited about this!
— Delip Rao e/σ (@deliprao)
11:48 AM • Mar 12, 2025

Anthropic is working on Gmail and Google Calendar integration for Claude.
Code name "pumpernickel" 👀
— TestingCatalog News 🗞 (@testingcatalog)
5:09 PM • Mar 12, 2025

🔑 NEW FEATURE UNLOCKED 🔑
Citations in NotebookLM give you confidence the answer is grounded in the information you've provided. We have shown citations in the chat for many months now, but now they're now saved in Notes too. If you pin the model's response to your Notes, the… x.com/i/web/status/1…
— NotebookLM (@NotebookLM)
7:42 PM • Mar 12, 2025