- 電時流⚡️
- Posts
- GitHub Copilotの新しい「エージェントモード」
GitHub Copilotの新しい「エージェントモード」
また、SUTRA-R0-Previewが多言語MMLUベンチマークで、ヒンディー語、グジャラート語、タミル語においてDeepSeek-R1-32BおよびOpenAI-o1-miniを上回る

⚡️ 見出し
🤖 AI
OpenAI共同創設者のJohn Schulmanがライバル企業Anthropicを退社 – ChatGPTの主要な設計者であるJohn Schulmanが、昨年AIスタートアップAnthropicに参加した後、退社した。[Bloomberg]
OpenAI、トランプ支持の「Stargate」AIデータセンターの米国内候補地を選定中 – OpenAIは、16州で大規模データセンターの設置場所を模索しており、OracleやSoftBankとの提携のもと最大5000億ドルの投資を計画している。[Associated Press]
Lyft、AnthropicのClaude AIを統合しカスタマーサービスを強化 – Lyftは、Anthropicと提携し、AIを活用した顧客対応アシスタントを導入。これにより、サポート対応時間が87%短縮された。[Anthropic]
Googleフォト、AI編集画像にSynthIDウォーターマークを導入 – Googleフォトは、生成AIを使用して編集された画像にSynthIDウォーターマークを追加し、AI生成コンテンツの識別を容易にする。[Google Blog]
テック大手、DeepSeekの台頭にも関わらずAI投資を加速 – Amazon、Google、Microsoft、Metaは、DeepSeekのような競合の出現にも関わらず、AIへの巨額投資を継続。[The Wall Street Journal]
研究者チーム、50ドル以下でOpenAI対抗AIモデル「s1」を開発 – スタンフォード大学とワシントン大学のチームが、最小限のデータセットとリソースで、OpenAIのモデルに匹敵する「s1」をわずか26分で開発。[TechCrunch]
ChatGPT、検索機能のサインイン要件を撤廃 – ChatGPTの検索機能が、アカウント作成不要で利用可能に。利便性が向上。[The Verge]
🦾 新興テクノロジー
ウィンクルボス兄弟の暗号資産取引所Gemini、IPOを検討 – ウィンクルボス兄弟が運営する暗号資産取引所Geminiが、年内にも新規株式公開(IPO)を計画中。[Bloomberg]
SEC、暗号資産業界の規制に向けタスクフォースを設立 – 米証券取引委員会(SEC)が、急成長する暗号資産業界の監視と規制を目的とした特別チームを結成。[The New York Times]
🤳 ソーシャルメディア
Instagram、WhatsApp接続ステッカーをストーリーズに追加 – Instagramは、新たなステッカーを導入し、ストーリーズから直接WhatsAppのチャットへ誘導可能に。[Social Media Today]
中国ByteDance、米国との交渉中にTikTok売却を延期 – ByteDanceは、中国政府の承認を待つ間、TikTok売却の交渉を先送り。米国市場への影響が懸念される。[The Washington Post]
YouTube、スーパーボウル2025のエンゲージメント統計を公開 – YouTubeがスーパーボウル中の視聴データやブランド広告のパフォーマンスを発表。[Social Media Today]
🔬 研究
研究者チーム、OpenAIのo1推論モデルに匹敵する「s1」を50ドル未満で開発 – スタンフォード大学とワシントン大学の研究チームが、低コストで高性能なAIモデル「s1」を開発。[TechCrunch]
s1: シンプルなテスト時スケーリングに関する研究論文 – 「s1」モデルの開発に関する研究論文。低コストAI推論モデルの手法や結果を解説。[arXiv]
⚖ 法律
米下院議員、AIアプリDeepSeekの政府デバイス使用禁止を推進 – 超党派の米国議員グループが、中国のAIアプリDeepSeekを政府デバイスで使用禁止にする法案を提出。[ABC News]
🎱 その他
Amazon、第4四半期の売上が10%増加 – Amazonの売上が前年同期比10%増の1878億ドルに達したが、第1四半期の慎重な見通しにより株価は下落。[The Information]
🔌 これに接続して
GitHubはVisual Studio Code向けにCopilotの「エージェントモード」を導入し、AIがコードの反復、エラー認識、修正提案を自律的に行えるようにしました。さらに、Copilot Editsが正式リリースされ、新たな自律型エージェント「Project Padawan」が発表されました。

エージェントモード: Copilotがタスクを細分化し、コードを繰り返し改善し、実行時エラーを自己診断・修正できる新モード。
Copilot Edits: 正式リリースされ、エディター内でのコード提案・改善機能が利用可能に。
Project Padawan: Copilotの機能をさらに強化する新たな自律型エージェント。ただし、具体的な機能の詳細は未発表。
モデル強化: Gemini 2.0 Flashをモデルピッカーに追加し、AI性能の向上とコード生成の選択肢を拡充。
Today, we are infusing the power of agentic AI into the GitHub Copilot experience, elevating Copilot from pair to peer programmer 🤖
(1/4)
— Thomas Dohmke (@ashtom)
5:05 PM • Feb 6, 2025
🛠️ Copilotはこれらの進化を遂げながらも、開発者中心のアプローチを維持し、AIが人間の創造性を補完する役割に留まることを強調しています。
TWO AIは、SUTRA-R0という高度な推論モデルを発表しました。このモデルは、さまざまなトピックや分野にわたる構造化思考を可能にし、複雑な意思決定を強化。多言語対応とリソース効率の良さを兼ね備え、消費者・企業の両方に価値を提供します。

SUTRA-R0は、高度に構造化された推論フレームワークを統合し、文脈理解・言語処理・複雑な意思決定に特化。
複雑なシナリオの解釈、多段階の問題解決、多様な分野における精緻な結論導出を得意とする。
DeepSeek-R1やOpenAI-o1-miniなどの主要モデルと比較したベンチマークでは、ヒンディー語、グジャラート語、タミル語、ベンガル語において優れた推論能力を発揮。
多言語性能の向上を目指して開発が進められており、大規模モデルとの差を縮める可能性を秘める。
消費者向けおよび企業向けの両方で活用できる設計となっており、意思決定支援やインテリジェントな洞察を提供。
SUTRA-R0-Preview leads multilingual MMLU benchmark beating DeepSeek-R1-32B and OpenAI-o1-mini in Hindi, Gujarati, Tamil and more. Note that SUTRA-R0 is still 36B parameter dense model.
Read more- two.ai/blog/introduci…
— Mistry (@pranavmistry)
4:05 AM • Feb 6, 2025
🚀 SUTRA-R0の構造化推論と多言語対応能力は、高度な言語多様性を求めるAIソリューションのニーズに応える大きな進歩となります。
Mistral AIは、個人・業務向けに強化されたLe Chatの最新版を発表しました。今回のアップデートでは、iOS/Androidアプリの導入に加え、Pro・Team・Enterprise向けの新プランを提供。最新ニュースの取得、日常のスケジュール管理、プロジェクト追跡、ドキュメントのアップロード・要約など、多彩な機能を備えています。

Le Chatは「Flash Answers」機能により、約1000語/秒の高速応答を実現。
事前学習済みの知識と、ウェブ検索・報道・SNSなどの最新情報を統合し、証拠に基づいた精度の高い回答を提供。
高度な画像・ドキュメント解析機能を備え、PDF・スプレッドシート・画像などの複雑なファイルも正確に処理可能。
「Code Interpreter」機能により、サンドボックス環境でのコード実行・科学分析・データ可視化・シミュレーションを実施可能。アルゴリズム検証やデータ分析に活用。
画像生成機能はBlack Forest LabsのFlux Ultraモデルを採用し、フォトリアリスティックなビジュアルから企業向けクリエイティブまで多様な画像生成が可能。
Mistral Le Chat is very underrated:
- 13x faster than ChatGPT (real speed video!)
- Canva feature is much better
- Real-time access to the Internet
- Image generation with Flux > Dall-E 3
- FreeAnd even an Android / iOS app now. Worth a try.
— Paul Couvert (@itsPaulAi)
10:30 PM • Feb 6, 2025
📱 モバイル対応の強化と高度な機能により、Le ChatはOpenAIなどの競合と並ぶ強力なAIアシスタントとして位置付けられます。
🆕 更新
Wait…WHAT? Introducing Pikadditions, the easiest way to make your content stand out.
Add anyone or anything to any video, whether that’s a video you shoot yourself, or a favorite clip. Special surprise: get fifteen free Pikadditions generations when you sign up!
Go try it at… x.com/i/web/status/1…
— Pika (@pika_labs)
5:00 PM • Feb 6, 2025
📽️ 毎日デモ
🗣️ 対話
PDF parsing is pretty much solved at scale now.
Gemini 2 Flash's $0.40/M tokens and 1M token context means you can now parse 6000 long PDFs at near perfect quality for $1
— Deedy (@deedydas)
5:37 PM • Feb 6, 2025
I’m now sharing an extremely detailed colon cancer treatment report from OpenAI Deep Research, posted with my patient friend’s permission (no identifier). This report, obtained after uploading the patient’s case, is highly personalized and truly remarkable! Google doc link below
— Derya Unutmaz, MD (@DeryaTR_)
2:42 AM • Feb 7, 2025
This is wild.
Pika just dropped Pikadditions feature and it's insane!
Now you can add any person or object into your videos.
10 wild examples:
1. Forget Rose, Jack…
— Min Choi (@minchoi)
10:26 PM • Feb 6, 2025
We used Gemini 2 Flash to build Cursor for arXiv papers
Highlight any section of a paper to ask questions and “@” other papers to quickly add to context and compare results, benchmarks, etc.
— alphaXiv (@askalphaxiv)
7:53 PM • Feb 6, 2025
I’m now sharing an extremely detailed colon cancer treatment report from OpenAI Deep Research, posted with my patient friend’s permission (no identifier). This report, obtained after uploading the patient’s case, is highly personalized and truly remarkable! Google doc link below
— Derya Unutmaz, MD (@DeryaTR_)
2:42 AM • Feb 7, 2025
This is wild.
Pika just dropped Pikadditions feature and it's insane!
Now you can add any person or object into your videos.
10 wild examples:
1. Forget Rose, Jack…
— Min Choi (@minchoi)
10:26 PM • Feb 6, 2025
We used Gemini 2 Flash to build Cursor for arXiv papers
Highlight any section of a paper to ask questions and “@” other papers to quickly add to context and compare results, benchmarks, etc.
— alphaXiv (@askalphaxiv)
7:53 PM • Feb 6, 2025