- 電時流⚡️
- Posts
- DeepSeekがAI開発における「大きいほど良い」という前提を根底から揺るがす
DeepSeekがAI開発における「大きいほど良い」という前提を根底から揺るがす
また、QwenはR1リリースに続き高度なビジョンモデルを発表

⚡️ 見出し
🤖 AI
DeepSeekに関して多くの人が理解していない5つのこと – Gary Marcusが詳しく解説。[Marcus on AI]。
DeepSeek、大規模なサイバー攻撃を受け登録を制限中と発表 – 中国のAIスタートアップDeepSeekは、新規登録に影響を与える重大なサイバー攻撃を受けたと報告。ただし既存ユーザーには影響なし。[CNBC]。
中国のDeepSeek、AI市場を混乱に陥れる – 中国のDeepSeek AIアシスタントのリリースが世界のテクノロジー株を急落させ、Nvidiaは市場価値の記録的損失を被る。[Reuters]。
DeepSeek vs. ChatGPT: DeepSeekのR1チャットボットを徹底比較 – DeepSeekのR1チャットボットとOpenAIのChatGPTを比較。革新的なトレーニング手法と市場への影響力を示す一方で、AI特有の課題も浮き彫りに。[Wired]。
スタートアップPerplexityが非検閲版DeepSeek AI検索を提供 – Perplexityは、DeepSeekと名付けられた非検閲のAI検索エンジンを導入し、ユーザーの情報アクセスを変革することを目指す。[The Information]。
よりスマートで個別化されたアシスタントに向けての構築 – MetaがAIアシスタントの進化を発表。ユーザーの好みを記憶し、個別化された推奨を提供することに重点を置いている。[Meta]。
🤳 ソーシャルメディア
TikTok、2025年版マーケティングカレンダーを発表 – TikTokが2025年のマーケティングカレンダーを発表し、ブランドが季節ごとのキャンペーンを最適化し、エンゲージメントを最大化するのを支援。[Social Media Today]。
⚖ 法律
トランプ、近い将来の関税を宣言し、DeepSeekの進展を「良いこと」と評価 – トランプ大統領は、輸入コンピュータチップや医薬品に対する関税を近く実施する計画を発表。一方で中国のDeepSeek AIの進展を肯定的に評価。[Bloomberg]。
🎱 その他
ソフトバンクの孫氏、ホワイトハウスへの復帰を果たすまでの道のり – ソフトバンクのCEO、孫正義氏がStargateデータセンタープロジェクトに400億ドルの投資を計画。米国のテクノロジー分野への本格復帰を果たす。[The Information]。
買い控え、あるいは全く買わないことを誓うアメリカ人たち – 物価高や家庭の債務が増加する中、より多くのアメリカ人が新たな購入を控えたり、ゼロに抑えたりすることで、財政的責任と債務削減に集中している。[The Wall Street Journal]。
🔌 これに接続して
中国のAIスタートアップDeepSeekは、最新のAIモデルR1を発表しました。このモデルは、OpenAIの最先端技術と同等の性能を発揮しながら、必要な計算資源や予算が大幅に少ないことが特徴です。この進展は、AIにおいては規模の大きさこそが進歩の鍵であるという長年の信念を揺るがすものです。

パラダイムシフト: DeepSeekのR1モデルの成功は、OpenAIのサム・アルトマンのような業界リーダーが主張してきた「規模を拡大することでAIの性能が予測通りに向上する」という概念を打ち破ります。
リソース効率: 米国のAI企業がGPUやデータセンターに数十億ドルを投資する一方で、DeepSeekは比較的控えめな予算で革新を達成し、規模よりもスマートで効率的な手法の可能性を示しました。
市場への影響: AI革命を支える主要なGPU供給者であるNvidiaは、DeepSeekの効率的な技術革新のニュースを受け、市場評価額が6000億ドル減少するなど大きな財務的影響を受けました。
Deepseek V3 and R1 discourse boils down to this. Shifting the curve means you build more and scale more dummies
— Dylan Patel (@dylan522p)
5:34 PM • Jan 26, 2025
❔ DeepSeekの急成長は、将来のAI開発戦略、特にコスト削減に関する重要な疑問を投げかけ、これまで米国で一般的だったリソース集約型のAIスケーリング手法の環境的および経済的影響に対して、より深刻な再考を促しています。
Qwenは最新の視覚と言語統合モデルであるQwen2.5-VLを発表しました。このモデルは、従来のQwen2-VLから大幅に進化しており、3B、7B、72Bの3つの構成で提供されています。Qwen Chat、Hugging Face、およびModelScopeで利用可能です。

強化された視覚理解: Qwen2.5-VLは、植物や動物、さまざまな製品を含む多様なオブジェクトを認識する能力に優れています。また、画像内のテキスト、チャート、アイコン、グラフィック、レイアウトなどの複雑な視覚要素も巧みに分析します。
エージェント機能: このモデルは視覚エージェントとして機能し、推論を行いながらツールを動的に操作でき、コンピュータやスマートフォンなどのデバイスとの対話を支援します。
高度な動画理解: 1時間を超える動画を理解し、関連するセグメントを特定する能力を持ち、動画コンテンツ内のイベント検出を向上させます。
精密な視覚的ローカライゼーション: 画像内のオブジェクトを正確に特定し、バウンディングボックスやポイントを生成します。また、座標や属性を詳細に示す安定したJSON出力を提供します。
構造化データの出力: 請求書やフォーム、表などの文書に対して、Qwen2.5-VLは構造化コンテンツの抽出をサポートし、金融や商取引に役立ちます。
The burst of DeepSeek V3 has attracted attention from the whole AI community to large-scale MoE models. Concurrently, we have been building Qwen2.5-Max, a large MoE LLM pretrained on massive data and post-trained with curated SFT and RLHF recipes. It achieves competitive… x.com/i/web/status/1…
— Qwen (@Alibaba_Qwen)
3:31 PM • Jan 28, 2025
👁️ Qwen2.5-VLのリリースは、視覚と言語モデルの急速な進展を示しており、包括的な視覚理解と動的なツール操作の統合を強調しています。
DeepSeekは、テキストから画像を生成するために設計された新しいマルチモーダルAIモデルファミリー「Janus Pro」を発表しました。同社は、Janus ProがOpenAIのDALL-E 3などの既存モデルを上回る性能を発揮すると主張しています。

モデルバリエーション: Janus Proは、1Bおよび7Bパラメータの2つの構成で提供されており、異なる性能とリソース要件に対応しています。
高度な画像生成: このモデルはテキストプロンプトに基づいて高品質な画像を生成するよう訓練されており、現在のテキストから画像への生成器の能力を向上させることを目指しています。
アクセス性: DeepSeekは、Janus Proモデルを開発者や研究者が利用できるようにし、さまざまなアプリケーションへの統合と分野におけるさらなる革新を促進しています。
NEW: DeepSeek Janus Pro 1B (Generate Images, Chat with PDF) running in your browser, 100% local, powered by WebGPU 🔥
Zero server costs, brought to you by transformers.js - try it out!
— Vaibhav (VB) Srivastav (@reach_vb)
7:32 AM • Jan 28, 2025
🔥 先週のバイラルな瞬間に続く今回の発表で、DeepSeekは米国のビッグテック企業に対する圧力をさらに強化しています。この企業にできないことはあるのでしょうか?この過剰な期待はいつ終わるのか、そしてその影響は誰に及ぶのでしょうか?
🆕 更新
🎥Introducing Hailuo T2V-01-Director Model: Control Your Camera Like a Pro!
📷 Direct with natural language or simple commands.
🔄 Combine movements for flawless, cinematic transitions.✨ What’s New:
- Reduced randomness in movements.
- Enhanced control accuracy.
-… x.com/i/web/status/1…— Hailuo AI (MiniMax) (@Hailuo_AI)
9:47 AM • Jan 28, 2025
📽️ 毎日デモ
DeepSeek R1 + FactSet = Financial Research on Steroids
— Aravind Srinivas (@AravSrinivas)
8:25 PM • Jan 28, 2025
Check out this real-time screen recording that demonstrates voice interaction with low latency and interruptions using Gemini 2.0. Try it using a simple prompt and create your own game 👾 → goo.gle/42z1HeK
— Google AI Developers (@googleaidevs)
6:00 PM • Jan 28, 2025
🗣️ 対話
The DeepSeek-R1 paper is a gem!
Highly encourage everyone to read it.
It's clear that LLM reasoning capabilities can be learned in different ways.
RL, if applied correctly and at scale, can lead to some really powerful and interesting scaling and emergent properties.
There… x.com/i/web/status/1…
— elvis (@omarsar0)
11:10 PM • Jan 20, 2025
DeepSeek R1 has really changed the AI LLM game.
People are creating wild use cases beyond ChatGPT. There's a major shift.
10 examples:
— Min Choi (@minchoi)
2:59 PM • Jan 28, 2025
Market close: $NVDA: -16.91% | $AAPL: +3.21%
Why is DeepSeek great for Apple?
Here's a breakdown of the chips that can run DeepSeek V3 and R1 on the market now:
NVIDIA H100: 80GB @ 3TB/s, $25,000, $312.50 per GB
AMD MI300X: 192GB @ 5.3TB/s, $20,000, $104.17 per GB
Apple M2… x.com/i/web/status/1…— Alex Cheema - e/acc (@alexocheema)
11:15 PM • Jan 27, 2025
🐋 DeepSeek 🤝 LangChain 🦜
DeepSeek has taken the community by storm since open-sourcing R1, a powerful model that reasons like OpenAI's o1 while also exposing its thought process!
LangChain offers many ways to use it in your projects alongside the faster deepseek-V3 in Python… x.com/i/web/status/1…
— LangChain (@LangChainAI)
5:15 PM • Jan 28, 2025