• 電時流⚡️
  • Posts
  • GoogleのWhisk AIツールで写真からプロンプトの創造性を実現、OpenAIは開発者向けの高度なツールを備えたo1推論モデルを発表

GoogleのWhisk AIツールで写真からプロンプトの創造性を実現、OpenAIは開発者向けの高度なツールを備えたo1推論モデルを発表

⚡️ クイックニュース

🤖 AI

NVIDIAがJetson Orin Nano Superを発表:手頃な価格の生成AI用スーパーコンピュータ - NVIDIAの新しいJetson Orin Nano Super開発者キットは、249ドルの低価格で強化された生成AI機能を提供し、開発者や趣味家向けに最大1.7倍のパフォーマンス向上を実現します。[NVIDIA Blog]

GoogleのCode Assistがサードパーティツール統合を拡大 - Googleの企業向けコードアシスタント、Code Assistが人気の開発環境と統合してサードパーティツールをサポートし、開発者の利便性を向上。[TechCrunch]

Talkieが成長課題の中でAIビデオ機能を検討 - Character.AIのライバルである中国発のAIアププTalkieは、月間アクティブユーザーの減少を受けて成長を再活性化するためにAIビデオ機能の導入を計画。[The Information]

🎨 クリエイティブ

YouTubeがクリエイターのAI生成コンテンツを検出・管理へ - YouTube はCreative Artists Agency(CAA)と協力し、セレブリティやクリエイターのデジタル肖像権を保護するため、AI生成コンテンツを特定・管理する技術の実装を計画。[Variety]

₿ 暗号資産

機関投資家の関心の中、ビットコインが108,000ドルを突破 - ビットコイン価格が108,000ドルを超え、アナリストは機関投資家の投資により近い将来210,000ドルに到達する可能性を示唆。[Crypto.News]

アーサー・ヘイズがトランプ就任後の暗号資産市場の下落を予測 - BitMEXの共同創設者アーサー・ヘイズは、次期大統領トランプの就任後に重要な暗号資産市場の下落が起こると予測し、投資家に潜在的な変動に備えるよう助言。[Cointelegraph]

⚖ 法務

OpenAIの営利モデルへの移行がガバナンスの懸念を引き起こす - OpenAIの非営利から営利企業への移行により、そのガバナンス構造と人類の利益のためにAIを発展させるという当初のミッションへのコミットメントについて議論が巻き起こっています。[The New York Times]

トランプ政権がH-1Bビザプログラムの大幅な見直しを計画 - 次期トランプ政権は、テクノロジー産業の外国人材採用能力に影響を与える可能性のあるH-1Bビザプログラムの重要な変更を実施する予定。[The New York Times]

🧪 研究

大規模言語モデルの推論安定性を評価する新研究 - 研究者らは、大規模言語モデルの推論安定性を評価する新しい指標「G-Pass@k」を導入し、AIの開発においてより堅牢な評価方法の必要性を強調。[arXiv]

🎱 その他

アップルマップスのウェブアプリにルックアラウンド機能を追加 - アップルはマップスのウェブアプリケーションを更新し、ブラウザから直接インタラクティブなストリートレベルの画像を提供するルックアラウンド機能を追加。[9to5Mac]

ChatGPTに1-800-ChatGPTで電話できるようになりました - または同じ番号にWhatsAppで連絡することもできます。[X]

🔌 詳細をチェック

Googleの新しいAIツールWhiskは、既存の写真をクリエイティブなプロンプトとして使用して画像を生成することができます。このシステムは高度なAIモデルを統合し、デザイナーやカジュアルユーザー向けに素早く直感的なビジュアル探索オプションを提供します。

  • Whiskでは、写真をアップロードして被写体、スタイル、背景を定義し、複数の画像を使用して結果を調整することができます。

  • Gemini AIがアップロードされた画像をテキストベースの説明に変換し、Imagen 3がそれを使用して新しい画像を作成します。

  • ユーザーは、より正確な画像生成のために写真とテキストプロンプトを組み合わせることができます。

  • 適切な開始画像を持っていないユーザーのために、AIが推奨する写真を提供します。

  • プロンプトを調整して結果を繰り返し再生成できる改良オプションがあります。

🎨 Whiskは、AIを使用した画像の創造的な実験をより身近で迅速なものにし、ビジョンと創造の間のギャップを埋めます。

OpenAIは、複雑な多段階タスクを高度な精度で処理するように設計された推論モデルo1を発表しました。このリリースに伴い、AI駆動アプリケーションのパフォーマンス、柔軟性、コスト効率を向上させる複数の開発者ツールが提供されています。

  • o1モデルの機能:関数呼び出し、開発者メッセージ、構造化出力、ビジョン機能をサポートし、外部データとAPIとのシームレスな統合を可能にします。

  • リアルタイムAPI更新:低遅延のリアルタイム音声対話のためのWebRTCサポート、GPT-4oオーディオの60%価格削減、低価格のGPT-4o miniのサポートを導入。

  • プリファレンスファインチューニング:特定のユーザーと開発者の好みに基づいてモデルをカスタマイズできる新しい技術。

  • 新しいSDK:多様な開発環境への統合を容易にするGoとJavaのSDKベータ版をリリース。

🚀 これらの進歩は、AIアプリケーション開発を効率化し、開発者に高度なリアルタイム会話体験を構築するための強化されたツールを提供することを目指しています。

CEO Ali Ghodsiが率いるDatabricksは、無料ソフトウェアの提供から、大手企業が利用する堅牢なエンタープライズプラットフォームへと進化し、620億ドルの評価額に達しました。

  • 戦略的転換:2016年、GhodsiはDatabricksを無料ソフトウェアから有料モデルに移行し、WalgreensやRivianなどの大手クライアントを引き付けるための機能を強化しました。

  • Microsoft連携:2017年のMicrosoftとの重要な提携により、DatabricksはAzureに統合され、売上と市場シェアが大幅に拡大しました。

  • 業務効率化:Ghodsiは、業務の効率化と生産性向上のために、ジョブのオフショアリングやAIボットの開発などの施策を実施しました。

  • 成長のための買収:AI企業MosaicMLを13億ドルで買収するなど、最近の買収によりDatabricksのAIとデータ管理の能力が拡大しました。

  • 資金調達の決定:IPOではなく100億ドルのプライベートファンディングラウンドを選択し、Ghodsiは企業成長と従業員へのインセンティブ提供を目指しています。

💸 Databricksの史上最大となる100億ドルのVCラウンドは、AIの継続的な勢いを示すもう一つの指標です。これはバブルの兆候でもありますよね?

📸 クリエイターコーナー

著名なAI画像生成ツールMidjourneyが、クリエイティブワークフローを大幅に強化する新機能を導入しました:

Pinterestにインスパイアされたムードボード

ユーザーは、キュレーションされた画像コレクションを「ムードボード」としてアップロードし、新しいアートを生成するためのインスピレーションとして使用できます。AIはこれらの画像のビジュアル要素に適応し、ユーザーの美的好みを反映したユニークなスタイルプロファイルを作成します。

複数のパーソナライゼーションプロファイル

プラットフォームは現在、複数のパーソナライゼーションプロファイルをサポートし、ユーザーはMidjourneyの最新AIモデルバージョン6.1のカスタムバージョンを作成して切り替えることができます。これにより、様々なプロジェクトでパーソナライズされたスタイルをシームレスに統合できます。

カスタムモデルセットアップの効率化

カスタムモデルのセットアップが効率化され、画像ランキング速度が5倍向上しました。プロファイル作成を開始するには40の画像評価が必要で、200の評価で最適な安定性を達成します。この効率化されたプロセスにより、新規ユーザーの参入障壁が下がり、より迅速なパーソナライゼーションが可能になります。

🤔 最終的な考察

記録的な評価額と開発者の集中的な注目の中で、疑問が残ります:私たちは持続可能なシステムを構築しているのでしょうか、それとも痛みを伴う修正が待ち受ける投機的なバブルを膨らませているのでしょうか?

これらの製品の改善速度は、これまでテクノロジーを支配してきた物理法則を超えて、業界を前進させる可能性を秘めています。

~ JL