Google、Google I/O 2026でGemini 3.5 Flashを正式発表

2026年5月19日(UTC)、テクノロジーの巨人Googleは、Google I/O 2026のオープニングカンファレンスで、最新の高速AIモデルGemini 3.5 Flashのグローバルローンチを正式に発表しました。この新技術は、生産において高性能と非常に低い応答時間を求める開発者のための企業の主要な提案として紹介されました。新モデルは本日から、Google AI StudioとVertex AIプラットフォームでテストおよび商業統合のために利用可能です。
イベント中、GoogleのCEOであるSundar Pichaiはモデルの戦略的な位置づけを強調しました:
「Gemini 3.5 Flashでは、開発者が我々のモデルファミリーに期待する深い知性を犠牲にすることなく、驚異的な処理速度を提供しています。これは、クラウドでの大規模なリアルタイムアプリケーションと非常に競争力のあるコストに対する我々の決定的な答えです。」
パフォーマンスベンチマークと200ms未満のレイテンシー
以前のアプローチは、コグニティブクオリティを犠牲にしてトークンあたりのコストを極端に削減することに焦点を当てていましたが、Google DeepMindのチームは、新しい知識蒸留アルゴリズムに基づいてGemini 3.5 Flashのアーキテクチャを洗練しました。Demis Hassabis、Google DeepMindの共同創設者の監督の下、このモデルは、生産環境での複雑なテキストおよびコンピュータビジョンリクエストの大部分において、一貫して200ミリ秒未満の処理レイテンシーを達成しました。これにより、Claude 3.5 Haikuのような市場の高速な代替品と非常に競争力のあるソリューションとして位置づけられています。
応答の生の速度に加えて、この新技術はそのカテゴリーの中で最大の操作能力の一つを提供し、1百万トークンのコンテキストウィンドウを維持しています。この能力により、システムは大量の文書、完全なプログラムコード、さらには数時間のビデオを一度に処理し、ほぼ瞬時に構造化された回答を返すことができます。
価格構造と市場での可用性
公式発表では、標準サービスレベルの料金が確認されました。運用コストは1百万入力トークンあたり1.50米ドル、1百万出力トークンあたり0.60米ドルに設定されており、企業の重要なサポートシステム、自動化された金融分析、リアルタイムな動的データ処理のためのプレミアムで堅牢な選択肢として位置づけられています。Google Cloudのクラウドインフラストラクチャは、この基調講演以降、すべてのグローバルリージョンで新モデルを完全にサポートして運用しています。
このコンテンツは私たちのチーム(iatoskill.com)によって作成およびレビューされました。問題がある場合は、こちらからお問い合わせください


