Google DeepMindは2026年6月30日、2つの新モデルをGoogle AI StudioおよびGemini APIで公開した。画像生成に特化した「Nano Banana 2 Lite(gemini-3.1-flash-lite-image)」と、ビデオ生成・自然言語編集に対応した「Gemini Omni Flash(gemini-omni-flash-preview)」で、いずれも高スループットと低コストを重視した設計になっている。
Nano Banana 2 Liteはテキストから画像を約4秒で生成するのが特徴で、価格は1,000画像あたり0.034ドル(1K解像度)。Gemini Omni Flashはテキスト・画像・ビデオを入力として受け付け、自然言語による動画編集が可能な点が差別化点だ。価格はビデオ出力1秒あたり0.10ドルで、現在は最大10秒の動画を生成できる。両モデルはGoogle AI Studio・Gemini API・Gemini Enterprise Agent Platformで利用でき、今後はGoogle検索・Geminiアプリ・Google Photosなどのコンシューマー向けサービスにも展開される予定だ。
生成AIの競争軸が「速さとコスト」に移行
2モデルに共通するのは「高スループット・低コスト・高速」への最適化だ。画像を4秒で生成し、1,000枚で3.4セントという価格設定は、大量処理を前提とするアプリケーション開発者やプロダクションユースを意識したものとみられる。生成AIが研究用途から実運用へと移行する中、処理性能とコストの両立が競合との差別化軸になりつつあることがうかがえる。
画像・動画の両面から開発者エコシステムを固める狙い
静止画と動画という異なるモダリティを同日に発表した点も注目される。Google AI StudioやGemini APIという共通プラットフォームで提供することで、開発者がマルチモーダルなアプリケーションを単一のエコシステム内で完結できる環境を整えようとする意図が見えてくる。Gemini Omni Flashの自然言語ビデオ編集は、動画コンテンツ制作の自動化需要に直接応えるものとして、メディアやマーケティング領域での活用が広がるとみられる。
コンシューマー製品への展開計画が示す普及戦略
Google検索やPhotosへの統合予定を明示した点は、開発者向けのAPI公開にとどまらず、一般ユーザーの日常的な接点でも生成AIを当たり前の機能として定着させるロードマップを示している。既存のGoogleサービスを流通チャネルとして活用することで、競合に対してリーチ面での優位性を保とうとする姿勢がうかがえる。




