Gemini 2.5 Flash Image(nano-banana)とは?

スポンサーリンク
AI

スポンサーリンク

概要

Googleは2025年8月26日、最新の画像生成・編集モデル「Gemini 2.5 Flash Image」(愛称:nano-banana)を発表しました。この新モデルは、複数画像の融合、キャラクター一貫性の維持、自然言語による精密な編集、そしてGeminiの世界知識を活用した画像生成・編集を可能にします。

スポンサーリンク

主要機能

1. キャラクター一貫性の維持

画像生成における根本的な課題である、キャラクターやオブジェクトの外見を複数のプロンプトや編集にわたって維持する機能を実現しました。同じキャラクターを異なる環境に配置したり、単一の商品を新しい設定で複数の角度から表示したり、ブランドアセットを一貫性を保って生成することが可能です。

2. プロンプトベースの画像編集

自然言語による精密な変換とローカル編集を可能にします。画像の背景をぼかす、Tシャツのシミを除去する、写真から人物全体を削除する、被写体のポーズを変更する、白黒写真に色を追加するなど、シンプルなプロンプトで様々な編集が可能です。

3. ネイティブな世界知識

従来の画像生成モデルは美的な画像生成に優れていましたが、現実世界の深い意味的理解に欠けていました。Gemini 2.5 Flash Imageは、Geminiの世界知識を活用することで、手描き図表の読み取り、現実世界の質問への対応、複雑な編集指示への対応など、新しいユースケースを開拓します。

4. マルチ画像融合

複数の入力画像を理解し、融合する機能を提供します。オブジェクトをシーンに配置したり、部屋を色合いやテクスチャでリスタイルしたり、単一のプロンプトで画像を融合することが可能です。

スポンサーリンク

技術仕様と価格

  • 価格: 100万出力トークンあたり$30.00
  • 画像あたりのコスト: $0.039(各画像は1290出力トークン)
  • 利用可能: Gemini API、Google AI Studio、Vertex AI(エンタープライズ向け)
  • デジタル透かし: SynthIDによるAI生成・編集画像の識別機能

開発者向け機能

Google AI Studioの「ビルドモード」が大幅に更新され、カスタムAIアプリの迅速なテストや、単一のプロンプトでのアイデア実現が可能になりました。プリセットテンプレートの選択やリミックスも無料で利用できます。

パートナーシップ

  • OpenRouter.ai: 300万人以上の開発者にGemini 2.5 Flash Imageを提供
  • fal.ai: 生成メディアの主要開発者プラットフォームとのパートナーシップ

今後の改善点

Googleは以下の分野での改善を積極的に進めています:

  • 長文テキストのレンダリング
  • より信頼性の高いキャラクター一貫性
  • 画像の細部における事実的表現

まとめ

Gemini 2.5 Flash Imageは、画像生成・編集技術における重要な進歩を表しています。低レイテンシー、コスト効率性、使いやすさを維持しながら、高品質な画像生成と強力なクリエイティブコントロールを提供するこのモデルは、開発者やクリエイターにとって革新的なツールとなるでしょう。

スポンサーリンク
シェアする
JAGAをフォローする
タイトルとURLをコピーしました