皆さんご存じの Google Gemini に
新しい機能 nano banana が追加になっていて、
ネットでよく話題を目にします。
当然、やってみたくなりましたので、
やってみました。現状、PCのブラウザ経由だと
無料で出来るのもポイントが高いです。
こちら、ランドクルーザー250です。
はい、かっこいいですね。
でも、一旦それは置いといて・・
この画像を Gemini に読み込ませて、
以下のような指示をする。
「この車を部屋のパソコンデスクの上においてある
フィギュアにしてほしい。部屋のライティングとしては、
電球の様な暖色系がよい」
これで、出てきた画像がこれです。
たったあれだけの指示で、
ここまでイメージ通りのものを出力してくるとは驚きです。
nano banana の凄さは、その言語認識能力と、
これまでの画像AIモデルと比べて、人物などの一貫性のレベルが
段違いに高いという特徴があるようです。
故に追加で以下のような指示を出す。
「ではこの車のフィギュアが、車のダッシュボードに
置いてある様子を描画して欲しい。
車内からの構図で、外にはビーチが見える感じ」
同じモデルが使えていますよね。
これまでのAIだと、しれっと車が変わっていることも多かった。
さらに・・・
「これ、車が左ハンドルなので、右ハンドルにして」
と言う指示をだすだけ、数秒で、
ちゃんと出てきます。
恐ろしいですね。
また、指示した文字を埋め込む、という事も出来るようになっています。
今までのAIは画像に文字が入るときは読めない象形文字みたいに
なっている事も多かった。
まだ、
midjourneyがすごい、と言ってた日から3年ですよ・・
AIの進化の速さが怖すぎる。
でも、この nano banana いろんなアイデアに使えそう。
どう活かすかは、あなた次第
Posted at 2025/09/10 23:50:21 | |
トラックバック(0) |
etc(車要素あり) | 日記