はい、タイトル通りです。
「AI」というトピックは1~2年前から熱く、
既にネット広告やアナウンスの読み上げなんかはAIを使っているものも有る現状。
画像生成は既に数年の歴史がある分野ですが、
ワタクシがスマホで長年使っている写真編集アプリ
PhotoDirector に最近その機能が搭載されまして。
環境や知識両面でやや敷居の高いモノだったのが、一般向けにカジュアルになって下りて来たタイミングなのかなと。
エヌビディアもブッ飛んでますしね。
ちと、4月から仕事の内容に変化があり、疲れがジワジワ蓄積されて気力がなかなか出ない中、
ちょうど良いタイミングでスマホだけで完結する新しい遊びに手を出し、ガンプラ放ったらかしてAIと睨めっこしてます←
まず基礎知識として。
本来の画像生成AIは、
無から画像を作ります。
どんな画像にするかのAIへの指示は文章で行なわれ、
その指示文を
プロンプト 、俗に
呪文とも言いますw
無から作るので、主体・背景・構図等を全部指示する必要が有り、基本的に対応言語は
英語のみでした。
この時点で非英語話者の民にはハードルが高いw
細かい表現・言い替えが不自由ですから。
まぁ、そのハードルに立ち向かい挑み打ち勝つ原動力は基本的に煩悩の力であるというのは古今東西人の常w
ところが、
今回ワタクシが触れてみた画像生成AIは
あくまで写真編集アプリのオマケ機能なので、
元画像有りきです。
ここが本来の?正式な?画像生成AIと大きく違う所。
(なので肖像権・著作権の問題が絡んでくる可能性有り)
ワタクシ自身、生成AIに触れるのは初めてですが、
本来の画像生成AIがどういう仕組みかというのはザックリとは把握しているので、
今回触ってみた感じ、
やはり機能的にはかなりライト。
何しろ、本来はおびただしい量を流し込むプロンプトが、
僅か100文字までの制限。
更に、これも有って当たり前機能の「強調」指示や「ネガティブプロンプト」(「◯◯を除く、しない、禁止」という否定指示)も無いっぽい。(何しろヘルプもヒントも一切無いから不明w)
一応、
“先に書いた指示が強い” という語順のセオリーは反映されてるっぽいけど。
とは言え、最大の売りは
日本語でぉk(笑)。これはデカイw
ライト仕様というか、専用アプリじゃないし、そもそも全年齢アプリだしとか色んな要素が絡んで、
当然、センシティブワードはNGで全部弾かれます。
(なので、当然、
エロ目的で手を出す人には不向きですww)
(おそらく、カジュアル仕様だからだと思うのですが)
そのワードに付随する連想イメージも纏めて入れ込む傾向があり、
「黒髪」と入れると日中韓の低年齢顔にされたり、
「ロック」と入れると何故か東南アジア系になったり、
「パンク」「ヴィジュアル系」と入れると、勝手に髪色が青~紫~赤辺りになったりします。
なので、「ブリーチした日本人」「黒染めした北欧人」みたいなのを出力するのが難しい。
別のワードの “付随するイメージ” で打ち消すか、当たりが出るまで引き続けるしかない。
反復学習機能も無いので、どれが “望ましい” 方向性かAIに知らせる事も出来ませんw
“付随するイメージ(ステレオタイプ)” が強いワードの使いこなしが鍵。
とりあえず、
実例を見るのが早いと思うのでペタペタと。
一応みんカラなのでw トップバッターはクルマの画像でw
このプロンプトは「ゴシックロック 雲の多い月夜」というシンプルなもの。
たったそれだけの指示でバットマンの世界になりましたw
続いてガンダム。
「スチームパンク 歯車 煙 炎」です。
抽象的な単語を並べるだけでも結構楽しめます。
もう少し長いセンテンスを幾つも入れて具体的に細かく指示すると、よりイメージに近付けてコントロールできますが、情報量オーバーで幾つかの指示が埋もれる事も多いw
また、このアプリのAIは風景が得意らしく、人間は不得意と書いてありました。
まぁ、確かに手指がちょっとおかしくなったり、たまーに腕が3本になったり、顔の見えない後ろ姿がエグいことになったりしますが、それはどの画像生成AIでも同じだし。
ただ、さっきも言ったように、ステレオタイプで人物描写のパターンが少ない感じはする。
(人種差別や!w 反多様性や!w)
被写体と背景の色が似ていて輪郭がハッキリしないものや、逆に無背景のもの、変わったポーズ、アートな切り取り方をした部分アップ等は、長時間考えた挙げ句にエラーになる確率も高め。
セクシーワードは全てNGと既に述べましたが、
詳しく知りたい人も居るかもしれないので少し説明しますとw
まずハッキリと、このアプリのAIでは
脱がせる事は出来ません。(`・ω・´)シャキーン
だし、着てない元画像を使っても、確率90%くらいで勝手に服着せられます。
逆に、
ファッション着せ替えで遊びたい人にはオススメです。
…それなり相応にファッション用語の引き出しも要求されますがw
「NGにならない似たような言い回しでイメージに寄せていく」という
語彙力ゲームですw
(出力したい服の感じにもよりますが、元画像がヌードの方が色々とやりやすい面は有ります。が、慣れてくると、装飾のゴチャ付きっぷりという点でヴィジュアル系のアーティスト画像を使うのが結構面白いw)
あとは…他のメイン被写体(ガンプラとかw)との合成用に風景だけ作るとか。
つうわけで、
以下、ワタクシのファッション性癖を幾つか暴露w
こんなの作れますよ的な。
まだ慣れてない初日の分なので、
全体のテイストと生地感や色、たまに髪型の指示くらいしかしていません。
人種、体型、年齢、背景は全てAIが勝手にやってます。
そして、
元画像の性別に関わらず非常に高い確率で女性が出力されます。
(男っぽいイメージ要素が強いワードを複数入れてやっとって感じ)
我ながら
ひたすらRockやなwww
銀髪が多いのは「シルバーアクセサリー」というワードに引っ張られているからと途中で気付きました。が、好みやからOK(笑)。
画像生成AIとしてはかなりライトなものであると繰り返し申し上げていますが、こんだけ出来りゃ遊びとしては充分ぢゃね?w
あと、不自由ばかりかと言うとそうでもなくて。
元画像有りのメリットとして、
手描きでディティールを追加すれば、本来必要なプロンプトを大幅に削減出来るという面があります。
写真編集アプリならでは。
マジックペンツールで雑に線引くだけでもちゃんと拾って勝手に広げて解釈してくれます。
途中でこのやり方に気付いて自分天才かもしれんと思った。( ̄ー ̄)
以下は、元画像に色んな落書きをしたものを全て同一プロンプトで出力したものです。
ちなみにこの時のプロンプトは、「敢えて好みとは正反対のパステルカラーでフリフリフェミニンな感じを出してみたものの、すぐに堪えられなくなってどんどん服の丈が短くなっていった段階」のモノです←


鞄持たせる、左脚部分の装飾レース、なんてのはまぁ文章でもそんなに難しくないでしょうけど、
後ろ2枚を文章で指示するはそーとーキツくね…?( ̄▽ ̄;)
空中に張ってるリボンなんてそもそも思い付かんわww
基本構図を元画像に強く依存するので、大きめのオブジェクトを文章指示で追加するのはスルーされる確率高い気がする。
ここまでが、手を出してからおよそ24時間以内までの話。
好みのファッション指向を出すのはほぼ初日で一通りやってしまいましたが、
その後数日間で、
・思い付く色んなお題を上手く出せないか頭をひねり
・偶発的に発見した “使える” ワードを鍵に、もう一度初日の呪文を書き替えたり
・だんだんこのAIのクセもわかってきて
・“一発出し” しようとせず、1~2回下地呪文を挟んだ方が良いと思ったり
AIと知恵比べしてるような、アルゴリズム解析的な部分が楽しい。
コレたぶん、(画像生成に限らず)AI触ってる人が必ず最初に経験するんやと思う。
それを
面倒臭ぇ!やってられっか!となるか、
あ、じゃあこうしたら上手くいく?となるか、
めっちゃ性格出ますね。
あと、途中で思ったんやけど、
なんかガンプラと似てるw
一気に全部やろうとすると「無理!」なんやけど、
“思い描く完成” が有って、でもそこに至る道筋は一つじゃ無い。どんなやり方でも、最終的に目指す形になっていればOKみたいな。
チマチマと細かいディティールを先に作って、最後にドーンと塗装してガラッと変えるとかもね。
以下、同じベースを使ってどれだけバリエーション出せるかをお見せしましょう。(何をエラソーにw)

①初日の初期に入れた呪文なので内容忘れたw ロック系の何かw 髪型はショートカット指定。
②それをベースにデニム化。髪型はウルフカット。①を再加工しているので服の基本シルエットが同じなのがわかります。

③同じく①をベースに「トライバル」というワードを試していた時の。「紐」とかも入れてた気がする。
④これも初日の初期の呪文でワード不明w たぶんストリートパンク+タトゥーとかなんやけど、それだけ入れても同じようにはならず、今や再現不能w 「ストリート」だけ入れるとファッションじゃなくて背景が街路になるのよw

⑤「レースアップのニットロングカーディガン」って言ったらワンピースになったヤツw 大きなアウターは元画像に無いものは出にくい。→ベースに手描きでいけることも。
言葉の意味としては同じの「レースアップ」と「編み上げ」が、前者は服装にのみ、後者は髪型にのみ作用するのが面白い。他にもそういうワードを見つけられたら細かい指示が出しやすくなるんやけど…
⑥「大きなスリットのロングタイトドレス」「コケティッシュ」「ボディコンシャス」イヤリングのみで敢えてデコルテを無防備にした事で色気アップ…に感じません?w

⑦センシティブ案件w ⑤⑥からの流れで「シアー」(透け感を意味するファッション用語。シースルーより広義)を試していた時の。語順の後ろの方に入っている「トライバル」に引っ張られて人種が赤道寄りに。
⑧「オーバーサイズのVネックプルオーバーニット」。よくベルトにインしてオーバーサイズじゃなくなるけどw 本来はそういうのをネガティブプロンプトで制御するハズ。
「スキニージーンズ」「ベルボトム」「シューカット」はほぼスルーされましたw

⑨ただの学生では面白くないので「プレッピー」という単語をメインにしました。アメリカの意識高い系お坊ちゃまお嬢様学校を指す俗語。俗語だけどファッション用語w 「タイドアップ」も入れてたかな。
⑩見たまんまです。が、「襟元の詰まった」というワードを入れないとただの中華柄のキャミソールドレスになります。
中華イメージはわりと簡単に出るのに、和装が全く出ない…和服も着物も袴も浴衣も無い所から着せるのは無理。日本人顔も極端に幼いしw 人種差別イクナイ!!(・A・)w

⑪手描きでディティールを足してから和風ワードてんこ盛りにして出たのがコレです… かろうじて若干忍者っぽい…? もうね、着物は無理です。侍も無理です。「和柄刺青」にするとヤ◯ザの女になるし←
⑫ちょっとキワモノ、「蛇柄」「鱗ペイント少量」「濡れた肌」他にも潤い成分幾つかw

⑬たぶん殆どの人には違和感無いと思いますが、実はこれ「アボリジニ」と「ネイティブアメリカン」という似て非なるワードを同時に入れてます。見る人が見たらおかしい要素が出てくると思いますが、まぁそういうキメラ感こそAIじゃないの?と思う。
⑭アルプスの少女の世界。簡単に見えますが結構文字数使ってます。「チロリアン」「レースアップコルセットベルト」「フェミニンシャツ」「フリルスカート」「レース」「メイド服」等々。
元画像のせいでスカートが無いですが、逆にこのファッションでこの絵面は有り得ないから面白いかなと。
文字数多い長い呪文ほど、細かいディティールもブレず強固で安定感のある呪文になります。
次のもそんなのです。

⑮「スチームパンク」をメインに小物ディティールの指示を大量に入れ、「炎」「煙」もトッピング。背景がある元画像を使えばもっと色々出ます。
⑯一応ロック系だけど綺麗じゃない方のヤツw
「シャビールック」「ナスティファッション」「ノーマディック」「グランジロック」「ラギッド」という武骨系ワードを羅列。更にダメージ加工系と泥土オイル汚れ。
これはワードを知っていないとなかなか出ない雰囲気だと思う自信作w
なお、幾つかのワードが “男っぽい” ニュアンスを内包するため、お胸の控えめな女性画像を使うと男性化します←
この⑯の方向性を更に進めたのが…

どちらも呪文内容はほぼ同じで、背景やディティールのハードさがちょい違うだけです。
⑰の方はギリギリまだ綺麗系の名残がありますが、⑱は(プラモで言うところの)ウェザリング表現をかなりハードにして暴力表現一歩手前まで踏み込んだので人によっては顔をしかめるかもしれないモノが出る場合もあります。
語順の最後に「血」も入っていますが、ここに「怪我」を加えると一気にスプラッタグロ要素になってしまったので「怪我」は外しました。ちなみに「傷」「痣」はNGワード。
たぶん、この呪文がこのアプリで出来る一つの限界到達点。もっとグロい方向に振る事は出来ると思うけど、普通に見れてまだ多少なりと “美しさ” を感じられるものとしてギリギリラインじゃないかな?

最後はAIならではの定番のヤツ。
⑲「海の中」「上から差し込む日光」「熱帯魚」「珊瑚」等々。背景・環境に関する指示だけで人物描写は一切無し。…なのにこれまた勝手に低年齢化させられたので、高年齢化しそうなワードで打ち消し。
隠し味に「揺らめく炎」なんてのを入れてみた。
⑳これも単純そうに見えて、このAIの “連想ゲーム” にだいぶ手を焼きましたんw
最初、「月面」「地平線に浮かぶ地球」と入れたら、昭和の感性全開なスーパーマンみたいな全身タイツ着よってw 場所を特定しないワードで環境を設定しました。
服装は雰囲気出すために「サイバー」というワードを入れていますが、普通の服も着てくれるかもしれない。妙な形のマント?は手描き。
…ソンナコンナデ…
ここでもしっかりと凝り性を発揮しておりますw
まだ当分飽きずに難易度高い表現に挑んでそうな予感…シランガナw