最近よく話題になっている
Stable Diffusion
や
Midjourney
といった画像生成AIがあります。
SNSなどでも連日話題になっており、
「画像生成のAI使ってみた」
といった報告も連日のようになされています。
それぞれの画像生成AIにはそれぞれの特色があるものの、
アニメ風のイラストや
写実的なイラストや
素材のイラスト
などなど、
しっかりと指示をすればある程度のクオリティの画像を高速で生成してくれます。
そして、クオリティの高いイラストまでもが一瞬で作成されてしまうことに驚きを隠せない人は多いようです。
私も他の方が作成した画像を眺めてみましたが、
プロの画家が書いたのではないか?
と感じるような絵が高速でできているのを見ると驚きを隠せません。
そのクオリティにより、
「絵描きをしている人はもうAIに淘汰されてしまうのではないか??」
などとも言われているようです。
しかし、よくよく試しに作成された画像を見ていると、
画像生成AIを上手く使いこなせている人と、上手く使いこなせていない人とでは絵のクオリティが全然違っていることに気付きます。
そして、上手く使いこなせている人は、
上手いこと言語をチョイスをして、細かい指示をAIに与えているようなのです。
特定の画家のようなテイストの画像を生成したい場合にはその画家の名前を入れてみたり、
より細かいシチュエーションについて補足する文章をAIにインプットしたり……
思い通りの画像を生成するためにはどのような文章をインプットするべきなのか?
それを日夜研究している人の間では、
任意にAIを操る文章について、
呪文
という呼称が定着しつつあります。
どのような呪文をAIに入力(インプット)したら思い通りの画像を出力(アウトプット)できるのか?
と、呪文を唱えて結果を検証し続けている様は
まさに、
魔法を上手く使いこなそうとして、呪文を研究し続ける魔術師のようです。
的確な言語・文章を入力すれば、思った通りの結果が出力できる……
それが少しずつ判明していることから、
初心者向けにどんな「呪文」が存在するのかレクチャーしている人も存在するようです。
このように、高速ですごい結果を出すことができる画像生成AIは見る人が見れば、
魔法
とも呼べるものです。
しかし、同時に、
魔法を操るための呪文(言語)を学ぶ必要性
というのも示唆しました。
言葉には大きな力があります。
自分が表現したい内容を相手に伝えたり、少ない容量に圧縮することの基本はやはり言葉の力にあるのかもしれません。
これは、2000年代からニコニコ動画やYouTube動画などのように、動画がもてはやされて、
「文章だけのコンテンツはもはや時代遅れではないか?」
などと言われつつも、
サムネイル画像に書かれている言葉の選定が動画の再生数に大きく影響している現状などを見ると、
思考や表現の基本はやはり言語にある、と感じます。
もちろん、美術鑑賞という言葉があるように、言語以外によって何らかの意思疎通は可能ではありますが、
少ないデータ容量でより大きな情報を相手に伝えることができるという意味では言語の重要性は今後もなかなか揺らがないのではないか、などと感じました。
高性能画像生成AIと詠唱呪文を研究する魔術師たちを見ていると、このような言語の重要性について改めて感じさせるものがありました。
なお、
このような詠唱呪文がどんどん研究されていることとの関係で、実際に生成された画像やその元となる呪文の著作権法上の問題はどうなるのか?
といった論点については、以下の議論が参考になることでしょう。「呪文を法的に保護する方法」についても言及があります。