窓から差し込む冬の日差しが、少しだけ傾き始めた日曜の午後。体調はほぼ回復したので、久々のジムへ。上半身中心のメニューをこなし、心地よい疲労感とともにプロテインを流し込む。身体の節々が「使った」と主張するこの感覚、悪くない。
さて今日は、ふと思い立って動画生成AIの世界に浸ってみることにした。
テクノロジーの進化は早く、少し目を離すとすぐに浦島太郎になってしまう。
俺のようなテック好きの端くれとしても、ここらで最新の潮流をキャッチアップしておかねばならない。
…というのは建前で、単純に新しい玩具(おもちゃ)で遊びたかっただけ。
男なんていつまで経ってもそんなもんだろう。笑
動画生成といえば、真っ先に思い浮かぶのは昨年10月にリリースされた「Sora2」だ。
あれは間違いなく一つの革命だった。カット割り、カメラワーク、セリフ。特に、以前はあんなに不自然だった日本語の発話は気味が悪いほど自然だ。10秒以上の長尺動画を生成できる点も素晴らしく、まるでドラマや映画のワンシーンを見ているようで、「AIが作った」とは俄かには信じがたい。
俺もリリース直後に意気揚々とアカウントを作り、色々なプロンプトを試してみた。
頭の中にある「理想の画」を具現化しようと、キーボードを叩く指にも熱が入る。
…だが、現実はそう甘くなかった。
俺が追い求めているのは、ありきたりのモデルのような美青年ではない。もっとこう、味のある、人生の重みを背負ったような「イケオジ」なのだが、どうも俺のプロンプト力が足りないのか、AIの学習データの偏りなのか、しっくりくる男が出てこないのだ。
何度繰り返してもコレジャナイ感が拭えず、結局Sora2のアカウントは塩漬けになりつつある。涙
そんな俺が密かに気に入っているのが「Grok」だ。
イーロン・マスク率いるxAIのアレである。
こいつはSora2に比べれば、生成できる尺は6秒程度と短いし、日本語の発話も正直まだ弱い。
しかし、それを補って余りある魅力がある。
まず、「とにかく生成が早い」。
プロンプトを送信してから形になるまでのスピード感、20秒くらいだろうか?
AI生成に失敗はつきものだけど、こうして高速でガチャを回せるのはかなりのメリットだ。
次の強みは、「アップロードした画像を動画化できる」という点だろう。
手元にある静止画に、命を吹き込むことができる。
(画像の動画化はSora2でもできるらしいけど、人物が映っているとディープフェイク対策なのか弾かれることが多いらしい)
プロンプト(日本語可)を入れて、動画の構成を指示することもできる。多少のガチャ要素——つまり、予想もしない動き方をすることはあるが——先述の生成スピードの早さがあるからあまり気にならない。
実際に、今日Grokで作ってみた動画を貼っておく。
どう? かなり自然じゃない?
興味があれば、是非試してみてほしい。
そして、ここだけの話・・・いや、かなり重要なポイントなのだが。
Grokは、その…コンプライアンスの基準が、他のAIに比べて少し(かなり?)緩い傾向にある。
つまり、ちょっとセンシティブな画像や動画も作れてしまうのだ。(実際、Spicyモードというのも実装されている)
実のところ、これを目的にGrokを愛用しているユーザーも少なくないのではないかと思う。笑
俺も好奇心に勝てず、いくつか「実験」をしてみた。
ここには書けないようなプロンプトを入力し、生成ボタンを押すときのワクワクと罪悪感。笑
そして画面に現れる、妄想が具現化された映像。
…うん、悪くない。いや、むしろ素晴らしい。
だが残念ながら、ここは健全なブログなので公開はできない。
成果物は俺のPCの深い階層にあるフォルダの中に、秘密として封印しておくことにする。
テクノロジーは日々進化し、俺たちの欲望を形にする手段も増え続けている。
Sora2の圧倒的な表現力も、Grokのスピードと背徳的な自由度も、どちらも魅力的だ。
結局のところ、道具を使うのは人間で、そこに何を映し出すかは、俺たちの想像力(と欲望)次第ということか。
気が向いたら、このブログやX(旧Twitter)でも、公開できる範囲の「健全な」動画をアップしていくかもしれない。


