日本時間2024年10月2日未明。
使い勝手としてはchatGPTには劣るかもしれませんが、面白さという意味ではかなり上位に食い込むであろうサービスが公開されました。
Pikaという企業をご存じでしょうか。
ポケモンではありません。
とあるAIを取り扱う企業です。
では、どんなAIを取り扱っているのでしょうか。
まずはこちらの動画をご覧ください。
実はこの動画、Pika 1.5というAIを使って、実作業時間2分で作成しました。
こちらのサイトの「Try Pika」というところから実際に試していただけます。
作業時間2分のうちの1分30秒は、素材となる面白い画像を探す時間でしたので、実質30秒です。
たった30秒の作業だけで、この動画は完成しました。
私がすることは、画像を選ぶこと、プロンプトを選ぶこと(どんな画像を作るかの選択)、そして待つこと。
さすがに動画生成には数十分を要していましたが、その間別のことをしていれば良いだけなので、全く問題ありません。
(素材となる画像の画質によってもかなり変化していました。)
今回は対象物をケーキにするというプロンプトを選択しましたが、他にも
・溶かす
・風船のように膨らませる
・グミのようにぐにゅぐにゅさせる
・押しつぶす
・爆発させる
といったエフェクトが用意され、自由に楽しむことができます。
こちらはPika社のX(旧:Twitter)のポストなのですが、トイレにいろいろなエフェクトを適用した動画が公開されています。
https://x.com/pika_labs/status/1841236385052967351
AIの力、本当にすごいです。
2か月ほど前、Meta(旧:Facebook)が公開したSAM2というモデルを使うことで、動画に効果を付け足すことができる…という紹介をしたのですが、それとはまた異なったすごさがあります。
この動画を作るために必要な技術を少し考えてみました。
まずは、対象物を認識するモデル。
トイレの画像を見ていただければわかるのですが、対象物以外の壁や床には変化が生じていません。
加えて、物体を立体としてとらえることも必要です。
個人的には、後者の方が困難であるように思われます。
というのも、画像認識のAIにとって、物体を立体的にとらえることは困難であることが知られているからです。
実際にchatGPTに頼んでみると、東京タワーを下から描写して、上から描写して、という指示はとても苦手の様子でした。
ですがこのPika 1.5では、それができているとしか思えません。
そうでなければ、爆散する映像を作ることは難しいと思われるからです。
人間の想像力と、それを容易に実現してくれるAI。
この二つをうまく組み合わせることができれば、世界はがらっと変わっていくに違いありません。
P.S.
↓メルマガの新規登録はこちらから↓
https://48auto.biz/keieijinji/touroku/sp/scenario13.htm
(スマートフォンよりご登録いただけます)