見て泣いたり笑ったり:SynthesiaのAIビデオアバターに感情が追加されました
生成AIは、口頭指示から複雑で本物らしいテキストや画像を作成することによって一般の想像力を刺激しました。しかし、捉えてみると結果はしばしば完璧ではなく、奇妙な指や床タイルがあげられ、数学の問題が正確にそうであると指摘されます。
今、Synthesiaはビジネスユーザー向けにプロモーション、トレーニング、その他の企業用ビデオコンテンツを作成するために設計されたカスタムアバターのビデオで作業する野心的なAIスタートアップの1つとして、その特定の分野での課題のいくつかを乗り越えるのに役立つと期待されるアップデートをリリースしています。最新バージョンには、スタジオでキャプチャされた実際の人間をもとに構築されたアバターが含まれ、ビデオを生成するためにテキストが与えられたときに、より多くの感情、より良いリップトラッキング、そしてより表現豊かで人間らしい動きを提供します。
Synthesiaのこれまでの進捗に続いてリリースされたこの新機能は、大きな注目を浴びています。他のOpenAIのような生成AIプレーヤーとは異なり、チャットGPTのような消費者向けツールで広範な注目を集める一方、APIが独立開発者だけでなく巨大企業によって使用されるB2Bオファリングを構築する戦略を構築しています。-Synthesiaは、他の著名なAIスタートアップが取っているアプローチに重点を置いています
Perplexityが生成AI検索に本当に気を配ることに焦点を当てているのと同様に、Synthesiaは可能な限り人間らしい生成ビデオアバターを作成する方法に本当に気を配っています。より具体的には、トレーニングやマーケティングなど、ビジネス市場のみを対象としており、
長期的な懸念事項に落ち着くときに、ARR、ユニットエコノミクス、AIの実装に関連する運用コストなどの長期的な問題を取り巻く非常に混雑したAI市場で、Synthesiaは目立つことができました
Synthesiaは、新しいExpressive Avatarsとしてリリースされるバージョンを、その種として初めてと説明しています。「AIによって完全に生成された世界初のアバター」と言われています。 Synthesiaは、彼らが実際の人間が話す方法により密接に似た多様な分布を達成するためにそれらが組み合わせられる方法に取り組んできたと述べています。
Synthesiaによれば、これらは振り分けられ、話すときや生活の中で反応するときと同様に近づけられているとのことです。これは、現在の多くのアバターを中心としたAIビデオツールがどのように機能しているかとは対照的です:通常、これらは実際には多くのビデオの断片であり、それらに供給されるスクリプトと、よりまたは更に少なく、顔の反応が作成されるように迅速に繋ぎ合わせられます。目的は、よりロボットらしくなく、より実物らしく見えるようにすることです
以前のバージョン:
新しいバージョン:
ここで2つの例を見ると、Synthesiaの以前のバージョンと木曜日にリリースされるバージョンから、まだまだ進むべき道があることがわかります。CEOのVictor Riparbelli氏自身もそう認めています
「もちろん、まだ100%ではありませんが、年末までには非常に、非常にそうなります。驚くようなものになるでしょう」とTechCrunchに語った。「AIの部分は非常に微妙なのが見て取れると思います。人間には微妙な情報がたくさんあるんです。私たちの顔の筋肉の微細な動きには非常に多くの情報があります。これを人間が説明するのは不可能でしょう。“幸せな時はこんなふうに笑う”とか。しかし、深層学習ネットワークではそれがキャプチャできるんです。実際にパターンを把握し、予測可能な方法で複製することができるんです。」「次に取り組んでいるのは、手です」と彼は付け加えました。
手は、とても難しい」と彼は言いました。
B2Bに焦点を当てることで、Synthesiaはメッセージングと製品をより「安全な」AIの使用に固定するのに役立ちます。そのため、深いフェイクやAIを悪意のある目的で利用することなど、深刻な懸念が大きく残っている現在でも、Synthesiaはそれを完全に回避することができていません。Synthesiaのテクノロジーは以前、ベネズエラでプロパガンダを制作したり、プロ中国のソーシャルメディアアカウントで推進された誤ったニュースレポートを製作するために誤用されていました。
同社は、その使用方法を制限するためにさらなる措置を講じたことを述べています。先月、同社は、「人々が作成できるコンテンツの種類を制限し、悪意を持って行動するユーザーの早期検出に投資し、AI安全性に取り組むチームを拡大し、C2PAなどのコンテンツの資格を示す技術を実験してきた」と述べています。
これらの課題にもかかわらず、会社は成長を続けています。
Synthesiaは、最後の時点で90億ドルを調達したときに最も評価されました。特に、それはほぼ1年前の2023年6月です。
Riparbelli氏は、今月初めのインタビューで、現在さらに資金を調達する計画はないと述べていますが、Synthesiaが積極的にアプローチされているかどうかという問題にはあまり答えていません(注意:私たちは5月にロンドンで私たちのイベントで実際の人間Riparbelliのスピーチを楽しみにしています。 もし街にいるなら、ぜひ来てください。)
確かなことは、AIを構築し実行するのに多くのお金がかかること、そしてSynthesiaがたくさん構築し実行してきたことです。
木曜日のバージョンがローンチされる前に、Synthesiaによれば、20万人以上が18,000万以上のビデオプレゼンテーションを作成し、Synthesiaの225の従来のアバターを使用して130以上の言語で作成しました。 (有料ティア上のユーザーは明記しておらず、Zoom、BBC、DuPontなど様々な大手顧客がいます) スタートアップの希望は、新バージョンが展開されることで、これらの数値がさらに増加することです。