D-IDは、ジェネレーティブAIを用いて、企業やクリエイター向けに、ボタン1つでしゃべるアバターを使ったカスタマイズ動画を作成します。Creative Reality Studioは、最新のAIツールを用いて、画像、音声、テキストからしゃべるアバターを生成することができます。また、「Live Portrait」「Speaking Portrait」では、それぞれ写真から動画を、テキストや音声からトーキングヘッドビデオを作成することができます。
D-ID Creative Reality
使いやすさ - 6
コストパフォーマンス - 5
感動度 - 4
専門性 - 5
完成度 - 3
4.6
Neither
レビュー
アバターがテキストの読み上げをしてくれるAI。
アバターは画像をアップロードして反映させるか、モデル(StableDiffusion)を生成する2つの方法があります。
日本語対応しているので、英語と日本語で遊んでみました。
無料トライアルでは20クレジットの制限があります。
プランについてはこちら
やってみた
画面はこんな感じ
・左の「Create Video」から新規作成
・中央の画面ではアバターが選択または生成できます。
Choose a Presenter:実写のアバターから選択または新規アップロードが可能
Generate AI Presenter:AI生成したアバターから生成または新規で生成が可能
・右のパネルで、話してほしい言葉、言語、ボイスモデル、タイプ(ニュースキャスターや友達など)を選択。
全て設定したら、画面右上の「GENERATE VIDEO」でアバターが話すビデオが生成されます。
画像アップロードの際は結構制約があるので注意。ちなみに有名人などは肖像権の関係でエラーになります。
今回は、
Hello. Have you listened to Paramore’s new album? It’s great, isn’t it?
Especially the first song is my favorite.
(こんにちは。パラモアの新譜聴きましたか?最高ですよね。特に一曲目が私のお気に入りです。)
最近ブレードランナー見返したんだけど、ガチでおもしろいわあの映画。最後泣いちゃった!
この2つでテストしてみたいと思います。ちなみに一人目がアメリカのジェニーさん。フレンドリーに話してもらいます。
二人目は日本人のナナミさんで、陽気な感じでお願いしました。
結果
ジェニーさん
かわいい。英語がわからないので自然かどうかはちょっとわかりません。
ナナミさん
うーん・・・・・
ナナミさんの方は機械音声まるだしすぎました。でもこの音声に合うセリフや口調があると思いますし、日本語は男女あわせて7つのボイスモデルがあるので、色んなアバターの組み合わせでやってみると面白そうです!
具体的なアウトプット例
ビジネス
- 自社ビデオの専任アナウンサー
- SNSでの活用
一般
- キャラクターを生成してYoutube動画を作成
- 自分の写真を使って流暢(?)な外国語を喋らせてみる