動画生成AI「NoLang」に1分の録音でクローンボイスを作成する機能を追加

1分の録音でクローンボイスを作成する仕組みを示した図。入力した声がトーンに応じて落ち着いた語り口やハキハキした明るい声へ変換される様子

この記事の要点

  1. 動画生成AI「NoLang」に、わずか1分の音声録音から本人の声を再現したクローンボイスを作成できる新機能を追加しました。
  2. 営業・プレゼン向けの落ち着いた語り口や、広報・PR向けのハキハキした明るい声など、TPOに合わせた抑揚や話し方の調整が可能になります。
  3. 作成したクローンボイスは英語への変換にも対応しており、海外向け動画やインバウンド施策におけるコンテンツ制作も効率化できます。
  4. 録音時のトーンやテンションがそのまま反映されるため、動画にナレーションを後付けしたような自然で高品質な音声を実現します。

日本発、登録者数15万人を突破した動画生成AI「NoLang(ノーラン)」を提供する株式会社Mavericks(本社:東京都文京区、代表者:代表取締役社長 奥野 将太)は、わずか1分の音声から高品質なクローンボイスを作成できる「ボイスクローン機能」の提供を開始しました。本機能は、その場で録音した1分間の音声から本人の声を再現したボイスを作成し、そのままNoLangで使用できる機能です。また、既存の音声ファイルからの生成や英語対応も可能となっています。

わずか1分で「声」を資産化する「ボイスクローン機能」

動画生成AI「NoLang」は、テキストやPDFなどの資料から動画を自動生成するサービスとして、2024年7月のリリース以来、登録ユーザー数は15万人を突破。現在では60社以上の法人に導入されるなど、数多くの日本企業で活用されています(2025年11月時点)。今回新たに追加された「ボイスクローン機能」は、ユーザー自身の声のクローンボイスを作成できる機能です。一度作成すれば、あとはテキストやPDF・PPTX資料を入力するだけで、本人の声による動画を自動的に作成できます。モデル作成にかかる時間はわずか1分。ブラウザ上で短い文章を読み上げる、もしくは既存の音声ファイルをアップロードするだけで完了します。特別な機材や長時間の収録は一切不要で、本人稼働の負担をゼロにしながら、信頼性の高い本人の声による動画量産を可能にします。この機能によって、本人のオリジナリティ溢れる動画の作成が容易かつ高品質になることによって、個人の発信力およびブランディングを強力に後押しします。

「ボイスクローン機能」の特徴とメリット

本機能では、利用者の目的や環境に合わせて、2つの作成方法を選択できます。Standard・Premiumユーザーは1分間程度の録音からボイスを作成することができます。法人プラン向けには、この録音からの作成に加えて、既存の音声ファイルからボイスを作成することが可能です。

音声の録音から作成:演技やニュアンスを再現

ブラウザ上でマイクに向かって音声を吹き込み録音する方法です。約1分間の録音のみで、まるで録音した音声をそのまま動画に載せたような高品質な音声を作成することができます。そして、この録音機能の最大の特徴は、「録音時の声のトーンやテンションが、そのままクローンボイスの特徴として反映される」点です。例えば、落ち着いたトーンで録音すれば、営業やプレゼンで相手企業に信頼を醸成するために最適な「信頼感のある静かな語り口」のモデルが、元気にハキハキと録音すれば広報やPRで視聴者に魅力を伝えるために重要な「ハキハキしていて明るい声」のモデルが完成します。これにより、同じ人物であっても、動画の利用シーン(TPO)に合わせて最適な「声の表情」を使い分けることが可能です。

【法人プラン向け】音声ファイルから作成:過去資産の活用と多言語対応

手元にある音声データ1をアップロードして作成する方法です。読み込ませる音声の内容は任意であるため、過去にスタジオで収録した高品質なナレーションデータや、登壇動画から抽出した音声などをそのまま活用できます。これによって、忙しい経営層や管理職に直接録音してもらう必要なく、社内でクローンボイスを作成することが可能です。さらに、英語の音声ファイルをアップロードすることで、その声質のまま「英語のクローンボイス」を作成することも可能です。これにより、日本語話者であっても、数十秒の英語の音声ファイルさえあれば、自身の声で流暢な英語を話す動画を生成でき、海外顧客向けの商品紹介動画や、海外投資家向けの決算説明動画、外国人労働者向けの英語での研修動画など、ビジネスシーンにおける外国人向けの動画作成のハードルを下げることができます。

具体的な活用シーン

さらに、NoLangのクローンボイスは、単なる動画作成における省力化・効率化だけでなく、ビジネスの成果を最大化するための戦略的なツールとして活用いただけます。

【経営企画・IR】トップの声を「多言語」かつ「即時」にグローバル展開

適時開示において、決算短信や説明資料などの文字・画像情報だけでは、経営者の想いや熱量まで伝えることは難しく、一方で多忙な経営者の収録時間を確保することも困難でした。本機能のクローンボイスを活用すれば、本人の稼働負荷ゼロで、経営者の声を用いた動画制作が可能になります。これにより、ステークホルダーに応じたきめ細やかな情報の出し分けが実現します。 例えば、機関投資家には専門用語を用いた信頼性の高い動画を、個人投資家には平易な言葉で噛み砕いた解説を、海外投資家には本人の声質のまま英語で語りかける動画を作成するなど、柔軟な使い分けが可能です。従来と同じ時間・費用で、ターゲットごとに高度にパーソナライズされた効果的なIRを実現します。

【人事・研修】TPOに応じた「声の演じ分け」で、研修効果を最大化

NoLangのボイスクローン機能では、吹き込む際の声色やテンションを反映できるため、コンプライアンス研修には「落ち着いたトーンで真面目な印象」のモデルを、採用やモチベーション動画には「明るいトーンで情熱的な印象」のモデルを使い分けることが可能です。コンテンツの内容に最適な「声の表情」を演出し、受講者の意識を引きつけることで、学習定着率や採用率の向上を実現します。

【広報・ブランディング】自社IP(キャラクター)の声を資産化

自社キャラクターを活用したSNS運用において、魅力的な声質を持つ人物による収録は、日程調整等の工数がボトルネックとなり、トレンドに合わせたタイムリーな発信が困難であるという課題があります。 そこで、声質がよく魅力的な社内メンバーの収録音源をアップロードし、キャラクター専用のクローンボイスを作成します。これにより、テキスト入力のみで即座にその魅力的な声と自社キャラクターを活かした動画生成が可能となります。

能蘭市の魅力をマスコットキャラクターが紹介するサンプル動画

今後の展望

株式会社Mavericksは、今後も動画生成AI「NoLang」の映像表現と音声生成の融合をさらに深めてまいります。企業の持つ「人」や「声」という資産をデジタル活用し、あらゆる企業のコミュニケーションDXと、グローバル競争力の強化に貢献してまいります。

脚注

  1. 音声データはmp3/wav/m4a/aac/ogg/flacのファイル形式に対応

よくある質問

クローンボイスの作成には何分の録音が必要ですか?
約1分間の録音音声があればクローンボイスを作成できます。
作成したクローンボイスは英語でも利用できますか?
はい、日本語で録音した声をもとに英語への変換にも対応しています。
話し方やトーンは調整できますか?
落ち着いた語り口やハキハキした明るい声など、TPOに合わせた抑揚や話し方の調整が可能です。

Mavericks AI ニュース

最新の導入事例

資料ダウンロード

NoLangの導入を
ご検討中の方

NoLangを
ご利用中の方

動画を作成してみる