PR

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術! ブログ&AI

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

ニューヨークで設立されたスタートアップ企業が開発したElevenLabsは、最先端のAI技術を活用して自然で高品質な音声を生成するプラットフォームです。

AI技術を駆使してテキストから高品質な音声を生成するサービスで、ボイス生成やテキスト読み上げ、ボイスチェンジャー、吹き替え、スピーチのテキスト化などができます。

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

ElevenLabs

 

ElevenLabsの特徴

  • リアルな音声生成:人間の声に非常に近い自然な音声を生成
  • 音声クローニング:元となるユーザーの声色やトーンの特徴を維持した音声クローンを生成可能
  • 多言語対応:32言語にわたる多言語サポート機能
  • 感情表現の調整:声のトーン、感情、スピードなどを細かく調整可能
  • 高度なAI技術:最新の深層学習モデルを使用した音声合成

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

ElevenLabsの機能

ElevenLabsには、多様な機能があります。

  • テキスト読み上げ(Text to Speech):テキストを入力するだけで、自然な音声に変換できます。多言語対応で、様々なアクセントや感情表現が可能です。

  • 音声クローン(Voice Cloning):自分の声や特定の声のサンプルを提供することで、AIがその声の特徴を学習し、クローン音声を作成します。

  • 吹き替え(Dubbing Studio):映像コンテンツを複数の言語に吹き替えることができ、翻訳と音声生成を組み合わせたサービスを提供します。

  • 効果音生成(Sound Effects):動画や音声コンテンツに使用できる効果音を生成できます。
  • 長文音声生成(Studio):オーディオブックやポッドキャストなど、長めの音声コンテンツを生成する機能を提供します。

  • 音声ライブラリ:様々なタイプの声(ニュースキャスター、ナレーター、スポーツアナウンサーなど)のプリセットを提供しています。

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

料金プラン

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術! 【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

  • 無料プラン:無料、1万文字、基本機能
  • Starterプラン:月額5ドル、3万文字
  • Createrプラン:月額11ドル、6万文字
  • Proプラン:月額99ドル、100万文字
  • Scaleプラン:月額330ドル、400万文字
  • Businessプラン:月額1320ドル、2200万文字

 

ElevenLabsの応用例

ElevenLabsのAI音声技術は、様々な分野で活用されています。

  • コンテンツクリエイション:YouTube動画のナレーション、ポッドキャスト制作
  • 教育:オーディオブック、教育コンテンツの多言語化
  • エンターテイメント:ゲーム、アニメーションのキャラクターボイス
  • ビジネス:プレゼンテーション、トレーニング動画、カスタマーサポート
  • アクセシビリティ:視覚障害者向けコンテンツの音声化

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

ElevenLabsを使ってみた!

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

Text to Speech

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

まずは設定から行います。
ボイスとモデルを選びます。
【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

豊富なボイスがあります。
話させたい言語に合うボイスを選択します。【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

モデルもいくつかあります。
話させたい言語に合うモデルを選択します。【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

話させたい内容をテキスト入力します。
日本語にも対応しています。
【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

「Generate speech」をクリックして、生成します。【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

出来た音声がこちらです。

若干、発音やイントネーションに不自然な点があります。

 

色々なボイスとモデルで試してみましたが、テキストプロンプトを工夫すると良くなります。

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

読み方、発音、イントネーションに違和感がある場合、漢字をひらがなにしたり、句点で区切ると良くなります。

出来た音声は、mp3形式でダウンロードできます。

 

Voice Changer

Text to Speechと同様、ボイスとモデルを選択します。
音源をアップロードするか、自分の声を録音します。

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

「Regenerate speech」をクリックして、生成します。【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

出来た音声がこちらです。

出来た音声は、mp3形式でダウンロードできます。

 

Sound Effect

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

簡単な効果音が生成できます。
音声時間を設定します。
テキストプロンプトを入力し、「Generate」をクリックすると、サンプルが4つ生成されます。
テキストプロンプトが日本語だと上手くいかないことが多いので、英語がおすすめです。
【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

出来た音声がこちらです。

「クルマが通り過ぎる音」

「爆発音」

「吠える犬」

「猫の鳴き声」

 

Speech to Text

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

音声ファイルから、文字起こしが出来ます。
音声ファイルをアップロードして、「Transcribe files」をクリックします。 【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

音声ファイルの正確な文字起こしが出来ています。

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

Studio

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

オーディオブックやポッドキャストを作成できます。

 

Voice生成

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

「Add a new voice」を選択します。
「Voice Design」から声を生成します。 【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

テキストプロンプトを入力します。
ChatGPTなどを使うと便利です。
「Generate voice」をクリックすると、3つのサンプルが生成されます。
良いものがあれば、ボイスを選択して、「Select voice」をクリックします。

【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

名前と言語などを設定して、「Save voice」をクリックして登録完了です。 【ElevenLabs(イレブンラボ)】最先端音声生成AI技術!

 

出来たボイスがこちらです。

 

まとめ

ElevenLabsは、AI技術を駆使して革新的な音声生成サービスを提供するプラットフォームです。テキスト読み上げから音声クローン、多言語吹き替えまで、幅広い機能を通じて様々なニーズに対応しています。無料プランから始められるので、まずは基本機能を試してみるのがおすすめです。

 

関連動画

 

 

生成AI関連ツール紹介ページ

生成AI関連ページ
生成AIとは、文章や画像、音声、動画などを新しく生み出す能力を持つ人工知能のことです。従来のAIがデータ分析を行うのに対して、生成AIは創造的な内容を生成する点で注目されています。文章を生成するAIチャットや、画像を生成するAIツールなど、クリエイティブな領域で急速に広がりを見せており、日常生活やビジネスに新たな可能性を提供しています。このページでは、生成AIに関する記事を紹介します。

 

関連記事

【音読さん】商用利用OKの無料でテキストを簡単音声変換!
ダウンロード不要のオンラインで利用可能なAI搭載の音声読み上げソフトです。テキストを音声に変換するツールで、初期費用がかからず、簡単に使用できます。約50の言語に対応しており、パソコンやスマートフォンからアクセス可能です。
【Zonos(ゾノス)】日本語対応の簡単音声生成AIツール!
ZYPHRA Zonosは、最新の音声合成技術を駆使してテキストを自然な音声に変換するAIツールです。入力したテキストから、まるで実際に人が話しているかのような豊かな表現や感情が込められた音声を生成できます。公式のプレイグラウンドサイトでは、Zonosのデモが体験でき、シンプルなUIを通じて機能性を実感できます。
【SeaArt(シーアート)AI】無料で画像と動画と音声を生成!
SeaArt AIは、シンガポールに本社を構えるSTAR CLUSTER PTE. LTD.が開発・運営する画像生成AIサービスで、2024年8月から日本向けにサービス提供を開始しました。現在では、画像生成だけでなく、動画生成や音声生成も対応しており、進化が止まりません。インストール不要、日本語対応で無料で使えるSeaArt AIを使ってみました。
【SUNO(スノ)AI】簡単プロンプトで作詞作曲できる音楽生成AI!
中年男となり、あまり音楽を聴かなくなった私。学生時代は、ロックやポップ、バラードなどのJ-POPや洋楽をよく聴いていました。当時聴いていたロックバンドの楽曲やポップなものを懐かしく思い、SUNOで作ってみました。無料でも生成できますが、SUNOバージョンはV3.5です。とても簡単なプロンプトで、高品質な楽曲生成が可能なSUNOを紹介します。
【Riffusion(リヒュージョン)】無料楽曲の音楽生成AI!
Riffusionは、画像生成で知られるdiffusion modelの技術を音楽生成に応用したAIツールです。Stable Diffusionなどの画像生成モデルが用いられていた技術をベースに、テキストプロンプトから多様な音楽を生成することができます。

 閲覧ありがとうございました。

*****************
  中年独身男のお役立ち情報局
  Friends-Accept by 尾河吉満
*****************