ノートPC作業をちょっとラクにするブログ
本記事には広告を含む場合があります
本記事には「アフィリエイト広告」および「アドセンス広告」などの広告を掲載している場合があります。
消費者庁の定める『誇大な宣伝や表現』とならないように配慮し、コンテンツを制作しておりますのでご安心ください。
消費者庁:景品表示法の新運用基準について

【VoxBox】テキストをAIが良い感じに読み上げてくれるソフトをレビュー

ソフト・サービス
ソフト・サービス

どうも、過去に読み上げソフトをつかっていたポテイモ(@poteimoblog)です。

僕は動画を作る際、自分の音声を収録するのは苦手で、機械音声にまかせたいと思っているんですよね。

ただ、普通の音声ソフトだと声が不自然で気になってしまうところ。

そんな中、iMyFoneからAIを使った読み上げソフトである「VoxBox」を紹介されたため、レビューしていきます。

最初に結論

有料版でも読み上げできる文字数や時間に制限はありますが、自然な読み上げができたり、動画や画像から文字の抽出ができる良いソフトと感じています。

本記事はiMyFone様から製品を提供いただいてますが、内容は自由に作成しています。

「VoxBox」について

ここでは「VoxBox」がどんなソフトなのかを説明していきます。

VoxBoxとは

「VoxBox」は中国のWebシステム・アプリ開発を行うiMyFoneがリリースした、テキスト読み上げソフトです。

VoxBox

単にテキストを読み上げるのではなく、AIによって自然な読み上げや、画像や動画、音声からのテキスト抽出を実現しています。

VoxBoxの特徴
  • 画像/PDF/テキストを音声に変換可能
  • 46種類以上の言語に対応
  • 3200個以上のボイスを使える
  • MP3、WAVなど多様な出力&入力フォーマットをサポート
  • 文字起こし以外にも機能を搭載

用意されているプラン

「VoxBox」の支払いプランはサブスク買い切りの2種類に分かれます。以下の表にプランをまとめました。

サブスクリプションプラン買い切りプラン
値段月間:2,280円
年間:5,780円
10,780円
設定できるPC数3台3台
サポート期間中のみ無料更新&サポート永続無料更新&サポート

どのプランも期間以外に内容は同じなので、自分が使う期間に合わせて選びましょう。

基本的に3ヶ月以上使う場合は「年間ライセンス」、2年以上使う場合は「永久ライセンス」がおすすめ。

↑目次へ戻る

「VoxBox」でできること(機能)

「VoxBox」でできること(機能)を紹介します。

テキスト読み上げ機能

自分が入力したテキストをボイスに変換する機能です。AIを使用しているので比較的自然に読み上げてくれます。

VoxBox
読み上げたいテキストを入力し、抽出!

単に読み上げるだけでなく、効果音や速度調整もできるのでカスタマイズもできます。あと、日本語から英語へといった変換も可能。

VoxBox

保存もできるので、紹介動画やYoutube動画に使うのもおすすめ。

画像からの文字抽出機能

画像やPDFから文字を抽出する機能です。資料や画像の文字を起こしたい時に使えます。

VoxBox

また、抽出した文字はテキスト読み上げ機能で使えるため、効果音やボイスへ変換することも可能。

文字おこし機能

動画や音声から文字をテキストにしてくれる機能です。

VoxBox

「1分以内のファイル」という制限がありますが、AIが音声内から人の声を抽出し、文字を起こしてくれます。

ボイスクローン機能

音声ファイルから声をAIによって抽出する機能です。抽出した声はテキスト読み上げのボイスとして使用できます。

VoxBox

ただ、日本語では使用できない点に注意。

その他

読み上げ機能や文字おこし機能がメインですが、他にもおまけ機能が3点あります。

その他の機能
  • 録音
  • 動画・音声ファイルの形式変換
  • 音声編集機能

音声関連であれば「VoxBox」で事足りるように機能が用意されています。

↑目次へ戻る

「VoxBox」の無料版と有料版の違い

「VoxBox」の無料版と有料版の違いを以下の表にまとめました。

無料版有料版
読み上げる文字数3000文字25万文字
文字おこしの時間3分120分
録音の長さ1分制限なし
音声変換形式ファイルの半分制限なし
無料アップデートありあり
編集した音声の出力できないできる
3200種類のボイスと46+言語を選択制限あり制限なし

主な違いは、読み上げできる文字数使えるボイスの種類です。また、読み上げ機能の効果音などの制限の有無もあります。

有料版の機能が気になっている方は30日以内の返金保証もあるので、一旦有料版を使ってみてから考えるのもおすすめです。

↑目次へ戻る

「VoxBox」の使用感

実際に「VoxBox」を使って感じたことを4つ紹介します。

操作画面が見やすい

ソフトの画面がかなりシンプルで、操作も簡単になっています。初めてソフトを開いてからすぐに使い方を理解できたレベル。

VoxBox

環境設定の必要もなく、ソフトの設定欄もかなりシンプルなので、パソコン初心者でもすぐに使えるように仕上がっています。

抽出の精度が高い

画像や動画から文字を抽出は、AIを使っているだけあって精度はかなり高いです。

VoxBox
この画像を抽出して読み上げてみました↓

完璧ではないものの、画像では細かい文字、動画では聞き取りにくい声でもちゃんと抽出してくれますよ。

有料版でも制限がある

「VoxBox」では有料版に切り替えても、読み上げできる文字数と文字おこしできる時間の制限があります。

VoxBox

無料版と比べて文字数や時間はかなり多いですが、有料版なのに制限があるのは個人的に残念。

日本語だとボイスが限られる

テキスト読み上げ機能で使えるボイスが、日本語の場合はかなり限られます。

VoxBox

実際、英語ではフルに使えるところ、日本語では12種類とほとんど使えないんですよね。

オリジナルのボイスを追加できるボイスクローン機能も日本語では使えないので、日本語ではかなり制限が強いのが残念。

↑目次へ戻る

まとめ

この記事では音声読み上げソフト「VoxBox」をレビューしました。

VoxBox

AIを使った読み上げソフトというだけあって、自然に読み上げることができるようになっています。

もし動画に機械音声を使いたい方は、チェクしてみると良いですよ。

↑目次へ戻る

コメント

タイトルとURLをコピーしました