動画や音楽ファイルから音声の文字起こしが
できるソフト。音声認識モデルAI「Whisper」を
使用して、自動で高品質な文字起こしが可能。
オフラインで動作する便利過ぎる無料ソフトです。
リンク先
ダウンロードと実行
上記リンク先ページを開いて、「Download」をクリックしてファイルをダウンロードします。
ちょっとサーバーの応答が遅いのか、ダウンロードに少し時間が掛かるかも知れません。
ダウンロードしたファイルは、7z形式なので注意が必要です。7zに対応した解凍ソフトで
解凍します。
解凍したファイルを一つのフォルダなどにまとめて、EXE実行ファイルを起動します。
使い方
こんな画面が表示されます。画面上部がメディアファイル再生部分、中央にツールバー、
画面下部に拾い出した音声を文字起こしして表示されます。
まずはこのEjectボタンを押してメディアファイルを読み込みます。
次に言語アイコンで、音声の言語を選択します。
その横のAIアイコンをクリックして、Tiny~Largeまでの音声認識モデルを選択します。
下に行くほど精度が上がりますが、3GB超のデータがあります。
まずはTinyなどで試してみて、丁度良さそうな精度を見つけていく方が良いと思います。
Largeは3GBもあります。好きな音声認識モデルを選んで、Downloadをクリックします。
最後にKoe Millアイコンをクリックすると、メディアファイル内の音声から文字起こしを開始します。
メディアファイルの長さによっては一瞬で終わる時もあります。
少し間違っている部分もありますが、概ね良好な感じです。TinyからSmallなど
音声認識モデルを上げていくとより正確になっていきます。
好きな音楽ファイルMP3を読み込んでみました。歌詞がしっかりと認識して
文字起こしが出来ました。
認識した文字は、SRTファイルとして書き出しが可能です。
動画制作などにも便利で、セリフを付けたりも簡単にできます。
音声認識モデル、Whisperを活用した便利でスゴイソフトです。
コメント