少し間が空きましたが第3回です。
第1回 こちら
第2回 こちら
今回はSpeechRecognitionはさわりません!
音声認識アプリで使用するための音声ファイルを作ってみたいと思います。
やりたいこと
mp4ファイルやmp3、m4aファイルから音声認識で使用するためのwavファイルを作成
ffmpegのインストール
音声ファイルを変換するためにffmepgというツールを使います。
homebrewをインストールします。
- ターミナルを起動
- brew updateでhomebrewをアップデート
- brew install ffmpegを実行
- 終わったらffmepg -versionと実行してインストールされていることを確認
ファイルの変換
今回はmacのボイスメモで録音した音声を変換します。手順は以下の通り。
2.録音
起動した以下の画面になるので、赤いボタンを押すと録音がはじまるので喋ります。
録音を停止すると下の画面のように新規録音と出てきました。3.データの移動
後々のデータの処理を考えて、ファイル名を新規録音からsampleに変更しました。
これを保存するフォルダにドラッグ&ドロップします。
4.変換
ffmpegを使って変換します。先程保存したフォルダは Users/{user名}/m4a/です。これをwav形式に変換して Users/{user名}/wav/というフォルダに出力します。
ターミナルで次のコマンドを実行します。
ffmpeg -i Users/{user名}/m4a/sample.m4a Users/{user名}/wav/sample.wav
無事に出力できました。
次回は今回作ったファイルを使って音声認識をしてみます。
0 件のコメント:
コメントを投稿