SpeechRecognitionを使って音声認識アプリをつくってみよう③

2021年8月12日木曜日

mac programing python speechRecognition ボイスメモ 音声認識

t f B! P L

 少し間が空きましたが第3回です。

第1回 こちら

第2回 こちら


今回はSpeechRecognitionはさわりません!

音声認識アプリで使用するための音声ファイルを作ってみたいと思います。

やりたいこと

mp4ファイルやmp3、m4aファイルから音声認識で使用するためのwavファイルを作成

ffmpegのインストール

音声ファイルを変換するためにffmepgというツールを使います。
homebrewをインストールします。
  1. ターミナルを起動
  2. brew updateでhomebrewをアップデート
  3. brew install ffmpegを実行
  4. 終わったらffmepg -versionと実行してインストールされていることを確認

ファイルの変換

今回はmacのボイスメモで録音した音声を変換します。手順は以下の通り。
  1. ボイスメモの起動
  2. 録音
  3. データの移動
  4. 変換

1.ボイスメモの起動

アプリの検索に「ボイスメモ」と打ち込んで検索しましたが、アプリを開ければなんでもいいです。

2.録音

起動した以下の画面になるので、赤いボタンを押すと録音がはじまるので喋ります。
録音を停止すると下の画面のように新規録音と出てきました。

3.データの移動

後々のデータの処理を考えて、ファイル名を新規録音からsampleに変更しました。
これを保存するフォルダにドラッグ&ドロップします。


4.変換

ffmpegを使って変換します。先程保存したフォルダは Users/{user名}/m4a/です。
これをwav形式に変換して Users/{user名}/wav/というフォルダに出力します。

ターミナルで次のコマンドを実行します。

ffmpeg -i Users/{user名}/m4a/sample.m4a Users/{user名}/wav/sample.wav



無事に出力できました。

次回は今回作ったファイルを使って音声認識をしてみます。

管理人

自分の写真
薬剤師・エンジニア 公認スポーツファーマシスト 医療情報技師

アクセスカウンター

70446

検索

最新記事

QooQ