SpeechRecognitionを使って音声認識アプリをつくってみよう③-FP2級薬剤師の薬とお金研究室

少し間が空きましたが第３回です。

第１回　こちら

第２回　こちら

今回はSpeechRecognitionはさわりません！

音声認識アプリで使用するための音声ファイルを作ってみたいと思います。

やりたいこと

mp4ファイルやmp3、m4aファイルから音声認識で使用するためのwavファイルを作成

ffmpegのインストール

音声ファイルを変換するためにffmepgというツールを使います。

homebrewをインストールします。

ターミナルを起動
brew updateでhomebrewをアップデート
brew install ffmpegを実行
終わったらffmepg -versionと実行してインストールされていることを確認

ファイルの変換

今回はmacのボイスメモで録音した音声を変換します。手順は以下の通り。

ボイスメモの起動
録音
データの移動
変換

１．ボイスメモの起動

アプリの検索に「ボイスメモ」と打ち込んで検索しましたが、アプリを開ければなんでもいいです。

２．録音

起動した以下の画面になるので、赤いボタンを押すと録音がはじまるので喋ります。

録音を停止すると下の画面のように新規録音と出てきました。

３．データの移動

後々のデータの処理を考えて、ファイル名を新規録音からsampleに変更しました。

これを保存するフォルダにドラッグ＆ドロップします。

４．変換

ffmpegを使って変換します。先程保存したフォルダは Users/{user名}/m4a/です。

これをwav形式に変換して Users/{user名}/wav/というフォルダに出力します。

ターミナルで次のコマンドを実行します。

ffmpeg -i Users/{user名}/m4a/sample.m4a Users/{user名}/wav/sample.wav

無事に出力できました。

次回は今回作ったファイルを使って音声認識をしてみます。

SpeechRecognitionを使って音声認識アプリをつくってみよう③

やりたいこと

ffmpegのインストール

ファイルの変換

１．ボイスメモの起動

２．録音

３．データの移動

４．変換

0 件のコメント:

コメントを投稿

管理人

アクセスカウンター

カスタム人気記事

カスタムアーカイブ

検索

最新記事

Chrome OS FlexのインストールディスクをWindowsで作成したら簡単すぎた

[python]webスクレイピング入門①環境構築から動作確認

[python]Excel入門③セルの書式設定をする

AnacondaのWindow10へのインストール

Menu Footer Widget