SpeechRecognitionを使って音声認識アプリをつくってみよう②-FP2級薬剤師の薬とお金研究室

SpeechRecognitionを使って音声認識アプリをつくってみよう① の続きです。

今回はローカルの音声ファイル（英語）を使用して認識してみたいと思います。

用意するもの

英語の音声が入ったwave形式の音声ファイル

今回はフリー素材を拾ってきました

手順

※前回行ったインストールは完了しているものとして記載します

（１）vscodeを起動

（２）メニューバーの表示からコマンドパレットを開く

（３）python:Create New Blank Jupyter Notebookを選択

（４）vscode下部のバーのpython3.8.xと表示されている場所をクリックして、condaの仮想環境を選択する

（５）下記のコードを書く

import speech_recognition as sr
r = sr.Recognizer()
with sr.AudioFile("wav/easy.wav") as source:
    audio = r.record(source)
r.recognize_google(audio)

（６）作成したipynbファイルを保存する

（７）用意したwavファイルをフォルダに配置する（今回はipynbファイルを保存したディレクトリにwavというフォルダを用意して、その中に移動しました）

（８）vscodeで実行する（緑色の▷を押す）

（９）成功すると以下のように表示されます

うまくいきました。

次回以降の課題

ffmpegあたりを使ってwavファイルを作成する方法をまとめる

日本語ファイルに対応する

SpeechRecognitionを使って音声認識アプリをつくってみよう②

用意するもの

手順

次回以降の課題

0 件のコメント:

コメントを投稿

アクセスカウンター

カスタム人気記事

カスタムアーカイブ

検索

最新記事

Menu Footer Widget