SpeechRecognitionを使って音声認識アプリをつくってみよう②

2021年7月7日水曜日

anaconda pyaudio python speechRecognition vscode 音声認識

t f B! P L

SpeechRecognitionを使って音声認識アプリをつくってみよう① の続きです。


今回はローカルの音声ファイル(英語)を使用して認識してみたいと思います。


用意するもの

英語の音声が入ったwave形式の音声ファイル
今回はフリー素材を拾ってきました

手順

※前回行ったインストールは完了しているものとして記載します
(1)vscodeを起動

(2)メニューバーの表示からコマンドパレットを開く


(3)python:Create New Blank Jupyter Notebookを選択


(4)vscode下部のバーのpython3.8.xと表示されている場所をクリックして、condaの仮想環境を選択する

(5)下記のコードを書く


import speech_recognition as sr
r = sr.Recognizer()
with sr.AudioFile("wav/easy.wav") as source:
    audio = r.record(source)
r.recognize_google(audio)
(6)作成したipynbファイルを保存する

(7)用意したwavファイルをフォルダに配置する(今回はipynbファイルを保存したディレクトリにwavというフォルダを用意して、その中に移動しました)

(8)vscodeで実行する(緑色の▷を押す)

(9)成功すると以下のように表示されます

うまくいきました。

次回以降の課題

ffmpegあたりを使ってwavファイルを作成する方法をまとめる
日本語ファイルに対応する

管理人

自分の写真
薬剤師・エンジニア 公認スポーツファーマシスト 医療情報技師

アクセスカウンター

70736

カスタムアーカイブ

検索

最新記事

QooQ