Whisper

プログラミング
音声でロボットを操作してみる(Node-RED、Gemma2、Faster Whisper、XIAO ESP32C3)

はじめに  今回は音声でロボットの操作を試してみました。今まで試してきたことの、ちょっとしたまとめのような感じです。  音声でロボットを操作するにあたって、音声を録音し、テキストを抽出して、そのテキストから状況を判定し、 […]

続きを読む
プログラミング
Node-REDのノードを作成してみる その2(whisperノード)

はじめに  今回はOpen AIのWhisperを利用した、Node-RED用のwhisperノードを作成しました。音声ファイルのパスを渡すと、文字起こしをすることができます。  以前PythonでWhisperを利用で […]

続きを読む
プログラミング
Whisperを使ってみる(音声認識、OpenAI、Python)

はじめに  今回はOpenAIのWhisperを使ってみました。  OpenAIのサービスはAPIキーを使って有料で利用するイメージがあったのですが、ソースコードはMIT Licenseで公開されているようですね。複数言 […]

続きを読む