mkdir voicevox
 cd voicevox
 Invoke-WebRequest https://github.com/VOICEVOX/voicevox_core/releases/latest/download/download-windows-x64.exe -OutFile ./download.exe
 .\download.exe

　pipでPythonのライブラリもインストールします。


 pip install https://github.com/VOICEVOX/voicevox_core/releases/download/0.14.5/voicevox_core-0.14.5+cpu-cp38-abi3-win_amd64.whl

▼フォルダ構造はこんな感じ。


 voicevox
├─ voicevox_core
└─ download.exe

プログラムを実行する

　voicevox_coreリポジトリのサンプルプログラムを試してみたのですが、エラーが出て実行できませんでした。

▼試してみたサンプルプログラムはこちら

https://github.com/VOICEVOX/voicevox_core/tree/main/example/python

　まずは以下のエラーが出ました。PythonもVOICEVOXも、64ビット版をインストールしていました。


 ImportError: DLL load failed while importing _rust: %1 は有効な Win32 アプリケーションではありません。

　DLLファイルの読み込みに失敗しているとのことです。これは先程ダウンロードしたvoicevox_coreフォルダに含まれる、onnxruntime.dllを適切に配置すると解決します。

　以下の二通りの方法でエラーを回避できました。

onnxruntime.dllがあるフォルダでプログラムを実行する
pipでインストールされたvoicevox_coreフォルダにonnxruntime.dllをコピーする

　次に、voicevox_core.blockingが無いというエラーも出ていました。こちらについては今後のアップデートで解決するかもしれません。

voicevox_core.blockingについて

　現在のPythonのバインディングにあるvoicevox_coreには、blocking.pyが含まれています。

▼こちらです。

https://github.com/VOICEVOX/voicevox_core/tree/main/crates/voicevox_core_python_api

　バージョンはリリースされていた0.14.5を使っていましたが、0.15.0がリリースされそうです。そのときに含まれるようになるのかもしれません。

▼リリースについてはこちら。

https://github.com/VOICEVOX/voicevox_core/releases

　以下の記事ではvoicevox_core.blockingを使っていないプログラムがあって、こちらだと実行できました。

▼こちらの記事です。

https://qiita.com/taka7n/items/1dc61e507274b93ee868

　話者をidで指定するのですが、以下のプログラムで一覧を表示できます。

from voicevox_core import METAS
from pprint import pprint
pprint(METAS)

　先程のvoicevox_coreフォルダに、プログラムを保存して実行します。

from pathlib import Path
from voicevox_core import VoicevoxCore, METAS
import sys, os

core = VoicevoxCore(open_jtalk_dict_dir=Path("./open_jtalk_dic_utf_8-1.11"))
speaker_id = 2

text = sys.argv[1]
if not core.is_model_loaded(speaker_id):
    core.load_model(speaker_id)
wave_bytes = core.tts(text, speaker_id)
with open("./" + text + ".wav", "wb") as f:
    f.write(wave_bytes)

　idは2なので、「四国めたん」さんのノーマル音声になっています。

　引数を音声に変換するようにしているので、以下のように実行します。


 python .\voicevox.py こんにちは

▼以下のエラーが出た場合は、open_jtalkのフォルダのパスを確認してください。


 voicevox_core.VoicevoxError: OpenJTalkの辞書が読み込まれていません

　文字列 + .wavのファイルが作成されます。

▼実際の音声はこんな感じ。

最後に

　環境構築がいつも一番大変なのですが、実行できるようになりました。今後のアップデートは要チェックですね。

　Pythonで実行できたということは、アプリケーションに組み込み可能で、Node-REDから実行可能で、ロボットにも組み込めるというわけです。夢が広がりますね。あとは音声認識機能も欲しいところです。

カテゴリー: プログラミング

タグ: Python VOICEVOX

PythonでVOICEVOX COREを使ってみる（音声合成）

はじめに

Text-to-Speech API / Speech-to-Text APIを使ってみる（Google Cloud Platform）

VOICEVOXの概要

Pythonで実行する

環境を構築する

プログラムを実行する

voicevox_core.blockingについて

最後に

コメントを残すコメントをキャンセル

Node-REDをアプリケーションに組み込む　その１（Electron、Express）

Node-RED MCU用のノードを作成してみる　その２（Servoノード）

はじめに

Text-to-Speech API / Speech-to-Text APIを使ってみる（Google Cloud Platform）

VOICEVOXの概要

Pythonで実行する

環境を構築する

プログラムを実行する

voicevox_core.blockingについて

最後に

コメントを残す コメントをキャンセル

Node-REDをアプリケーションに組み込む その１（Electron、Express）

Node-RED MCU用のノードを作成してみる その２（Servoノード）

コメントを残すコメントをキャンセル

Node-REDをアプリケーションに組み込む　その１（Electron、Express）

Node-RED MCU用のノードを作成してみる　その２（Servoノード）