日本語音素アラインメントツール pydomino
pydominoとは
pydomino は日本語音声に対して音素ラベルをアラインメントするためのツールです。
内部では、音素遷移予測に基づく音素アラインメントをしています。詳しい説明は 記事 を読んでください。
ソースコードは github にて公開中です。
使い方
pydomino はPythonライブラリとコマンドラインツールの2通りで利用できます。
インストール方法
Linux / Mac
コマンドラインツールがいらない場合はこちらでも直接ライブラリだけインストールできます
pip install git+https://github.com/DwangoMediaVillage/pydomino
Windows
Anaconda Prompt (miniconda3) 環境において MSVC の vcvars64.bat を利用してインストールします
例えば、以下のコマンドでインストールできます
# on `Anaconda Prompt (miniconda3)`
"C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Auxiliary\Build\vcvars64.bat"
git clone --recursive https://github.com/DwangoMediaVillage/pydomino
pip install ./
例示したパスに vcvars64.bat がないなら、例えば以下のような場所にあるかもしれません。
"C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\VC\Auxiliary\Build\vcvars64.bat" or
"C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Auxiliary\Build\vcvars64.bat".