日本語音素アラインメントツール pydomino

pydominoとは

pydomino は日本語音声に対して音素ラベルをアラインメントするためのツールです。

内部では、音素遷移予測に基づく音素アラインメントをしています。詳しい説明は 記事 を読んでください。

ソースコードは github にて公開中です。

使い方

pydomino はPythonライブラリとコマンドラインツールの2通りで利用できます。

インストール方法

Linux / Mac

コマンドラインツールがいらない場合はこちらでも直接ライブラリだけインストールできます

pip install git+https://github.com/DwangoMediaVillage/pydomino

Windows

Anaconda Prompt (miniconda3) 環境において MSVC の vcvars64.bat を利用してインストールします

例えば、以下のコマンドでインストールできます

# on `Anaconda Prompt (miniconda3)`
"C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Auxiliary\Build\vcvars64.bat"
git clone --recursive https://github.com/DwangoMediaVillage/pydomino
pip install ./

例示したパスに vcvars64.bat がないなら、例えば以下のような場所にあるかもしれません。

"C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\VC\Auxiliary\Build\vcvars64.bat" or
"C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Auxiliary\Build\vcvars64.bat".

Indices and tables