バックエンド

Style-Bert-VITS2をREADME記載外環境で動かしてみる

Style-Bert-VITS2をREADME記載外環境で動かしてみる

はじめに

ume(梅)です。
今回は音声合成ライブラリのStyle-Bert-VITS2を非Windows&x86-64マシン上で構築する手順についてステップ毎に解説します

前提条件

  • 非x86-64のPC
    -> e.g. AppleシリコンのMacBook
  • POSIX準拠のシェル用ターミナル
    -> bash等でコマンドを実行する
  • Python >=3.9
    -> pyptoject.tomlに定義あり
    -> 各種Pythonのバージョン管理ツールの利用を想定する
  • Git
    -> リポジトリのクローン
  • ウェブブラウザ
    -> 動作検証に使用する

最終的な結論

構築

以下のコマンドで構築することができます

git clone https://github.com/litagin02/Style-Bert-VITS2.git
cd Style-Bert-VITS2
# 利用中のツールによるPythonのバージョンおよび環境分離を行う
pip install -r requirements.txt # 依存関係のインストール
python initialize.py # 初期設定

利用手順

リポジトリ上の音声合成, API Serverセクションを参照してください。
お試しで音声合成したり、システムとして組み込むのであればAPI Serverとして動作させるのが良いでしょう。

設定

config.ymlを編集してください。
デフォルトのポートが使用済みだったり、文字列長上限が短い可能性があるのでserver.port, server.limitは特に編集が不要か確認してください。

個別コマンド解説

構築手順について記述されているリポジトリのREADME.mdの77-86行目について解説します。

powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
git clone https://github.com/litagin02/Style-Bert-VITS2.git
cd Style-Bert-VITS2
uv venv venv
venv\Scripts\activate
uv pip install "torch<2.4" "torchaudio<2.4" --index-url https://download.pytorch.org/whl/cu118
uv pip install -r requirements.txt
python initialize.py  # 必要なモデルとデフォルトTTSモデルをダウンロード
README.md#L77-86

1行目

Pythonの依存性解決ツールであるuvをWindows上でインストールしています。
参考: uv公式のインストール手順

powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
README.md#L78

2,3行目

リポジトリからのソースコード取得をしています。

git clone https://github.com/litagin02/Style-Bert-VITS2.git
cd Style-Bert-VITS2
README.md#L79-L80

4,5行目

uv上でフォルダ/ディレクトリ固有のPythonライブラリ環境を作成し、有効化しています

uv venv venv
venv\Scripts\activate
README.md#L81-L82

以下が別案として利用出来ます

python -m venv venv
source venv/bin/activate

6,7行目

依存しているPythonライブラリをインストールしています。
GPUを利用した演算のため、6行目でインストール元URLを指定してtorch, torchaudioをインストールしています。

uv pip install "torch<2.4" "torchaudio<2.4" --index-url https://download.pytorch.org/whl/cu118
uv pip install -r requirements.txt
README.md#L83-L84

CPUのみで構築するのであれば以下のコマンドで十分です

pip install -r requirements.txt

8行目

コメント通りです

python initialize.py  # 必要なモデルとデフォルトTTSモデルをダウンロード
README.md#L85

まとめ

以上、簡単にですが構築コマンド群について説明しました。
皆さんの環境で構築する際の一助になれば幸いです。
OS、バージョン管理ツール全てについて列挙は難しいので逐次読み替えを行なってください。
より簡便な動作確認のためコンテナ環境での構築を考えてます。

AUTHOR
ume
ume
記事URLをコピーしました