Amazon Elastic Container Service (ECS)にsquidでプロキシサーバーを構築した
gene
デロイト トーマツ ウェブサービス株式会社(DWS)公式ブログ
ume(梅)です。
今回は音声合成ライブラリのStyle-Bert-VITS2を非Windows&x86-64マシン上で構築する手順についてステップ毎に解説します
以下のコマンドで構築することができます
git clone https://github.com/litagin02/Style-Bert-VITS2.git
cd Style-Bert-VITS2
# 利用中のツールによるPythonのバージョンおよび環境分離を行う
pip install -r requirements.txt # 依存関係のインストール
python initialize.py # 初期設定
リポジトリ上の音声合成, API Serverセクションを参照してください。
お試しで音声合成したり、システムとして組み込むのであればAPI Serverとして動作させるのが良いでしょう。
config.yml
を編集してください。
デフォルトのポートが使用済みだったり、文字列長上限が短い可能性があるのでserver.port
, server.limit
は特に編集が不要か確認してください。
構築手順について記述されているリポジトリのREADME.mdの77-86行目について解説します。
README.md#L77-86powershell -c "irm https://astral.sh/uv/install.ps1 | iex" git clone https://github.com/litagin02/Style-Bert-VITS2.git cd Style-Bert-VITS2 uv venv venv venv\Scripts\activate uv pip install "torch<2.4" "torchaudio<2.4" --index-url https://download.pytorch.org/whl/cu118 uv pip install -r requirements.txt python initialize.py # 必要なモデルとデフォルトTTSモデルをダウンロード
Pythonの依存性解決ツールであるuvをWindows上でインストールしています。
参考: uv公式のインストール手順
README.md#L78powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
リポジトリからのソースコード取得をしています。
README.md#L79-L80git clone https://github.com/litagin02/Style-Bert-VITS2.git cd Style-Bert-VITS2
uv上でフォルダ/ディレクトリ固有のPythonライブラリ環境を作成し、有効化しています
README.md#L81-L82uv venv venv venv\Scripts\activate
以下が別案として利用出来ます
python -m venv venv
source venv/bin/activate
依存しているPythonライブラリをインストールしています。
GPUを利用した演算のため、6行目でインストール元URLを指定してtorch, torchaudioをインストールしています。
README.md#L83-L84uv pip install "torch<2.4" "torchaudio<2.4" --index-url https://download.pytorch.org/whl/cu118 uv pip install -r requirements.txt
CPUのみで構築するのであれば以下のコマンドで十分です
pip install -r requirements.txt
コメント通りです
README.md#L85python initialize.py # 必要なモデルとデフォルトTTSモデルをダウンロード
以上、簡単にですが構築コマンド群について説明しました。
皆さんの環境で構築する際の一助になれば幸いです。
OS、バージョン管理ツール全てについて列挙は難しいので逐次読み替えを行なってください。
より簡便な動作確認のためコンテナ環境での構築を考えてます。