ACE-StepをWindowsにインストールして適当に作ったリリックから音源を作りたい!
概要
今回の記事では、ACE-StepをWindowsにインストールする手順を掲載する。
Sunoのようなことがローカルで実行できるってやばい。
仕様書
環境
- Microsoft Windows [Version 10.0.26100.3915]
- CUDA 12.8
- Python 3.11.5
手順書
基本的には公式のとおりに手順を進めていけばいいんだけども、この記事ではvenv
を使う。
Python: Version 3.10 or later is
ACE-Stepをクローンしてプロジェクトのディレクトリーに移動する。
git clone https://github.com/ace-step/ACE-Step.git
cd ACE-Step
プロジェクトのディレクトリー直下に.venv
というディレクトリーを作って、そこに開発環境が保管されるようにする。
python -m venv .venv
開発環境に入る。
.venv\Scripts\activate
pytorch
のサイトの下記のページを参考にして、自分の環境にあったpytorch
をインストールする。
インストールしてるCUDAのバージョンを合わせるのが大事。
CUDAのバージョンを確認するには下記のコマンドを実行する。
nvcc -V
私の環境ではpytorch
をインストールコマンドは下記のようになった。
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128
必要なライブラリをインストールする。
pip install -e .
正常に実行できるか確認する。ポート番号を指定してるんですが、私の環境だと7865
はすでに使われてたので8080
をつかうことにした。
acestep --port 8080
開発環境から抜ける。
deactivate
実行する場合は再度、仮想環境に入る必要がある。
.venv\Scripts\activate
まとめ(感想文)
流石にSunoさんの方が曲と日本語の発音のクオリティがめちゃくちゃ上なんだけども、無料でローカルで作りまくれるってすごすぎる。週末はこれでつぶれそう。