マシンラーニングの処理で行列の計算が多く、サーバへの負荷が高いため、既存の Azure 仮想マシンのサイズを変更して、GPU ドライバをインストールすることで、GPU を利用できるようにしました。
環境
Azure 仮想マシン Red Hat Enterprise Linux
NCas_T4_v3 シリーズ
Azure 仮想マシンのサイズ変更
Azure ポータルにて、下記の方法で、Azure 仮想マシンのサイズを NCas_T4_v3 シリーズのインスタンス NC4as T4 v3 にサイズを変更します。
1. Azure ポータルで仮想マシンを停止する。
2. Azure ポータルの該当する仮想マシンのサイズ画面にて、仮想マシンのサイズを NC4as T4 v3 に変更する。
3. Azure ポータルで仮想マシンを起動する。
GPU ドライバーのインストール
Azure ポータルにて、GPU ドライバー拡張機能をインストールします。
1. Azure ポータルにて、該当する仮想マシンの
設定 > 拡張機能
を選択する。
2. 「追加」をクリックする。
3. 「NVIDIA GPU Driver Extention」を検索する。
4. 「次へ」をクリックする。
5. 注意事項を確認して、「確認と作成」 をクリックする。
※拡張機能をインストールする中で再起動が発生する可能性あり。
6. 検証が成功したら、「作成」をクリックする。
補足
GPU ドライバーのインストールを確認します。
確認方法:※nvidia-smi コマンドを実行して確認できます。
https://docs.microsoft.com/ja-jp/azure/virtual-machines/linux/n-series-driver-setup#verify-driver-installation
追記
GPU を利用することをやめて、元の仮想マシンのサイズに戻すことができます。
1. Azure ポータルにて、該当する仮想マシンの
設定 > 拡張機能
を選択する。
2. 拡張機能一覧から NvidiaGpuDriverLinux を選択し、[アンインストール] をクリックする。
※反映まで時間がかかる場合がある。
3. アンインストール完了後に、拡張機能にて、NvidiaGpuDriverLinux が存在しないことを確認する。
4. Azure ポータルで仮想マシンを停止する。
5. Azure ポータルの該当する仮想マシンのサイズ画面にて、仮想マシンのサイズを元のサイズに変更する。
6. Azure ポータルで仮想マシンを起動する。
0 件のコメント :
コメントを投稿