LoginSignup
8
11
100万人に伝えたい!失敗を乗り超えた話を共有しよう

【Ubuntu】NVIDIAドライバでブラックアウトした時の対処

Last updated at Posted at 2023-07-28

Introduction

先日メインで使っていたミニ PC がクラッシュし、余ったパーツを流用して自作 PC を組みました。
ショックが大きかった(現在返品対応中)ですが、GPU を導入してローカルでも機械学習を回せるようになったので Pytorch で GPU 環境を構築しました。

まずNVIDIAドライバをインストールして reboot、ロック解除すると...

pcsp015.png

画面遷移が...

pcsp015.png

されない!
ブラックアウト!

似たような状況でお急ぎの方のために結論を書きますが、CUDA Toolkitだけインストールしてみてください!

※NVIDIA と GPU 関連はトラブルをよく耳にするのであくまで私のケースの対処法です。

本記事が少しでも読者様の学びに繋がれば幸いです!
「いいね」をしていただけると今後の励みになるので、是非お願いします!

環境

Ubuntu22.04
GeForce RTX 3060

手順

ブラックアウトした場合、落ち着いてCtrl + Alt + F3(F6)でテキストモードに入りましょう。
ユーザー名とパスワードを入力すると CLI が使用できます。

原因のNVIDIAドライバは一旦消しちゃいましょう。

sudo apt-get purge nvidia-*

reboot(私の場合はテキストモードに戻されました)するかロック画面に戻ります。

sudo service display-manager restart

私はこれで画面遷移しましたが、ブラックアウトが戻らなければ、nouveau周りを疑いましょう。
幾つか記事を見ていると、NVIDIAドライバインストールの流れでブラックリストに入れていました。
blacklist.confnouveauを消せば回復すると思います。

sudo vim /etc/modprobe.d/blacklist.conf
sudo vim /etc/modules-load.d/blacklist.conf

画面が戻ったら下記リンクからCUDA Toolkitをインストールします。
自分の環境に合ったものをクリックしていくと、インストール用のコマンドが表示されるので上から順に進めれば OK です。

私は Ubuntu22.04 なので下記のようになります。
Installer Type は deb (local)を選びましょう。(3GB くらいあります)

Screenshot from 2023-07-28 21-08-26.png

最新(12.2)で大丈夫でしたが、2023 年 7 月現在の Pytorch2.0 の Stable 版では CUDA11.7 か 11.8 のため気になる方は合わせても良いと思います。

Screenshot from 2023-07-28 21-23-02.png

インターネット状況によりますが、全体で 20 分程度かかります。

インストールし終わったら reboot して確認しましょう。

reboot
nvidia-smi

Screenshot from 2023-07-28 22-08-34.png

NVIDIAドライバが正常にインストールされています。
CUDA Versionで CUDA インストールも確認できます。

~/.bashrcにパスを通します。
以下 2 行を追記してください。

sudo vim ~/.bashrc
export PATH=/usr/local/cuda:/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/lib:/usr/local/cuda/lib64:$LD_LIBRARY_PATH

再読込して確認します。

source ~/.bashrc
nvcc -V

Screenshot from 2023-07-28 22-24-28.png

ここまで来れば一見落着です。
tensorflowでもPytorchでもインストールして機械学習しちゃいましょう!

最後に

閲覧頂きありがとうございました。

試行錯誤していた限りではnvidia-persistenced.serviceが悪さしていそうです。
手順をメモしておけば良かったのですが、物理的なクラッシュの次は論理的なクラッシュかと焦っていたため覚え書きで失礼しました。

今回のトラブルシューティングで感じましたが、NVIDIA ドライバ関連の日本語記事が少なく感じました。
英語では割と盛んで私も参考にしましたが、NVIDIA と GPU 関連は様々なトラブルがあり混乱しかねませんので、日本語の記事も充実して欲しく、その一助になればと思います。

Ubuntu にして約 1 年、公私問わずトラブル連発で耐性と低レイヤの知識がかなりついてきました!
ずっと Windows ユーザーで CLI に抵抗しかなかった中、下記の書籍で一通り勉強した知識が後から効いてきています。とてもおすすめです。

最初は疑問符ばかり浮かびましたが、知識を活かせると楽しくなってきますね。ええ...

...次回のトラブルは冬頃がいいなぁ。

本記事がお役に立てば幸いです!

参考 URL

8
11
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
11