最終更新:ID:1NhN+40vQg 2024年04月06日(土) 17:13:28履歴
ハローアスカベンチマーク(GPUごとの生成速度の一覧)はhelloasukaに移転しました
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択や。
(ワイは仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いてるで)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おうな(=もちろん90番台のグラボがベストなニキもいるってことや)。
もちろんゲームもFHDなら快適やで。
補助電源コネクタの異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき
torch1系の場合、cudnnライブラリの更新をしないと速度が出ないっぽい。現在はTorch2が主流のため気にする必要はない。
ローカル高速化メモ
PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。
基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。
RTX 2060 6GB以上を推奨。理由はFP16演算が速いから。
ベンチマークの結果もここで3倍程度の壁が出来ている。
学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。
Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。
ケチるんならGeForce GTX 1000番台の中古。ただしRTX系のGPUより数倍遅いし、学習も厳しい。
ちなみにGeForce GTX 600番台(一部の780番等も該当)のKeplerやそれ以前のFermi世代はCUDAがサポート対象外で、LinuxでTorchを手動でビルド(エラーが発生しやすい)しないと使えないので注意。(誰もいないとは思うが...)
検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】
モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。SDXLの学習は最低でも32GB必要。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。
生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。
生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。
上位のGPUではCPUがボトルネックになる。
下位はSandyおじさんでも動いてるが多少遅い。DDR3世代だから?
推定12it/sまでは出せるのでGPUの性能ぎりぎり間に合ってるけど、次の生成開始に時間がかかってるのかも。
よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。
GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるものとRyzen 7000シリーズがiGPUを搭載している。
GPUの性能が高いほどシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUの最大速度がわかる
1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。
バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHuggingFace🤗が受け入れてくれる。
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)
中華製品に抵抗がないなら、モンスターストレージが販売しているSSDがおすすめ。タイムセールで2TB,7450MB/sのSSDが1.3万円になってたりする。
AmazonとYahoo!ショッピングで販売中。
生成はローカル、学習はクラウドという構成もアリ
- GPUの検証一覧(wiki内別ページ)
- ゲーミングノートパソコンは絶対に買うな
同じ型番でもデスクトップPC用より低性能でコスパが悪いので、GPUぶん回す用途はデスクトップPC一択や。
- 脳死でRTX4090とか勧めるな
(ワイは仮想通貨が流行ったときに、専門家も立ち入らないような魔境取引所ににわか一般人が入り込んで草コインがどうのこうので爆死していったのを見たから同じことを繰り返してほしくないから書いてるで)
他人の意見に左右されず自分の環境にあったグラボ/PCを買おうな(=もちろん90番台のグラボがベストなニキもいるってことや)。
- 迷ったらRTX 3060 12GBを買え
もちろんゲームもFHDなら快適やで。
補助電源コネクタの異常発熱により融解することがある
NVIDIA公式の調査結果によると、コネクタが完全に挿入されていないことが原因
購入者はコネクタをしっかり差し込み、確認すべき
torch1系の場合、cudnnライブラリの更新をしないと速度が出ないっぽい。現在はTorch2が主流のため気にする必要はない。
ローカル高速化メモ
PC一般の知識ではあるが、同じ型番でもメーカー・モデルによって性能が異なる。
例えば、底辺のRTX4090だと最上位のRTX4080より低いベンチマークスコアを出すこともある。
特に組み立て済みPCでメーカー・モデルが明示されていない場合、一番安上がりのグラボを押し付けられる可能性が高い。
そもそも自作とBTOの差が縮まってきているとはいえ、それでも最上位だと10万以上上乗せされている。
ハイエンドほど自作推奨だが、どうしても組み立て済みPCを買う場合は、特にグラボについてはよく調べてから選んだほうがよい。
パラメータ数が約3倍になった影響でメモリ(メインメモリとビデオメモリの両方)の使用量も3倍近く増えた。
よってRTX 3060(12GB)以上かつメインメモリ32GB以上がおすすめ。ちなみに、FP8を利用するとVRAM消費が大幅に減って8GBでもまあまあ動く。
よってRTX 3060(12GB)以上かつメインメモリ32GB以上がおすすめ。ちなみに、FP8を利用するとVRAM消費が大幅に減って8GBでもまあまあ動く。
基本的にGPUの世代が新しく、メモリ帯域幅が多いほど生成が速くなる。
なお、メモリ容量やシェーダー数が多いからと言って速いわけではない(RTX3060が最たる例)。
RTX 2060 6GB以上を推奨。理由はFP16演算が速いから。
ベンチマークの結果もここで3倍程度の壁が出来ている。
学習は、処理速度もVRAMもあればあるだけ良い。
VRAM 8GBでも学習できるが解像度が欲しくなる。3060 12GBは評価が高い。
Radeon、Intel Arc、Macでも動作はするが新規購入はお勧めしない。
ケチるんならGeForce GTX 1000番台の中古。ただしRTX系のGPUより数倍遅いし、学習も厳しい。
ちなみにGeForce GTX 600番台(一部の780番等も該当)のKeplerやそれ以前のFermi世代はCUDAがサポート対象外で、LinuxでTorchを手動でビルド(エラーが発生しやすい)しないと使えないので注意。(誰もいないとは思うが...)
検証記事 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】
モデルのマージ、WSL2、学習のいずれかに手を出すなら32GB以上が推奨。SDXLの学習は最低でも32GB必要。
速度はそこまでシビアではない。
RamDisk(仮想メモリ,スワップ領域)はほぼ意味ないが、SuperMergerのためにメモリを余分に(モデル3つ分くらい)積むのはアリ。また、RAMが少ないPCで発生するフリーズし続ける状況を一応回避できる。
生成だけならモデルの容量を小さくすることで節約が可能だし、無料Colabを使ってモデルを小さくする便利なNotebookもある。
生成だけなら8GBでもギリギリ動作するが、モデルデータの読み込み時や初回起動時にPCが一瞬か一定時間フリーズする。
上位のGPUではCPUがボトルネックになる。
下位はSandyおじさんでも動いてるが多少遅い。DDR3世代だから?
推定12it/sまでは出せるのでGPUの性能ぎりぎり間に合ってるけど、次の生成開始に時間がかかってるのかも。
よほど古くない限り、Intel/AMDどちらでも問題ない。どっちでも何も変わらない。
GPU性能をフルに発揮し、処理中に他の作業がしたいなら、
iGPUつきのCPUにして、ブラウザ等はiGPUに割り振るのがおすすめ。
デスクトップCPUはIntelであれば末尾にFがついてないもの、AMDは末尾にGがついてるものとRyzen 7000シリーズがiGPUを搭載している。
GPUの性能が高いほどシングルスレッド性能によるボトルネックが出やすくなる
目安としてCinebench R23のシングルコアのスコア×0.0176でそのCPUの最大速度がわかる
1111の起動時間が気になるなら出来るだけ速いNVMeのSSDがおすすめ。
待ってもいいならSATA SSDでも支障はない。
消耗はそこまで問題にならなくなったはず。
総書込量(TBW)を使い切る前に経年劣化で壊れるほうが多い。
バックアップを兼ねて2つ目のストレージを持っておくと安心。
コスパ的なおすすめは6〜8TBくらいのHDD。USBの外付けとかでもいいと思う。
速度重視のためにSSDオンリーにするのもいい。
モデルとデータセットについてはHuggingFace🤗が受け入れてくれる。
(プロバイダーによっては大容量アップロードで警告が来るらしいので注意?)
中華製品に抵抗がないなら、モンスターストレージが販売しているSSDがおすすめ。タイムセールで2TB,7450MB/sのSSDが1.3万円になってたりする。
AmazonとYahoo!ショッピングで販売中。
生成はローカル、学習はクラウドという構成もアリ
- LoraとHNの学習結果は容量が少ないのでクラウドからダウンロードしやすい
- 学習中は生成もゲームも出来なくなるし電気代もかかるのでクラウド化は合理的
- GPU買う前にまず無料Colabを試してみよう ローカルの学習入門
このページへのコメント
3060でXLの生成はできるが学習がつらい
学習時に設定の数字を下げないと
時間がかかるからね
3060でPL58%の状態で
画像13枚でも3時間くらいかかる
ただ、それに見合った成果は出るんで
データを作り直してる
RTX 3060(12GB)積みの新品PCは減ってきてる感じがする
RTX4080を「現在おすすめできないグラボ」に移すのは待って欲しいです。
たしかに生産終了の話が出ていますが、後続のRTX4080Superの国内販売価格が分かりません。
正式なベンチマーク結果も出ていないので、ちょっと判断が早いのでは?
現在3070で学習もやりたいんですが、4070TiのVRAM12GBで困ることってありますか?
cpuがRyzenの場合ってwebUI環境構築で手間取ったりしますかね?
cpuがRyzenでRTX3090の中古PCを発見して心が揺れ動いてる
11111なら問題なし
他のAI学習するなら要検討
一例だけどnumpyとかでエラー吐くときあり(修正方法はある)