今回は実際にDeep Learningの学習を「Google Colab (GPU)」「Mac (CPU)」「今回作ったWin10デスクトップ (GPU)」でパフォーマンスの比較をします。
asic classification: Classify images of clothingのトレーニングを10エポック実行して処理速度を比較してみます。
1. それぞれの処理状況画面
(A) Macbook Pro 2013 lateでCPUで処理
だいたい1エポックを5から6秒で完了しています。
(B) Google Colab(GPU)で処理
だいたい1エポックを3から4秒で完了しています。
(C) 作ったWindows10 PC(GPU)で処理
まさかと言うか、やっぱりと言うか、だいたい1エポックを7から8秒で完了しています。
2. 最新GPUなのに何故(C)が一番遅いか?
ケース(C)の処理中の「CPU」「メモリー」「GPU」の負荷を見てみると、
- GPUは2-4%程度でほぼ負荷がかかっていない状態
- CPUは50%程度でありフルパワーではない
- メモリーは75%程度まで占有
でした。
これだけ旧式の機材でこれだけのパフォーマンスを出せれば大したものだとも思いますが、同時に、旧式機材がGPUの能力に明らかにボトルネックとなって制限をかけていることも見て取れました。もし、この機材に次に投資するのであれば、メモリーの容量を現在の6GBから12GB程度に増やしたり、もしCPUを同じLGA1366系列の上位部品(12MBキャッシュのXeon X5690:中古市場で2万円ほど)に変えてみると改善が見られるのではと考えます(仮説)。
お金を出せば高速処理に近づくのは明らかですが、少ない投資でリターンを得る視点を忘れずに、適切な投資を心がけましょう。