巻きでメモ

ハード・ソフト面でのメモとか。

WindowsのWHEA_UNCORRECTABLE_ERRORの原因を特定した

Windowsのブルスクはわかりにくい

端的に言いますが、Windowsのブルスクの文面はほぼ参考になりません。
検索してもほぼほぼ同じ内容しか出てきません。
今回はうまいこと原因が特定できたので、記事として残しておきます。

原因の結論

今回のわたしのマシンで発生したブルスクはWHEA_UNCORRECTABLE_ERROR。
簡単に言うと、負荷がかかると操作はできるがスタートメニューやタスクマネージャーやらが動かなくなり、のちにブルスクになるエラーです。

先に原因だけ述べますが、

電源からマザボに供給するPSU延長ケーブルによる電圧低下

でした。自作PCならではのエラーです。

エラーの詳細

今回発生したのは、

makinok.hatenablog.com で作成したマシン。
以前も稀にブルスク吐いたりと不安定だったのですが、あまりにも不具合が多すぎてどうして?となっていました。
特に電力を多く使う場面でひどく、途中でブルスクにならずともソフトが落ちることが多かったのです。
ついに同じエラーでブルスクが頻発するようになったので、原因の特定に入ることにしました。

はい。
このブルスクのトラブルシューティング記事はだいたいパッとしないことしか書いてないことが多いです。
ハードウェアの問題だとか、クリーンインストールしろだとか、アバウトです。
わたしの場合、発生する条件は以下の通りでした。

  • OS起動後、ログインして各種ソフトが自動起動している最中
  • グラボに負荷がかかる時(Unreal Editorとゲームのロビー画面が多かった)

特にブルスクになる過程が面白く、

急に新規のデータが読み込めなくなり、メモリ内とVRAM部分でのみUIが数十秒間動かせる
(例えばテクスチャが出ない、環境音が再生できなくなる、エクスプローラーで階層移動ができない、など)

スタートメニューやタスクマネージャーなどが開けない

ブルスクWHEA_UNCORRECTABLE_ERROR

そのまま再起動するもNVMeが刺さっていない判定

電源コード抜いて刺すと一旦は認識される、OSも起動する、以下ループ

という感じでした。

原因を特定するために格闘する

現象的にNVMeが原因だろうということで、まずはNVMeの温度を計測。 ケースを開けてサーキュレーターでガンガンに冷やしてもダメでした。
次にNVMeを交換。クリーンインストールでも同様の現象に見舞われました。

次に疑ったのはマザボです。
検証用にASUSのROG STRIX Z490-F Gamingの中古を拾ってきて、載せ替え、しばらくは安定して使えていましたが、しばらくして結局同じエラーが起こり断念。
元のZ590I Vision Dに戻し、検証を続けました。
グラボを1080ti→RX 580→RX 5500XTと試してみますが、RX 5500XTに至ってはいくら電源を入れ直してもNVMeが認識すらしなくなりました。
そこで、全てのケーブルを差し直すために一旦組み直しました。

過去一綺麗なITXの配線ができた。
それでもブルスクになるので、HWmonitorを見ていたら、おかしな部分を発見。

電圧低くない…………?

原因特定、解消へ

BIOSからマザボ電圧を確認したところ、なんと+5V帯が4.8V、+12V帯が11.8V程度しか出ていませんでした。

念の為、メイン機のWS Z390 Proの方でも確認をします。
正常値はこれくらい。
原因は電圧でした。
ということで、一番ありえそうな白い電源延長ケーブルを取り、純正の黒いケーブルのみで接続。
正常値に戻りました。
ということで、正常に安定して動作するようになりました。

安物は使うな

PSUの延長ケーブルが原因だったということで、安物は使ってはいけない、ということがわかりました。
見た目を重視するならきちんとCable Modのものを使いましょう。