突然死したSSD

SSDの導入は2008年の暮れ近くに始めたものの、未だ寿命を全うしたSSDはなかったのですが、ここに来て意外にも新しめのSSDが故障してお亡くなりになりました。

時代と共に容量を増加するためSSDを買換えしていたのもありますが、それでも、一番多く書き込んだSSDで20TBというNANDフラッシュメモリ書き込み量もあるなか、それより遙かに少ないであろうSSDが突然死したのはかなりの痛手でした。

■SSDの寿命はメモリ書き換え限界だけじゃない

SSDの寿命でよく言われるのはNANDフラッシュメモリの書き換え限界を超えてしまい、正常にデータを書き込めなくなった時とよく言われますが、実はもう1つ大きな原因として制御側に異常をきたしてしまい使えなくなることがあげられます。

メモリコントローラー

HDDが故障する時も、ディスク側には問題がないものの制御基板が故障して使えなくなることもありましたが、それと同じようにSSDもNANDフラッシュメモリを制御しているメモリコントローラー等があり、それらが故障することで使えなくなることがあります。

NANDメモリ

NANDフラッシュメモリの書き換え限界については数値化できて分かりやすいため、SSDの寿命というと良く目にすることがありますが、こちらの故障については突然発生するため分かりにくいのか、NANDフラッシュメモリ書き換え限界に隠れあまり認識されていないように感じます。

■突然死したSSDとその症状
SANDISK Ultra II SSDシリーズSDSSDHII-480G-J25C


今回突然死したSSDはSANDISK Ultra II SSDシリーズSDSSDHII-480G-J25Cになります。このSSDはTLCというNANDフラッシュメモリの書き換え寿命が短い低コストメモリを使用したSSDで、コストパフォーマンスの良さで売れ筋SSDとなっています。

導入したのは約3年前で、それよりも少し前に購入したcrucial MX100シリーズ CT512MX100SSD1はOSをインストールして動画の編集といったハードな使い方をしており、ホストの総書込量(NANDフラッシュメモリの書き換えではない)は22TBに達していますが未だ健在です。

一方のSDSSDHII-480G-J25Cについては、滅多に使わないプログラムやデータの一時的な保管場所としてあまり使っていなかったSSDだったので、NANDフラッシュメモリの書き換え寿命が来たとは思えませんでした。
※NANDフラッシュメモリの書き換え寿命は低いものでも3桁TB以上ある

また、末期のSSDにあると言われるプチフリーズやファイルの破損は全くなく、症状といえば突然OSがWindowsロゴから先に進まなくなり、ロード中のアニメーションをずっと表示しているというものでした。

裏蓋を外す

最初は新しく取り付けたハード関連かと思い、あれこれ取り外して起動してみたのですが症状は変わらず、まさかと思ってSDSSDHII-480G-J25Cを外すと何事も無かったように起動しました。

SDSSDHII-480G-J25Cが原因と言うことは分かりましたが、原因解明のため取付けないといけないものの、OSが立ち上がらないのではどうしようもないため、SDSSDHII-480G-J25CをUSBの外つけHDDキットに組み込んで接続すると、ドライブのフォーマットが必要と表示され、パーティション情報は消し飛んでいる状態でした。

カバー裏

この状態で、純正ソフトウェアのSSD Dashboardを立ち上げてみるとSANDISKのSSDは搭載されていない旨が表示され、ハードウェア名称も正常な名称の後に2バイト文字が追加された異常な表示に・・・。

どうにかパーティションの回復ができないか試してみたものの、残念ながら手の打ちようが無く症状は悪化していくばかり、接続方法を変えてみるものの最終的にBIOSレベルで認識されなくなり、物理的に終わってしまいました。

■どのSSDでも起こる可能性がある故障

最近はSDDの低価格化が進んでおり、メーカーも製造コストの削減を進めているものと考えられますが、製造コストの削減が品質の低下に繋がることは良くあることで、SSDもこの段階まで来てしまったのだろうかと考えさせられる出来事でした。

SDSSDHII-480G-J25Cの中身

今回、故障したSDSSDHII-480G-J25Cについては別段故障率が高いわけでも無く、SSDが採用しているNANDフラッシュメモリの種類により書き換え寿命の差はあれども、コントローラー等の制御側の故障についてはどのSSDでもいきなり起こりうることです。

高価格なSSDであれば、製造コストも贅沢に使われている可能性があり、故障率も低くなるかもしれませんが、電子機器である以上0になることはありえません。

もし、問題のある製品が100万分の1個の可能性で発生するとしても、その1個を引いてしまえば故障してしまいます。

ですから、問題が起きたときのことを想定してシステムを組んでいくことが重要です。

■対策は1にも2にもバックアップ

では、どうすれば良いのかというと、対策は1にも2にもバックアップです。というか、これ以外に対策はありません。

今回の件については、しっかりとバックアップを取っていたのでデータは事なきを得ましたが、バックアップは重要だと再認識させられました。

トライアングルSSDオブジェクト

バックアップに関しては、一般的なユーザーの考えからすると「やり過ぎて悪いことは無い」程度に認識してもらうのが一番だと思います。

バックアップには「321ルール」という指標があるので、全てとは言わずとも、このルールに近い形を目指していくのが近道となるでしょう。もちろん、可能であれば全て実践することが望ましいといえます。

321ルールとは・・・
・3つのバックアップ
・2つの媒体
・1つ別の保管場所

となっており、同じバックアップを3つ、HDDや光学ディスク等の2つ以上の異なる媒体に保存し、火災や水害といった災害に対応するため離れた場所(オンラインストレージも有り)に1つ保管するというものです。

これを全て実行するのは難しいですが、これに近い形でバックアップをするほどバックアップは強固になっていきますので、321ルールを目指してバックアップ体制を整えておくことをお勧めします。