ハードディスク大量搭載実験研究サイト ハードディスク番長 ハードディスク大量搭載実験研究サイト ハードディスク番長
 


ハードディスクの寿命


ハードディスクの機械的寿命の概観


 ハードディスクの機械的寿命を説明することは比較的簡単である。

1.電源のオン・オフ時の、プラッタとヘッドの接触に伴うヘッド・プラッタの磨耗とその磨耗粒子の飛散に伴う不良セクタの増加
ハードディスクのヘッドは、運転中プラッタとほんの少し隙間を空けて浮いている。このヘッドが運転中にプラッタのデータ領域と接触(ヘッドクラッシュ)すればデータ喪失などの大被害をもたらす。このことからプラッタとヘッドは絶対に接触してはいけないものと考えがちだが実はプラッタとヘッドは頻繁に接触している。それは電源のオン・オフ時にである。ヘッドはプラッタが回転する際の空気流により浮力を受け浮いているが、プラッタの回転が停止すれば、ヘッドはプラッタと接触する。もちろんデータ領域に着陸してしまえばデータ破壊が発生するが、電源を切ったときスライダがプラッタ上の着陸用部分に移動してから着陸するからデータの破壊はない。しかし着陸のときはディスクが止まる前に当然浮力を失うから、浮力を失ってからプラッタの回転が完全に停止するまでの間、プラッタとヘッドは擦れている。擦れればヘッドもプラッタも磨耗するし、磨耗粒子も当然発生し飛散する。この擦れで問題を起こさぬよう、着陸用部分のプラッタ表面は精密に凹凸がつけられ、極限まで摩擦が発生しにくいようになっているという。しかし摩擦は必ず起こるわけで、摩擦がおこれば、微量であれヘッドやプラッタは磨耗するし、磨耗粒子も飛散する。これがハードディスクの寿命の第一要因である。もちろん停止時にのみ発生するわけではなく、回転開始時も最初はヘッドはプラッタに接触しているから、浮き上がるまで磨耗することになる。


2.電源オン・オフや運転状態の変化による温度変化に伴う空気の熱膨張・収縮による、筐体内空気の汚染
電源のオン・オフや運転状態の変化に伴い筐体内部の空気が熱膨張、収縮をおこす。これにより運転時は筐体内から筐体内空き容積の10%程度の空気を吐き出し、停止して冷却されると逆に筐体内に空気が吸い込まれる。空気中の有害ガスが、プラッタ表面やその他の部品を侵し劣化を引き起こす。またフィルタがあっても万能ではないため吸い込み時に微粒子が筐体内に入り込みヘッドクラッシュを誘発する。


3.スピンドルモーターの流体軸受けの劣化
流体軸受けのオイルが経年変化で粘度が高まり、その負荷で特に低温時の始動においてトルク不足に陥りスピンアップできなくなる。


といったことが一般的に経年変化に伴う寿命とされている。全てが電源のオン・オフと運転開始時に問題が発生するものなので電源を切らなければ寿命は進行しにくいといえる。ただし流体軸受けのオイルやベアリングは運転時間に比例して劣化していく。


ハードディスクメーカーが公表している寿命

ハードディスクに障害が発生した場合、まず最初に頭によぎるのは寿命である。寿命とは上記したような正常な使用における避けることができない磨耗などの劣化が原因で故障することであり、障害が発生した場合でも寿命であれば納得するしかないし、対抗する手段もないからそれまでの運用方法を反省する必要もない。しかし寿命があるのなら、その寿命までの期間や条件をしっかり把握しておく必要がある。きちんと寿命なのか機器の取り扱い不良に起因した障害なのかを切り分けなければ、例えば誤った使用法で短命にしてしまった場合でも以後その問題点の対策を講じることができないからだ。
にもかかわらずハードディスクメーカーは寿命の定義や寿命期間をあいまいな形でしか我々に知らせていない。例えば日立は最低何回は起動できますと言うように起動回数の最低保証値だけ公開している。 HitachiDeskstar7K1000(SATA2-1000GB)のデータシートによると40℃の筐体温度環境で最低5万回、5〜60℃の範囲で最低1万回起動できるとある。一日1回起動したとして40℃で最低137年、60℃で最低27年は耐えるということだ。一方シーゲートはMTBFという平均故障間隔で寿命を表現していてシーゲートのエンタープライズ級のHDDではこの平均故障間隔を平均100万時間以上であるとしている。24時間稼動で114年もつ計算だ。
とはいえ経験則から考えれば、電気製品が100年以上の寿命を有するとは全く考えられないし、むしろ日ごろ接する電気製品で最も壊れるのは電球・蛍光灯に続いてハードディスクそのものであるから数十年の寿命であっても信用しにくい。

筆者は日立やシーゲートの関係者や敵対者ではまったくないし専門家でもない。ちなみに筆者はプラスチックフィルム袋の工場を経営しているので、仕事でアルミ袋やポリ袋、OPP袋、ラミネート袋、チャック袋、印刷袋、無地袋を使っている読者はお気軽に相談いただきたい。

プラスチックフィルム袋製造のホームページ



S.M.A.R.T.情報から逆算する

公表データ以外からハードディスクの寿命を推測する手法のひとつに、S.M.A.R.T.情報を読み解く方法がある。S.M.A.R.T.情報とはハードディスク自体が発行する各種エラー発生頻度や積算使用時間、温度などの情報である。これらの情報を用い故障予知をすることがS.M.A.R.T.の目的なので、この情報の中に、ハードディスクメーカーがあらかじめ設定した寿命に関する情報が含まれている。またS.M.A.R.T.は故障予知が目的であり、実際に壊れる前にユーザーに通知しなければ意味がないので、メーカーの本音と良心が反映されている(はずである)。S.M.A.R.T.情報は各ハードディスクメーカーごとに情報内容やその表現に違いがあるためか、Windows自体はこの情報を全く利用していない。したがって別途ソフトを使って読み取る必要がある。(詳しくは S.M.A.R.T.で障害状況を分析するを参照)
S.M.A.R.T.情報には積算通電時間(Power On Hours Count)の項目があり、筆者が現在編集で使用しているPCのハードディスク(シーゲートIDE300GB)は12153時間使っており残存寿命は87%あると表示されている。逆算すれば総寿命は93485時間(およそ10万時間)で1日8時間使うと32年間、1日24時間使って8年間という数字になる。一方電源入り/切り回数(Power Cycle Count)では1000カウントごとに1%残存寿命が減少していることから、逆算しての総寿命は10万回ということになり、1日1回起動したとして274年となる。これらの数値を普通に考えれば、予想寿命時間と予想寿命起動回数のうちいずれかが先に到達したときが寿命であるということになるだろう。しかし、このクラスのハードディスクのMTBFは60万時間程度とされており、S.M.A.R.T.情報中のおよそ10万時間とは大きくかけ離れているので、S.M.A.R.T.情報中の積算時間の解釈に検討が必要である。奇妙なことにこの積算通電時間(Power On Hours Count)は他のS.M.A.R.T.情報の大半が有しているしきい値情報がない。S.M.A.R.T.情報中の例えば既出の電源入り/切りの回数(Power Cycle Count)では総起動回数10万回で残り起動回数2万回を下回ったらやばいですよと言うしきい値を持っていることから、メーカーの考えはS.M.A.R.T.情報上の積算通電時間による寿命判定は単なる目安である可能性があり、電源入り/切り回数がより重要だということが読み取れるともいえる。データシート上、寿命をMTBF時間で表現しているシーゲートであってもS.M.A.R.T.情報では起動回数をより重視しているのである。一方先ほどの日立のハードディスクのデータシートには時間の記載は保証期間(無償修理期間)を除けば一切無く、起動回数と温度・湿度のみで寿命を表現している。
これらのことを総合してS.M.A.R.T.情報を解釈すると、時間は寿命と関係が薄く、起動回数がより問題であり、その起動回数はシーゲートのIDEハードディスクにおいては10万回(日立は1〜5万回)だと理解するしかない。


大量のハードディスクの寿命を観察した論文から読み取る

少し前にカーネギーメロン大学のBianca Schroeder Garth A.Gibson両氏による
「ディスク故障の現実世界・平均故障間隔100万時間があなたにとって意味するものとは」
http://www.usenix.org/events/fast07/tech/schroeder/schroeder_html/index.html#Schwarz06
という論文が発表された。異なる環境で使用されている中規模〜超大規模なシステム中で使用されているハードディスク10万31台についての1ヶ月から5年間以上の故障交換発生状況を分析している論文である。

コンピュータ内部の他の部品とハードディスクの比較
今論じているハードディスクの寿命とは直接関係はないが参考で記載する。この論文によれば、ハードディスクドライブの故障率はコンピュータの他の部品と比べて我々が日ごろ感じている感覚より結構少なめである。


ハードディスクとPC内の他の部品の故障率


システム中のハードディスクが例えば2台になれば、システム全体から見たハードディスクの故障率は24%になり、3台ならば32%、4台なら39%・・・と我々が実感している値に近づく。
※サーバシステムに搭載されている電源は我々が使っているものと比べ非常に堅牢で耐久性がある。つまり実際我々が使う電源の故障率は表記数字の何倍にもなる予想が立つが、逆にサーバでは少しの劣化でも検知し交換を要求される。これらのことを勘案すると実際の電源故障率は表記数字の2倍程度ではないかと筆者は考えている。


ハードディスクの寿命
さて次に問題の寿命についてだが、メーカーが発表しているMTTF(注1)はサーバ製品のSCSIドライブで100万時間(114年)以上、我々が通常使用しているIDEやSATAドライブでは40〜60万時間(46〜68年)と言われているが実際に調べたところこの観察した10万台のハードディスクでは平均で29万時間(33年)であった。(ただしこの数字は使用歴5年未満のハードディスクの故障状況を数値化したもので、実際に33年もつとは言っていない。)また高額なSCSIハードディスクとSATAハードディスクとの違いで故障発生率の有意差は全く認められなかったと言う。

注1※MTTFとはMTBFと同様に平均故障間隔。一般的にMTBFは部品交換により復旧が可能な物品に対して用いられMTTFは例えば電球はフィラメントが切れたら修理できないといった製品に対して用いられる。ハードディスクドライブは一般に修理不能であるのでMTBFとMTTFは同義であると解釈してよい。

ハードディスク寿命曲線(従来型)
従来考えられていたハードディスク故障発生率のモデル
バスタブ型という

劣化の進行
上記のグラフは従来考えられていた、ハードディスクの劣化進行のモデルである。稼動してまもなくの幼児死亡率が高く、その期間が過ぎれば平坦な長い時を過ごし、寿命に近づくと急激に故障率が上がっていくという意味である。常識と思われたこの傾向をこの論文では否定している。下に示したグラフは実際の故障台数の使用月数ごとの変化を、ランダムアクセスが頻発するシステムディスクと、ファイルサーバのデータディスクで比較的シーケンシャルアクセスが多いディスクとで分けて示している。

ランダムアクセス時におけるハードディスクの故障率

シーケンシャルアクセスにおけるハードディスクの故障率


このグラフが従来のモデルと大きく違うところは

■平坦な期間などどこにも無く、4年目までは順調に故障率が増加する。(2年目からメーカー発表のMTBF値を超えてしまうので、ひいき目に言っても平らな区間は1年しかない。)
■ランダムアクセスはシーケンシャルアクセスと比べおよそ2倍の故障発生率になる。
■ランダムアクセスが多いハードディスクでは幼児死亡率の高い部分が若干あるが、従来の故障発生率モデルと比べると著しく少ない。

■シーケンシャルアクセスが多いハードディスクではそもそも幼児死亡率の高い部分が存在しない。
■4年目を過ぎるとむしろ故障発生率が(一時的かも知れないが)減少している。



論文からの考察
論文を読んで以下のことが分かると思う。

■実際のMTBFはメーカー発表時間の29%しかない。

■長寿命化を図るためにわざわざSCSIハードディスクやSASハードディスクを買う必要は全くない。MTBFの数値が違っていても実際の故障率は同じである。


また論文には詳細な記述は無いが一部推論も含めると


■熱溜まりや、ファンやハードディスク自身、及び隣接するハードディスクによる振動など、局所的な悪環境により洗礼を受けてしまったハードディスクは4年目までに急速に劣化、故障し、その時点で生き残ったハードディスクはその後の長寿命が期待できるかもしれない。機器全体の中で比較的環境が整ったところであればハードディスクメーカーが発表しているMTBFに近づくかもしれない。

という希望も考えられなくもない。



寿命の本当のところは

さまざまに解釈できるハードディスクの寿命
シーゲートIDE300GHDDの場合 時間 起動回数 備考
データシート(メーカー値) 60万時間(68年)
1日8時間で205年
(日立のディスクでは5万回)
-
プロ環境における実際の寿命(論文での現実値) 平均29万時間(33年)
1日8時間で99年
- カーネーギーメロン大学の論文によれば
@MTBF60万時間でも100万時間の製品と同等の寿命
A100万時間に対して本当の寿命はその29%
S.M.A.R.T.の寿命(メーカー値) 10万時間(11年)
1日8時間で34年
10万回
1日1回使用で274年
S.M.A.R.T.値は理想環境でなく一般的な環境を想定して算出されていると仮定。
アマチュア環境用と思慮されるS.M.A.R.T.逆算.の寿命(現実値?) 48333時間(6年)
1日8時間で17年
48333回
1日1回使用で132年
S.M.A.R.T.値もメーカー設定値と現実の乖離があると仮定し本当の寿命は29%とした。
ランダムアクセス主体(システムディスク) 32383時間(4年)
1日8時間で11年
32383回
1日1回の使用で89年
平均の67%とした。(シーケンシャルアクセス時の2倍の故障率)
シーケンシャルアクセス主体(データディスク) 64283時間(7年)
1日8時間で22年
64283回
1日1回の使用で176年
平均の133%とした。(ランダムアクセス時の1/2の故障率)

温度とハードディスクの予測寿命(日立のデータシートからの推測)
動作温度
期待寿命
期待寿命
動作温度
期待寿命
期待寿命
動作温度
期待寿命
期待寿命
40℃ 100% 137年 50℃ 60% 82年 60℃ 20% 27年
41℃ 96% 132年 51℃ 56% 77年 61℃ 16% 22年
42℃ 92% 126年 52℃ 52% 71年 62℃ 12% 16年
43℃ 88% 121年 53℃ 48% 66年 63℃ 8% 11年
44℃ 84% 115年 54℃ 44% 60年 64℃ 4% 5年
45℃ 80% 110年 55℃ 40% 55年 65℃ 死亡 死亡
46℃ 76% 104年 56℃ 36% 49年 66℃ 死亡 死亡
47℃ 72% 99年 57℃ 32% 44年 67℃ 死亡 死亡
48℃ 68% 93年 58℃ 28% 38年 68℃ 死亡 死亡
49℃ 64% 88年 59℃ 24% 33年 69℃ 死亡 死亡

*勝手に期待寿命が温度と正比例したと仮定


上記表は、メーカーデータシート、S.M.A.R.T.情報、カーネーギーメロン大学の論文を基にまとめたものだ。積算使用時間を中心に考えた場合、システムディスクでは1日8時間の使用で11年と、なんとなくリアルな数字が出たが、筆者は納得がいかない。なぜかといえば、1年365日24時間運転しているハードディスクにおいて劣化による故障をほとんど体験したことがないからだ。筆者の一部システム上には10年以上使い続けている4GBのハードディスクがいまだに4台稼動している。この4台は同時に導入したもので故障したものはない。また会社の工場内で使用しているPC98なども同様に稼動し続けている。逆にテレビ録画用PCのハードディスクなどでは1日に数時間しか稼動していないにもかかわらず7年間で80GBと250GBのハードディスク2台が故障してしまっている。(真冬に無人の部屋の中に置かれたPCが録画時間が来て起動し、それまでキンキンに冷えていたハードディスクがそれから数時間、持続稼動するのだからこれはかなり過酷な使用法といえる。また真夏もしかり。)
壊れないハードディスクに共通して言えることは、電源がしっかりしていることとハードディスクの電源が落とされないことである。であるから、筆者はこれらの経験によりハードディスクの寿命に有害なのは起動回数だと思っている。起動や電源オフ時には決まって大きな温度変化も付いてくる。またメーカーである日立も起動回数と動作温度が寿命決定に重要だと言い切っていることから、大方の意見と真逆の起動回数説を筆者は取りたい。いずれにせよ、ハードディスクの寿命は理想環境で理想的に運用されれば何十年といったレベルなのだろう。しかし我々は知らないうちにさまざまな小さなミスを積み重ねてしまっており、実際のところ5〜6年しか使えていないというのが本当の所ではないかと思う。


ちなみに現在編集作業をしているPCは約2年間使用していてハードディスク起動回数は905回、使用総時間は12153時間である。S.M.A.R.T.情報に基付き通電時間10万時間(メーカー発表のMTBFは60万時間)、起動回数10万回をそれぞれ一応仮定上の総寿命と考え、先ほどのカーネギーメロン大学の論文を加味しつつ、上記した筆者が勝手に作った「温度とハードディスクの予測寿命表」などから温度環境に起因する劣化を勘案し、このディスクの平均温度が仮に46.5℃だとして残り寿命を推測すると


時間で考えた場合
S.M.A.R.T.時間10万時間×論文で明かされた実寿命29%×システムディスク(ランダムアクセス)による短寿命化率67%×温度による短寿命化率(46.5℃)74%=総寿命1.6年・1日8時間使用で4.3年(14378時間)

このハードディスクは1日に16.5時間使用 (現在積算時間12153時間÷使用日数365×2)
残り寿命2225時間=135日後にご臨終 (全寿命14378-現在積算時間12153)

起動回数で考えた場合
S.M.A.R.T.起動回数10万回×論文で明かされた実寿命29%×システムディスク(ランダムアクセス)による短寿命化率67%×温度による短寿命化率(46.5℃)74%=1日一回起動したとして総寿命39年(14378回)

このハードディスクは1日に1.2回起動 (現在までの総起動回数905÷使用日数365×2)
残り寿命13473回起動=11228日(31年)後にご臨終 (全寿命14378-現在積算起動回数905)

という数字になる。
これらの数字をどう見るか。反対する読者は多いと思うが筆者は適切な使い方さえすれば起動回数で考えた場合の上記寿命31年は可能ではないかと考えている。最近ハードディスクメーカーは一部ではあるが5年保証をし始めた。通常の電気製品は7年程度の寿命に対して1年の保証をメーカーがつける。これをハードディスクに当てはめれば35年の製品寿命に対して5年のメーカー保証をつけるのと等価である。これをどう考えるかは読者次第なのだが、実際にハードディスクの寿命は製品そのものの磨耗などによる故障に起因することは少なく、誤った使用により短命に終わらせてしまうケースのほうが圧倒的に多いと思う。ではその適切または不適切な使い方とは何か、ハードディスクを末永く使うための考察を次章で詳しく述べたいと思う。

 HDD劣化の原因と対策に続く



ハードディスクの寿命
外付けハードディスクケース

外付けHDDケース

外付け ハードディスク ケース 自作金具番長皿屋敷紹介ページ 外付けハードディスクケース 金具使用例
ユーザー使用例
↑    ↑    ↑    ↑
まずはこちらをごらんください。
ショップハードディスク番長で購入する
ポートマルチプライア PM5P-SATA2 を使用して ハードディスク ケース を作る。

ハードディスクが長寿命化するハードディスクケース


ハードディスク関連記事

 ハードディスクの寿命
 HDD劣化の原因と対策
 不良セクタ・不良ブロックとはなにか
 S.M.A.R.T.で障害状況を分析する
 不良セクタがあるハードディスクを再利用する
 ハードディスク接続ケーブルの問題点
 HDD Regenerator(ハードディスクドライブ リジェネレータ)で不良セクタを修復する
 ローレベルフォーマット

ハードディスク収納関連記事

 ケースからあふれたハードディスクの設置方法
 ハードディスク増設用にATX電源を改造する

ベランダサーバ関連記事

 ベランダサーバの作り方

その他の記事

 ハードディスク番長な人に適したPC構成を考える
 バックアップを考える

HDD番長東西対決

 HDD番長展示室
 企画HDD番長東西対決

 今月のHDD総番
 西のHDD
番長(60Hz)

 東のHDD
番長(50Hz)

 HDD
番長展示室

製品紹介

 エアコン内蔵可能型屋外PC収納ケース(ハードディスク番長シリーズ)
 ハードディスク番長の使い方

 ハードディスク大量搭載用マウンター金具(番長皿屋敷シリーズ)
 番長皿屋敷の使い方
 ハードディスク
番長実況生中継(WEBカメラ)

趣旨及び注意事項

 このページは理由なきハードディスク拡張をし続ける粋人のために作られた。PCに比類なき多量のハードディスクをいかに設置するかを研究、実験、報告するページである。ここに記載された内容は、筆者本人が信じて疑わないことであるが、世間的に必ずしも正確であるとは言えないことを宣言しておこう。またこのページを参照しての実験はすべて自己責任で行ってほしい。なおその結果について当局は一切関知しないからそのつもりで。リンクについてだが、無断でおおいにやっていただきたい。それはこのページ内に筆者が製造販売している番長グッズが存在しているため、宣伝したいからである。よろしくおねがいいたします。


hdd 袋製造 製袋 チャック付きポリ袋 ユニハンディ I-6  ユニパック
ビニールチャック袋
グラシン ポリ 大袋 アルミ袋 ジップロック フリーザーバッグ セイニチ ローズラップ
 ユニパック g-4
 ジップロック 米袋 OPP袋 チャック付ポリ袋 チャック袋 業務用 ラミジップ ラミジップ AL-22



ハードディスク16台搭載可能 自作外付けハードディスクケース


HDD16台搭載可能 自作外付けHDDケース金具


エアコン内蔵可能型屋外ベランダサーバ ハードディスク番長




チャック袋セイニチ「ユニパック」相当品「サンジップ」ならハードディスク番長の工場で




チャック袋-セイニチユニパック相当品「サンジップ」
  Janualy 2007 COPYRIGHT(C) MITUWA Limited Company ALL RIGHTS RESERVED.  goiken@hddbancho.co.jp