ファイルサーバ(Terminator)メンテ / ファイルサーバ(Terminator)メンテ(2)
目次
ファイルサーバ(Terminator)メンテ
予定外のメンテを行うことになってしまった。
というのも先日からのSIG11 problemを再現しようと思いカーネルをコンパイルしていると、コンパイルエラーどころかいきなり電源が落ちる現象がたまに発生するので一度中を見直してみることにしたため。
というわけで線を外してラックから出してみると、熱い。まだ開けてもいないのにケースがところどころ熱い。
まず確認したのはファンを低回転のものに交換しているARAID99。というわけでまずはHDDを外してみたがそれほど熱くはない。
恐る恐るケースを開けると熱気がスゴイ。明らかに異常だ。原因はARAID99ではなく、CPUだった。カーネルコンパイルで「落ちた」ときからなんとなくわかってたけどCPUの定格温度を超えて暴走したのが原因。
そうなった理由は単純で、ファンの真上の風の通り道をATAケーブルが完全にふさいでいたから。ARAID99を入れたときだ・・・
応急処置としてケーブルをずらしてケースにセロハンテープで固定しておく。
ファイルサーバ(Terminator)メンテ(2)
で、熱問題を解決してケースを閉めて起動してみるとなぜかfsckに失敗して起動しなくなってる・・・
一度パーティションも切りなおしたかったし、ということでOS再セットアップするかな。情けないけど。
財前教授風に言うと「自らサーバ管理の第一線にある者が早期発見できず、リカバリ不能のデータ破損で再セットアップすることを、心より恥じる」
