エントリー

管理しているサーバが起動しなくてマジ焦る!

管理サーバが起動しなくてマジ焦る!

自分が管理しているサーバのハードメンテナンスを本日行いました。

作業的には、単純にハードディスクの交換。

毎度の事ならば、ハードディスクコピーマシンを使用してハードディスク丸ごとの複製後、ハードディスク交換という簡単な作業なのです。

最近の傾向としは、結構、古いサーバハードの場合、稼働しているシステムがAFT対応のハードディスクを認識しないという懸念事項があります。

OSや使用しているハードウェアによるかもしれませんが、古いマザーボード(SATA対応のもの)に最近のSATA3のAFT対応のハードディスクを取り付けて新規OSインストールを行うと、インストール時ハードディスクを正常に認識してOSのインストール完了後、再起動するとハードディスクを読み込めないという問題が発生しました。

自分が使用しているFreeBSDでは、Version10からオプション指定無しでも4KBセクタHDDを認識するためなのか、インストール時は4KBセクターで行われ、起動時は512KBセクターで読み込みを開始するのが原因ではないかと想定しています。

やったことはないのですが、パフォーマンスを抜きで考えた場合、ディスクの初期化を強制的に512KBセクターで行えば、最新のFreeBSDでも古いマザーボード&AFT対応のハードディスクへインストールはできるのかと思います。

新規OS再インストールではなく、ディスクコピーマシンを使用して512KセクターのハードディスクからAFT対応のハードディスクへコピーする場合は、512Kセクターフォーマットでコピーされるので、AFTフォーマットのハードディスクを512Kディスクとして認識して正常に使うことができます。(パフォーマンスが落ちるかもしれません。)

今回メンテナンスしたサーバは結構な期間連続稼働しているので、ディスクのコピー中にサーバ内部の掃除を行いました。

基本的には、サーバ内部に溜まった埃を掃除器で吸い取ったりするだけなのですが、今日のサーバはCPUファンにかなり埃が付いていたので、綺麗に吸引し、ディスク交換後、再起動も問題なし。

設定内容を確認して、簡単なストレスをかけるために、ソフトウェア的なリブート、ハード的な動作確認としてコールドスタートを行ってみると、なぜか非常に動作が不安定...。

PCハードが起動後ディスクを読み込むと、途中でフリーズを繰り返す始末。

この時点でかなり焦りつつも、もしかしてAFTディスクの認識トラブル!?を疑ったのですが、AFTディスクへの512KBセクターをディスクコピーマシンでの動作確認は実証済みなので他の問題と心で判断。

 

サーバから焼け焦げた臭いが...

再起動を繰り返すと、なんかサーバから焼け焦げた臭いが発生...。

電源に保護がかかりいきなりブラックアウト。

これは、まずい。

このメンテナンスしたサーバは業務使用しているサーバなので、長時間停止するだけでも相当プレッシャーがあり、気持ち的には、できる限り短時間で起動したいものの、ハードトラブル発生で相当焦りました。

焼け焦げた臭いの発生原因は電源ユニットからなので、電源ユニットがパンクしたのは間違いなし。

幸いにも、万が一を想定して新品の電源ユニットを持っていたのでその場で交換したのですが、初回起動はできるものの、再起動は同様に不安定。

サーバ屋さんならば、このようなシチュエーションは一度ぐらいは経験あるかと思いますが、ハードトラブルが発生すると本当に焦ります。

 

冷静になって判断

ちょっと冷静になってサーバハード内部を確認してみると、原因はCPUファンでした。

4本あるCPUファンの足のうち2本がゆるみ、固着していたシリコングリスが割れて、CPUファンとCPUの間に空間ができてしまい、CPUが放熱できな状態にありました。

どうも、掃除機でCPUファン周りの埃を吸引した際に、ファンの足が緩んでしまったことが原因のようです。

CPUファンを取り外し、シリコングリスとシリコングリスクリーナーを現地調達し、CPUを取り外してCPU周辺の埃掃除を再度行い、起動、再起動を繰り返すと、何事も問題がなかったように新規ハードディスクで稼働し、一件落着。

 

グリスクリーナーとシリコングリス

 

長年、サーバハード、PCハードメンテナンス行ってきましたけど、初めてのケースでした。

どうも、CPUファンを最初に取り付けたときに、CPUファンの足の部分のノッチがしっかりはまっていなかったようです。

電源ユニットのパンクは、CPUの熱が上昇したことにより何等か電源に高負荷がかかったことによって電源ユニットに保護がかかったのではないかと思います。

なんか久々のPCハードトラブルでした。

古いPCのメンテナンスは何か起こるかわかりませんね。(苦笑)

 

以上、「管理しているサーバが起動しなくてマジ焦る!」でした。

 


スポンサーリンク

関連エントリー

ページ移動

ユーティリティ

スポンサーリンク


検索

エントリー検索フォーム
キーワード
例:abs修理、メーターフード自作

過去ログ

Feed

このエントリーをはてなブックマークに追加