sinkope is not kind of paradoxical existence

🎼 🎹 🏀 🌠 🚶 👣 📷 💻 🎨 🎮 📖 and more !

再調査立会い

データセンタにて故障中のサーバの原因究明調査‥‥の立会いに。
前回、純正だと110万円以上と言われた「多分壊れたメモリ」の代替えに一般PC用ノーブランド11万くらいのメモリを入れて様子を見たのですが、同じような挙動でストールするのですね。BIOSのメモリエラーをクリアにして起動し直すと、ちょっとの間は普通に動いているように見えるのですが、本番環境にして稼動さすと(負荷の具合かなにかで)ダメになっちゃうという。
で、今回はCEに再訪問してもらい、ちゃんと切り分け調査をしてもらおうと。つーかなんで最初にそういう調査をせんのだ?とSIerを小一時間くらい問い詰めたく(以下略
つか何故に今日はエンドユーザたるワシが立会いでSIerは来ないのかと(さらに略
いちお、CEが来る前に早めに入館し、純正メモリに戻しておきました。
CEさんは来るなり「この現象は十中八九メモリボードらしいんですよ」とかのたまいます。えー?その見解は前回には出なかったん? んでマザーのシステムログを確認したりメンテモードに入ってメモリチェックとかのツールを走らせるワケですわ。こういう場面を見ると、やっぱちゃんとしたサーバモデルは違うなァとか思いますわな。メモリチェックをスタートしてしばらくすると、ストール。うむ、やはし負荷がかかるとダメみたいっすな。
「実は替えのメモリボードを持って来てるので、それを試してみましょう」とCEさん。フタ開けて交換し(ボードのみ交換で、メモリとかはそのまま。ボードはドーター形式でマザーに差さる)、再チェック。‥‥うぉ、正常終了すンじゃん。
この事象を見る限り、原因は確かにメモリボードっぽい。これで様子を見ますかな。めでたしめでたし‥‥。
このメモリボード、11000円ちょい。んじゃ最初にSIerが言ってた「110万くらいでメモリ総取っ替えしましょう」とかいうのは何だったのか?と。ノーブランドで11万ちょい出してるのも痛手だけど、鵜呑みにして純正買ってたらエライこっちゃでしたよ?
てなワケで、複雑な気分でデータセンタを後にしたのでした。
そのまま自宅へ戻って仕事の続き。