メモリ増設後の検証手順
30秒で分かるポイント
増設後はPOST → BIOS確認 → OS認識 → memtest → 負荷テスト → モニタリング設定の6ステップで検証します。最低でもPOST + OS認識 + memtest(4時間)は実施を推奨します。
Step 1: POST確認
メモリ装着後、最初に確認するのがPOST(Power-On Self-Test)です。サーバーの電源を入れた直後に実行されるハードウェアの基本診断です。
- ビープ音パターン — メモリエラー時は特定のビープ音パターンが鳴る。パターンはメーカーにより異なるため、サーバーのマニュアルでビープコード一覧を確認する [要確認]。一般的にはメモリ未検出で連続短音、メモリエラーで長音+短音の組み合わせが多い。
- 画面表示 — POST画面にメモリ総容量と各スロットの検出結果が表示される。増設後の合計容量が正しく表示されているか確認する。
- エラーメッセージ — 「Memory Configuration Error」「DIMM Population Error」などが表示された場合、DIMMの装着位置やスロットの組み合わせが不正。サーバーのメモリポピュレーションルール(どのスロットにどの順番で装着するか)をマニュアルで確認する。
Step 2: BIOS/UEFI確認
POSTを通過したら、BIOS/UEFI設定画面に入ってメモリの認識状態を詳しく確認します。
- メモリ総量表示 — System Informationまたは Memory Configuration の画面で、増設後の合計メモリ容量が正しく表示されているか確認。例えば 16GB x 8枚なら128GBと表示されるべき。
- 各スロットの認識状況 — スロットごとのDIMM情報(メーカー名、容量、速度、Rank)が正しく表示されているか確認する。「Not Installed」や「Failed」と表示されるスロットがあれば、そのDIMMの装着不良または故障が疑われる。
- 動作速度 — メモリの動作速度が仕様通りか確認。DDR4-3200のDIMMを挿しているのに2666MT/sと表示される場合、BIOS設定で速度が制限されているか、異なる速度のDIMMが混在している可能性がある。
- メモリテスト設定 — 一部のサーバーBIOSにはビルトインのメモリテスト機能がある。有効にすると起動時にメモリの基本テストを自動実行する(ただし起動時間が延びる)。
Step 3: OS上での確認
BIOSで正常に認識されたら、OS上でもメモリの認識状態を確認します。
Windows Server の場合
- タスクマネージャー — Ctrl+Shift+Esc → パフォーマンス → メモリ。総容量、使用中、利用可能、速度が表示される。
- systeminfoコマンド — コマンドプロンプトで
systeminfo | findstr メモリを実行。物理メモリ合計と仮想メモリの情報が確認できる。 - PowerShell —
Get-WmiObject Win32_PhysicalMemory | Select-Object BankLabel, Capacity, Speed, Manufacturerでスロットごとの詳細情報を取得できる。
Linux Server の場合
- free -h — メモリ総量と使用状況を人間が読みやすい形式で表示。totalの値が増設後の合計容量と一致するか確認。
- dmidecode --type memory — 各DIMMスロットの詳細情報(メーカー、型番、速度、容量)を表示。root権限が必要。
- cat /proc/meminfo — MemTotalの値で合計メモリを確認。MemFreeやMemAvailableでOS上の空きメモリも確認できる。
- lshw -class memory — メモリの詳細なハードウェア情報をツリー形式で表示。チャネルごとのDIMM配置も確認しやすい。
Step 4: memtest86+
メモリの全アドレス領域に対してパターンテストを行い、物理的な不良セルを検出するためのテストです。増設後に必ず実施してください。
- USBメモリから起動 — memtest86+ の公式サイトからISOイメージをダウンロードし、USBメモリに書き込む。サーバーをUSBから起動して自動的にテストが開始される。
- 最低4パス推奨(4〜8時間) — 1パスでメモリ全領域を1回テストする。パターンが異なる複数のテスト項目があるため、最低4パスを通すことで広範な不良パターンを検出できる。1パスだけでは検出できない間欠的な不良がある。
- エラー検出時の対処 — エラーが出たらテストを停止し、エラーの出たアドレス範囲からDIMMを特定する。そのDIMMを別のスロットに移して再テストし、DIMM不良かスロット不良かを切り分ける。
- 注意事項 — memtest86+はOS上では実行できない(USB起動が必要)。テスト中はサーバーが使えないため、メンテナンスウィンドウを確保して実施する。
Step 5: 負荷テスト
memtest86+は低レベルのメモリテストですが、OS上での実運用に近い条件での安定性テストも行います。
Linux の場合
- stress-ng —
stress-ng --vm 4 --vm-bytes 80% -t 4hで4スレッドのメモリ負荷テストを4時間実行。メモリの80%を使用して読み書きを繰り返す。途中でOOM KillerやKernel Panicが発生しなければ合格。 - stressapptest — Googleが開発したメモリテストツール。
stressapptest -M 80 -s 14400で80%のメモリを使い4時間テスト。ECCエラー検出機能もあり、サーバー向けのテストに適している。
Windows Server の場合
- Prime95 Large FFT — Prime95をLarge FFTモードで実行すると、大量のメモリを使用する負荷テストになる。4時間以上エラーなしで動作すれば合格。
- AIDA64 メモリテスト — System Stability TestのMemoryにチェックを入れて実行。メモリへの読み書き負荷と温度モニタリングを同時に行える。
いずれのツールも、4時間以上の安定動作を確認するのが目安です。途中でエラー、クラッシュ、温度異常が発生した場合は、メモリの不良またはシステム構成の問題を疑ってください。
Step 6: モニタリング設定
テストが完了しても、運用開始後にメモリの劣化やエラーが発生する可能性があります。長期的な安定運用のために、以下の監視設定を行います。
- ECCエラーカウント監視
- Linux: edac-utilsパッケージをインストールし、
edac-util -sでECCエラーカウントを確認。Zabbix / Nagios / Prometheus+node_exporterなどの監視ツールと連携して、CE(Correctable Error)カウントの増加を監視する。 - HP iLO / Dell iDRAC / Lenovo XClarity: サーバーの管理コンソールでメモリエラーのアラートメール設定を有効にする。CEが閾値(例: 24時間以内に10回 [要確認])を超えた場合にアラートが発報されるよう設定する。
- Linux: edac-utilsパッケージをインストールし、
- 温度監視 — DIMM温度がサーバーの管理コンソールで確認できる。異常高温(85℃以上 [要確認])でアラートを設定。エアフロー不足やファン故障の早期検知につながる。
- アラートしきい値設定 — CE多発、UE発生、温度異常の3つのアラートを最低限設定する。UEは即時対応が必要なため、最高優先度のアラートに設定する。
検証チェックリスト
以下のチェックリストをすべてクリアすれば、増設作業は完了です。
- POST正常完了(ビープ音なし、エラーメッセージなし)
- BIOS/UEFIで全スロットが正常認識されている
- 動作速度が仕様通り(例: DDR4-3200なら3200MT/s表示)
- OS上で正しい合計容量が表示されている
- memtest86+ 4パス以上をエラーなしで完了
- 負荷テスト4時間以上を安定動作で完了
- ECCエラー監視の設定が完了している
- 温度監視アラートの設定が完了している
ツールのバージョンや対応OSは変更される場合があります [要確認]。各ツールの公式サイトで最新の動作要件を確認してください。また、本番環境でのテスト実施前に必ずバックアップを取得してください。
※ 本記事の検証手順は一般的なサーバー環境を対象としています。仮想化基盤やクラスタ構成では追加の検証項目がある場合があります。