AER: Multiple Corrected error received と出力されるメッセージについて

 

[質問]

AER: Multiple Corrected error received: のメッセージが出力される。

 

[対象となる製品のバージョン]

Asianux Server4 == MIRACLE LINUX V6 SP1 for x86(32bit)

Asianux Server4 == MIRACLE LINUX V6 SP1 for x86-64(64bit)

 

[問題詳細]

OSが起動すると、下記のようなメッセージが出力され続けることがあります。

kernel: pcieport 0000:00:06.0: AER: Multiple Corrected error received: id=0030

kernel: pcieport 0000:00:06.0: PCIe Bus Error: severity=Corrected, type=Physical Layer,id=0030(Receiver ID)

kernel: pcieport 0000:00:06.0: device [8086:340d] error status/mask=00000001/00002000

kernel: pcieport 0000:00:06.0: [ 0] Receiver Error (First)

 

このメッセージはAsianux Server4 == MIRACLE LINUX V6 SP1からの新機能である PCI Express Advanced Error Reporting(AER)によるメッセージです。AERとはH/Wの拡張エラーレポートを知らせる機能です。上の例では対象のデバイスでPhysical LayerReceiver errorが検出され修復されたことを意味します。

(注意:Asianux Server3 == MIRACLE LINUX V5ではAER機能が実装されていないため、同じハードウェアであっても本メッセージは出力されません)

 

メッセージ中の0000:00:06.0 から対象のデバイスを特定することができます。lspciコマンドより上の例では以下のPCI bridgeであることがわかります。

# lspci

・・・・・

00:06.0 PCI bridge: Intel Corporation 5520/X58 I/O Hub PCI Express Root Port 6

・・・・・

 

[対処方法]

このようなメッセージが出力された場合はH/Wベンダーにお問い合わせください。

一時的に本メッセージの出力を抑制する場合はカーネルパラメータにpci=noaerと設定すると、本機能が無効になり、メッセージは出力されなくなります。

 

[注意事項]

本ドキュメントは、各ソフトウェア開発元の情報およびマニュアル等を元にした参考情報です。

本ドキュメントの内容は、予告なしに変更される場合があります。

 

本ドキュメントは、限られた評価環境における検証結果をもとに作成しており、全ての環境での動作を保証するものではありません。

本ドキュメントの内容に基づき、導入、設定、運用を行なったことにより損害が生じた場合でも、弊社はその損害についての責任を負いません。あくまでお客様のご判断にてご使用ください。

 

  

[更新履歴]

2011年 1221日 新規作成