e1000: eth0: e1000_clean_tx_irq: Detected Tx Unit Hang

定期的にでるこのメッセージ。

e1000: eth0: e1000_clean_tx_irq: Detected Tx Unit Hang

はっきり言って謎に包まれていました。
っていうか今でも謎に包まれています。

以前、うちのサーバは転送量がやたらと多くて、転送量がMAXに到達するときなんかはオンボードのNICがRealtekだったせいか、CPU利用率が100%になったりしていた。
んで、まともなNIC使おうよという話になり、IntelのギガビットなNICを買ってきたわけだ。
で、さして設定して動かしてみたところ、やっぱり蟹さんより速度はでるわCPU負荷は小さいわで幸せになれた。

と思った。

しばらく使っていると、不定期に上記のメッセージがでてきて、NICに再起動がかかるのだ。
NICが再起動している間は当然通信が行えなくなる。
結局intelからソースもってきて自前でコンパイルしてモジュールの入れ替えとかやっても問題解決されず、時折再挑戦とかしてみたもののやっぱりダメで、せっかくのNICだが仕方がないと利用をあきらめていた。

で、以前のエントリで書いた「NICが死ぬ」っていうのはこのことで、とりあえずサーバ機の電源とCPUの発熱に問題があったのをなおしたので、その時に利用を復活させたわけだ。
ところがこの忌々しいメッセージは消えていなかった。
ふと思い出してある日dmesgたたいてみたらやっぱりでていた。
仕方がないから蟹に戻そうかとも考えたが、ママンとCPUの換装が控えていたので、それが終わってから様子をみて考えようということにした。

そしてそれから1日経過。
今のところ一度もTx Unit Hangは起きていない。
以前は1,2時間に1回は発生していたので、問題解消されたと見ていいと思っている。
結局問題は、おそらくマザーボードのチップセットとの相性だったんじゃなかろうか。
NICのチップは82541PI。
前のママンはM2A-VMで、チップセットがAMD 690G+ATI SB600となっている。
で、新しいママンはGA-EG31MF-S2 (rev. 2.0)、チップセットはIntel G31 + ICH7だ。

まあ解決してよかった。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>