Hack BBS

[全部のスレッド一覧][新規投稿][記事の削除・変更] [Home Page]

返信投稿はタイトルのリンクをクリックして下さい
スレッド【No.2314】の中の記事をすべて表示しています

【No.2314】のスレッド
05/02/25(金) 10:23:20 投稿者[いも] [No.2314]のスレッド内
【No.2314】 タイトル[玄箱が3時にフリーズ] この記事がスレッドの最初です
玄箱 Debian化して使用していますが、3時になると原因不明のフリーズが発生します。
たまに、フリーズをまぬがれて生き残る事もありますが、syslogに以下の様な
ログが残ります。

Feb 15 02:59:52 ABC kernel: hda: status timeout: status=0x80 { Busy }
Feb 15 02:59:52 ABC kernel: hda: DMA disabled
Feb 15 02:59:52 ABC kernel: hda: drive not ready for command
Feb 15 02:59:52 ABC kernel: ide0: reset: success

cronの設定を見ても上記の時間に稼働するタスクは存在せず、
外部からアタックされている様子もありません。

上記以外の時間にフリーズすることも、上記のメッセージが出ることも無いので、
HDDの障害とも考えづらいです。

何がトリガーになっているのでしょうか?



05/02/26(土) 00:59:54 投稿者[ハンニバル] [No.2314]のスレッド内
【No.2318】 タイトル[Re: 玄箱が3時にフリーズ] 【No.2314】に対する返信
>玄箱 Debian化して使用していますが、3時になると原因不明のフリーズが発生します。
>たまに、フリーズをまぬがれて生き残る事もありますが、syslogに以下の様な
>ログが残ります。
>
>Feb 15 02:59:52 ABC kernel: hda: status timeout: status=0x80 { Busy }
>Feb 15 02:59:52 ABC kernel: hda: DMA disabled
>Feb 15 02:59:52 ABC kernel: hda: drive not ready for command
>Feb 15 02:59:52 ABC kernel: ide0: reset: success
>
>cronの設定を見ても上記の時間に稼働するタスクは存在せず、
>外部からアタックされている様子もありません。
>
>上記以外の時間にフリーズすることも、上記のメッセージが出ることも無いので、
>HDDの障害とも考えづらいです。
>
>何がトリガーになっているのでしょうか?

なんか定時実行のジョブが絡んでるような気がしますね。
でもcronの設定は確認なさってるんですよね。うーん。

"DMA disabled"というのがあるんで、
定時ジョブで何かディスクをカリカリとアクセスするようなことを
するものが走って、DMA転送でエラーが出てIDEドライバが安全のために
転送スペックを落としてPIOモードに切り替えた、というようなのが
推測されますが、どうなんでしょう?
(BSD系のIDEドライバはそういうことやってくれるような記憶があります)

発売時期的に古めのディスクを使ってると、玄箱のファームとしては133Mbytes/secで転送しようとしてるけど、ドライブの方がそれより
スペック低くて追いつけてないというのが考えられます。
ウチだとやや古めの17GBのHDDでは最初のファームのインストールで
エラーが出てコケまくり、というのがありました。

起動してすぐに走るスクリプトにhddparmコマンド埋め込んで、
DMA転送モードを落としてみるというのが、逃げ道のひとつです。

05/02/28(月) 11:34:07 投稿者[いも] [No.2314]のスレッド内
【No.2320】 タイトル[Re: 玄箱が3時にフリーズ] 【No.2318】に対する返信
ハンニバルさん、レスありがとうございます。
とりあえず、土曜日にDMA転送モードを落として、2日連続稼働できてます。
しかしDMA転送モードをOFFにすると、アクセス性能が1/10です...(T_T)

やはり、HDDの問題なのでしょうか....
玄箱用に買ったHDD(Maxtor 4R080L0)なのですが...

>なんか定時実行のジョブが絡んでるような気がしますね。
>でもcronの設定は確認なさってるんですよね。うーん。
>
 トリガーになっているジョブも謎です...
 手動で大きめのファイル転送をかけても大丈夫なんですよ。

 cronのタスクにしても、02:59:52という半端な時間が気になります。
(syslogにエラーが出るときは毎回、この時間です。)

 ともあれ、少しDMA転送OFFの状態で少し様子を見たいと思います。

 ありがとうございました。