linuxのdateコマンドを連続実行したら、
下記のようになってしまいます。
何が起こっているのでしょうか。
どうすればなおりますでしょうか。
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:01 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:01 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:01 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:02 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:02 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:02 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:33 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:34 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:34 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:34 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:34 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:00 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:01 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:01 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:01 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:02 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:02 JST 2006
uchiwa:~# date
Fri Aug 11 00:58:02 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:33 JST 2006
uchiwa:~# date
Fri Aug 11 02:09:34 JST 2006
原因は、ntp/ntpdate/rdateでの時刻同期方法の
誤りと思います。
http://www.linux.or.jp/JM/html/rdate/man1/rdate.1.html
1.サーバーを再起動して
BIOSで現在時刻表示をさせてください。
何回か時刻を表示されて問題がなければ
ハードウェアの問題ではありません。
表示がおかしい場合、マザーボードのRTCが
おかしい。
日本時刻の場合 (A)
日本時刻でない場合(B)
(B)の場合、意識的にGMTタイムに等を設定している
のであれば問題ない。
時刻が期待する時間でない場合は時刻を合わせる。
2. サーバでLinuxを起動してください。
--- 確認 ---
ルートでログイン
/etc/sysconfig/clockの
HWCLOCKの値を見る。
HWCLOCK="-u"の場合,内蔵の時計(RTC は
GMT時刻。
それ以外の場合RTCは、日本時刻で保存する
と言う意味。
HWCLOCK="-u"の場合
hwclock --show --utc
HWLOCKC="-u"以外の場合
hwclock --show --localtime
3. 以下のコマンドファイルを繰り返し
実行する。
#!/bin/bash
while true
do
echo -n "date:" ; date
echo -n "hwclock:" ; hwclock --show
sleep 1
done
---------------
中断は、Ctrl+C
実行中するとおそらくdateの値だけ変化している
はず、その場合、時刻同期の方法または同期先の
サーバに誤りがある。
一度時刻同期処理を無効にしてください。
4. その他原因
AMD系のCPUでPowerNow使用時
dmesg | grep time.c
を実行してください。
"PM timer"
でない場合
bootオプションに"clock=pmtmr"
すると効果があることがあります。
http://www.compaq.co.jp/products/software/oe/linux/mainstrea...
5. 原因を調べる。
時刻同期をしていない場合
3.のプログラムを動作させている状態で。
独自に作成したプログラムを動作させて
いたりする場合、停止する。
動作中のプログラムを順次停止させる。
原因は、ntp/ntpdate/rdateでの時刻同期方法の
誤りと思います。
http://www.linux.or.jp/JM/html/rdate/man1/rdate.1.html
1.サーバーを再起動して
BIOSで現在時刻表示をさせてください。
何回か時刻を表示されて問題がなければ
ハードウェアの問題ではありません。
表示がおかしい場合、マザーボードのRTCが
おかしい。
日本時刻の場合 (A)
日本時刻でない場合(B)
(B)の場合、意識的にGMTタイムに等を設定している
のであれば問題ない。
時刻が期待する時間でない場合は時刻を合わせる。
2. サーバでLinuxを起動してください。
--- 確認 ---
ルートでログイン
/etc/sysconfig/clockの
HWCLOCKの値を見る。
HWCLOCK="-u"の場合,内蔵の時計(RTC は
GMT時刻。
それ以外の場合RTCは、日本時刻で保存する
と言う意味。
HWCLOCK="-u"の場合
hwclock --show --utc
HWLOCKC="-u"以外の場合
hwclock --show --localtime
3. 以下のコマンドファイルを繰り返し
実行する。
#!/bin/bash
while true
do
echo -n "date:" ; date
echo -n "hwclock:" ; hwclock --show
sleep 1
done
---------------
中断は、Ctrl+C
実行中するとおそらくdateの値だけ変化している
はず、その場合、時刻同期の方法または同期先の
サーバに誤りがある。
一度時刻同期処理を無効にしてください。
4. その他原因
AMD系のCPUでPowerNow使用時
dmesg | grep time.c
を実行してください。
"PM timer"
でない場合
bootオプションに"clock=pmtmr"
すると効果があることがあります。
http://www.compaq.co.jp/products/software/oe/linux/mainstrea...
5. 原因を調べる。
時刻同期をしていない場合
3.のプログラムを動作させている状態で。
独自に作成したプログラムを動作させて
いたりする場合、停止する。
動作中のプログラムを順次停止させる。
18:32
ありがとうございます。
今、本体が近くに無いので順に操作できないのですが、リモートから、hwclock --showをすると正しい時刻が出ます。数分後にやってもちゃんと時刻はすすんでいます。ただ、hwclock --showを入力してから表示されるまで1分ほどかかります。
-----
18:43
再起動したらdateも正常になりました。
ntpdateのパッケージは入れましたが、定期的に実行するような設定はしていません。(パッケージをいれただけでそういう設定がされる?)
ntpdateは念のため消しました。debianです。
-----
>表示されるまで1分ほどかかります。
省電力モードの復帰時はそのくらいかかる
可能性がありますが。
time hwclock --show
(デバック出力は、 hwclock --debug --show )
通常は、原理的に1秒以内に完了します。
hwclock --showの出力最後の
Fri Aug 11 19:13:30 2006 -0.218340 seconds
秒数は、現在のシステム時計とのずれです。
debianは使った事がないので正しいか確認
できないですが。
cat /proc/interruptを数回実行してみてください。
割り込み回数が急速に増加しているものは
ありませんか?
HyperTheradやSMP,Multi Core等
のサーバーの場合、一部OSではtimer割り込み
等多量に発生して正しく処理できないことがありました。
通常なんらかのプログラムが
システムコールsettimeofdayを呼びし
dateコマンドによる時刻設定
ntp系のコマンドの実行による
時刻設定をしない限り70分(4000秒)程
時刻が変動することはありえない。
他の可能性としてはサーバーに
なんらかの悪意があるソフトウェアが侵入して
証拠を消滅させるために手段として一時的に未来の
時刻にして直ぐに時刻を戻す操作をしている可能性
がある。(hwclockが正常なので)
異常に長時間動作しているプログラム等
や、頻繁に消滅生成が繰り返されるプログラム
、netstatで知らない外部との接続、
lsofで使用中のファイルを調べる。
========== 補足 ==============
長時間動作させているサーバの場合RTCとシステム
時計がずれてきます。
NTPなどで時計を合わせていれば
RTCの時計あわせを行う事で調整ができます。
(なくても使えますが)
カーネルによるハードウェアクロックの自動合わせ
http://www.linux.or.jp/JM/html/util-linux/man8/hwclock.8.htm...
timerが1秒に1000ほどあるのが最大です。
uchiwa:~# cat /proc/interrupts; sleep 1; cat /proc/interrupts
CPU0
0: 2476730 IO-APIC-edge timer
7: 2 IO-APIC-edge parport0
9: 0 IO-APIC-level acpi
14: 38556 IO-APIC-edge ide0
15: 13 IO-APIC-edge ide1
177: 0 IO-APIC-level uhci_hcd
185: 0 IO-APIC-level uhci_hcd
193: 0 IO-APIC-level uhci_hcd
201: 0 IO-APIC-level ehci_hcd
209: 38 IO-APIC-level Intel ICH4
217: 85560 IO-APIC-level eth0
NMI: 0
LOC: 2476545
ERR: 0
MIS: 0
CPU0
0: 2477734 IO-APIC-edge timer
7: 2 IO-APIC-edge parport0
9: 0 IO-APIC-level acpi
14: 38556 IO-APIC-edge ide0
15: 13 IO-APIC-edge ide1
177: 0 IO-APIC-level uhci_hcd
185: 0 IO-APIC-level uhci_hcd
193: 0 IO-APIC-level uhci_hcd
201: 0 IO-APIC-level ehci_hcd
209: 38 IO-APIC-level Intel ICH4
217: 85564 IO-APIC-level eth0
NMI: 0
LOC: 2477549
ERR: 0
MIS: 0
uchiwa:~#
hwclockが常に時間が1分程度かかる動作は異常です。
dmesgでRTCのエラーが出ていないみる必要があります。
>0: 2477734 IO-APIC-edge timer
>7: 2 IO-APIC-edge parport0
>9: 0 IO-APIC-level acpi
RTCの割込みがありません?
8: xxx IO-APIC-edge rtc
が普通あるはずですがありませんね?
http://www.atmarkit.co.jp/flinux/rensai/linuxtips/145ionirq....
dmesgでtime なんとかと言う雰囲気の表示
Using local APIC timer interrupts.
とかがあると思います。
>timerが1秒に1000ほどあるのが最大です。
debian 1ms = 1000回
Fedora 5 4ms = 250回秒 Kernel 2.6
OpenSuse 10 4ms = 250回秒 Kernel 2.5
(cat /proc/sys/HZ)
4倍ですね。
debain kernel 2.4カーネルだと1桁少ない10ms程度
になるのでkernel 2.6を適用後 sched.cで
を修正していると思われます。
もし今回の症状が最近起こった症状でない場合は
リアルタイム性能は上がりますが、使うプログラム
がハードコード(define参照)してある場合、
動作がおかしくなります。
ハードウェアがらみやタイミング制御を行うものは
2.6で再コンパイルが必要です。
debianでカスタマイズしていない2.4の場合
1000回はおかしい気がします。
省電力設定を無効にしてみて同じことを
してみて動作が安定するかみてください。
安定するようであればCPUの周波数調整時の
不具合です。
bootオプションに"clock=pmtmr"しても改善
しない場合、カーネルを更新する。
再起動後にはhwclockに1分かかることはなくなりました。
ただ、しばらく(30分ぐらい?)するとマシンがフリーズします。
1度、kernel panicがコンソールに出ていました。
kernelは2.6です。
念のため、BIOSを更新しました。
BIOS設定でスタンバイタイマー30分をDisableにしてみました。
dmesgにはこのようにありました。
ENABLING IO-APIC IRQs
init IO_APIC IRQs
IO-APIC (apicid-pin) 1-16, 1-17, 1-18, 1-19, 1-20, 1-21, 1-22, 1-23 not connected.
..TIMER: vector=0x31 pin1=0 pin2=-1
Using local APIC timer interrupts.
calibrating APIC timer ...
..... CPU clock speed is 1793.0995 MHz.
..... host bus clock speed is 99.0666 MHz.
RTCがおかしいでしょうか。
>BIOS設定でスタンバイタイマー30分をDisableにしてみました
CPU 1.8G BUS 100Mhzだと
おそらくACPIの動作が怪しいマザーの頃なので
BIOSアップデートで直らないようであれば
APM/ACPIの設定を無効にする必要があります。
ためしに違うGNU/Linux系のCD-ROM起動
knoppix等で動作確認をお勧めします。
acpi=off apm=offを追加してやってみましたが、起動から30分ちょっとぐらいでkernel panicしました。
Fatal exception in interrupt
in interrupt handler - not syncing
明日はknnopixでやってみます。
----
11:49
ちなみに、6826-38Jという機種、
http://www-06.ibm.com/jp/domino04/pc/support/index.nsf/home?...
コレです。
----
12:43
カーネルをアップグレードしました。
以前は386用だったものを686のパッケージにしました。
今のところ、1時間以上問題なく動いています。
Kernel.orgでChangeLogをみると
割込みが1000回のような場合の高精度タイマー関連修正
スタンバイ C3状態でのタイマー処理修正
がありました。
最新ChangeLog-2.6.17でもまだ結構な数が出ています。
タイマー割込み間隔1msではLinux Kerenelは十分試験
されていないので1ms以上のkernel/sched.cの
MIN_TIMESLICEを設定しない方がよいとの投稿を読んだ
覚えがあります。
(timer割込み周期 /proc/sys/kernel/HZ)
また再発するようであれば、
標準の 4msで動作確認するのがよいと思います。
面倒ですがDebian以外が選択可能なら乗換えも
手ではあります。 または、年末にUpgrade
http://www.debian.org/devel/debian-installer/
=================================================
>ちなみに、6826-38Jという機種、
IDEのFIRMもあるようです。
NetVista - Seagate Barracuda ATA IV ハードディスクドライブ ファームウェア アップデート Ver2.0 2004/01/06
================================================
http://www.atmarkit.co.jp/flinux/rensai/watch2005/watch08a.h...
少し昔のデフォルトが1000Hzだったみたいですね。
----
一晩経ったら、また同じようなことになっていました。
Sun Aug 13 07:59:27 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:28 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:28 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:28 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:25 JST 2006
uchiwa:~# date
Sun Aug 13 09:10:59 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:25 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:25 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:25 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:26 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:26 JST 2006
uchiwa:~# date
Sun Aug 13 07:59:26 JST 2006
時間の飛び方が同じパターンです。
----
おかしなdmesgが取れました。
uchiwa:~# dmesg
ache: 12K uops, L1 D cache: 8K
CPU: L2 cache: 512K
CPU: After all inits, caps: bfebfbff 00000000 00000000 00000080
Intel machine check architecture supported.
Intel machine check reporting enabled on CPU#0.
CPU0: Intel P4/Xeon Extended MCE MSRs (12) available
CPU0: Thermal monitoring enabled
CPU: Intel(R) Pentium(R) 4 CPU 1.80GHz stepping 07
Enabling fast FPU save and restore... done.
Enabling unmasked SIMD FPU exception support... done.
Checking 'hlt' instruction... OK.
enabled ExtINT on CPU#0
ESR value before enabling vector: 00000000
ESR value after enabling vector: 00000000
ENABLING IO-APIC IRQs
init IO_APIC IRQs
IO-APIC (apicid-pin) 1-16, 1-17, 1-18, 1-19, 1-20, 1-21, 1-22, 1-23 not connected.
..TIMER: vector=0x31 pin1=0 pin2=-1
Using local APIC timer interrupts.
calibrating APIC timer ...
..... CPU clock speed is 1793.0916 MHz.
..... host bus clock speed is 99.0661 MHz.
checking if image is initramfs...it isn't (ungzip failed); looks like an initrd
Freeing initrd memory: 4556k freed
NET: Registered protocol family 16
PCI: PCI BIOS revision 2.10 entry at 0xfd9bd, last bus=2
PCI: Using configuration type 1
mtrr: v2.0 (20020519)
ACPI: Subsystem revision 20040326
ACPI: Interpreter enabled
ACPI: Using IOAPIC for interrupt routing
ACPI: PCI Root Bridge [PCI0] (00:00)
PCI: Probing PCI hardware (bus 00)
PCI: Ignoring BAR0-3 of IDE controller 0000:00:1f.1
PCI: Transparent bridge - 0000:00:1e.0
ACPI: PCI Interrupt Routing Table [\_SB_.PCI0._PRT]
ACPI: PCI Interrupt Routing Table [\_SB_.PCI0.SLOT._PRT]
ACPI: PCI Interrupt Link [LNKA] (IRQs 3 4 5 7 9 10 *11 12 14 15)
ACPI: PCI Interrupt Link [LNKB] (IRQs 3 4 5 7 *9 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKC] (IRQs 3 4 *5 7 9 10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKD] (IRQs 3 4 5 7 9 *10 11 12 14 15)
ACPI: PCI Interrupt Link [LNKE] (IRQs 3 4 5 7 9 10 11 *12 14 15)
ACPI: PCI Interrupt Link [LNKF] (IRQs 3 4 5 7 9 10 11 12 14 15) *0, disabled.
ACPI: PCI Interrupt Link [LNKG] (IRQs 3 4 5 7 9 10 11 12 14 15) *0, disabled.
ACPI: PCI Interrupt Link [LNKH] (IRQs 3 4 5 7 *9 10 11 12 14 15)
Linux Plug and Play Support v0.97 (c) Adam Belay
PnPBIOS: Scanning system for PnP BIOS support...
PnPBIOS: Found PnP BIOS installation structure at 0xc00f6310
PnPBIOS: PnP BIOS version 1.0, entry 0xf0000:0xa03f, dseg 0x400
pnp: 00:00: ioport range 0x800-0x87f has been reserved
pnp: 00:00: ioport range 0xfe00-0xfe00 has been reserved
pnp: 00:0b: ioport range 0x4d0-0x4d1 has been reserved
pnp: 00:0b: ioport range 0x1000-0x105f has been reserved
pnp: 00:0b: ioport range 0x1060-0x107f has been reserved
pnp: 00:0b: ioport range 0x1180-0x11bf has been reserved
PnPBIOS: 18 nodes reported by PnP BIOS; 18 recorded by driver
PCI: Using ACPI for IRQ routing
ACPI: PCI interrupt 0000:00:02.0[A] -> GSI 16 (level, low) -> IRQ 177
ACPI: PCI interrupt 0000:00:1d.0[A] -> GSI 16 (level, low) -> IRQ 177
ACPI: PCI interrupt 0000:00:1d.1[B] -> GSI 19 (level, low) -> IRQ 185
ACPI: PCI interrupt 0000:00:1d.2[C] -> GSI 18 (level, low) -> IRQ 193
ACPI: PCI interrupt 0000:00:1d.7[D] -> GSI 23 (level, low) -> IRQ 201
ACPI: PCI interrupt 0000:00:1f.1[A] -> GSI 18 (level, low) -> IRQ 193
ACPI: PCI interrupt 0000:00:1f.3[B] -> GSI 17 (level, low) -> IRQ 209
ACPI: PCI interrupt 0000:00:1f.5[B] -> GSI 17 (level, low) -> IRQ 209
ACPI: PCI interrupt 0000:02:08.0[A] -> GSI 20 (level, low) -> IRQ 217
number of MP IRQ sources: 16.
number of IO-APIC #1 registers: 24.
testing the IO APIC.......................
IO APIC #1......
.... register #00: 01000000
....... : physical APIC id: 01
....... : Delivery Type: 0
....... : LTS : 0
.... register #01: 00178020
....... : max redirection entries: 0017
....... : PRQ implemented: 1
....... : IO APIC version: 0020
.... register #02: 00000000
....... : arbitration: 00
.... register #03: 00000001
....... : Boot DT : 1
.... IRQ redirection table:
NR Log Phy Mask Trig IRR Pol Stat Dest Deli Vect:
00 001 01 0 0 0 0 0 1 1 31
01 001 01 0 0 0 0 0 1 1 39
02 001 01 1 0 0 0 0 1 1 41
03 001 01 0 0 0 0 0 1 1 49
04 001 01 0 0 0 0 0 1 1 51
05 001 01 0 0 0 0 0 1 1 59
06 001 01 0 0 0 0 0 1 1 61
07 001 01 0 0 0 0 0 1 1 69
08 001 01 0 0 0 0 0 1 1 71
09 001 01 0 1 0 0 0 1 1 79
0a 001 01 0 0 0 0 0 1 1 81
0b 001 01 0 0 0 0 0 1 1 89
0c 001 01 0 0 0 0 0 1 1 91
0d 001 01 0 0 0 0 0 1 1 99
0e 001 01 0 0 0 0 0 1 1 A1
0f 001 01 0 0 0 0 0 1 1 A9
10 001 01 1 1 0 1 0 1 1 B1
11 001 01 1 1 0 1 0 1 1 D1
12 001 01 1 1 0 1 0 1 1 C1
13 001 01 1 1 0 1 0 1 1 B9
14 001 01 1 1 0 1 0 1 1 D9
15 000 00 1 0 0 0 0 0 0 00
16 000 00 1 0 0 0 0 0 0 00
17 001 01 1 1 0 1 0 1 1 C9
Using vector-based indexing
IRQ to pin mappings:
IRQ0 -> 0:0
IRQ1 -> 0:1
IRQ2 -> 0:2
IRQ3 -> 0:3
IRQ4 -> 0:4
IRQ5 -> 0:5
IRQ6 -> 0:6
IRQ7 -> 0:7
IRQ8 -> 0:8
IRQ9 -> 0:9
IRQ10 -> 0:10
IRQ11 -> 0:11
IRQ12 -> 0:12
IRQ13 -> 0:13
IRQ14 -> 0:14
IRQ15 -> 0:15
IRQ177 -> 0:16
IRQ209 -> 0:17
IRQ193 -> 0:18
IRQ185 -> 0:19
IRQ217 -> 0:20
IRQ201 -> 0:23
.................................... done.
Simple Boot Flag at 0x6c set to 0x1
highmem bounce pool size: 64 pages
VFS: Disk quotas dquot_6.5.1
Dquot-cache hash table entries: 1024 (order 0, 4096 bytes)
devfs: 2004-01-31 Richard Gooch (rgooch@atnf.csiro.au)
devfs: boot_options: 0x0
Initializing Cryptographic API
isapnp: Scanning for PnP cards...
isapnp: No Plug & Play device found
Serial: 8250/16550 driver $Revision: 1.90 $ 48 ports, IRQ sharing enabled
ttyS0 at I/O 0x3f8 (irq = 4) is a 16550A
ttyS1 at I/O 0x2f8 (irq = 3) is a 16550A
RAMDISK driver initialized: 16 RAM disks of 8192K size 1024 blocksize
serio: i8042 AUX port at 0x60,0x64 irq 12
serio: i8042 KBD port at 0x60,0x64 irq 1
input: AT Translated Set 2 keyboard on isa0060/serio0
NET: Registered protocol family 2
IP: routing cache hash table of 8192 buckets, 64Kbytes
TCP: Hash tables configured (established 262144 bind 65536)
NET: Registered protocol family 8
NET: Registered protocol family 20
ACPI: (supports S0 S1 S3 S4 S5)
RAMDISK: cramfs filesystem found at block 0
RAMDISK: Loading 4556 blocks [1 disk] into ram disk... done.
VFS: Mounted root (cramfs filesystem) readonly.
Freeing unused kernel memory: 148k freed
vesafb: probe of vesafb0 failed with error -6
NET: Registered protocol family 1
Uniform Multi-Platform E-IDE driver Revision: 7.00alpha2
ide: Assuming 33MHz system bus speed for PIO modes; override with idebus=xx
ICH4: IDE controller at PCI slot 0000:00:1f.1
PCI: Enabling device 0000:00:1f.1 (0005 -> 0007)
ACPI: PCI interrupt 0000:00:1f.1[A] -> GSI 18 (level, low) -> IRQ 193
ICH4: chipset revision 1
ICH4: not 100% native mode: will probe irqs later
ide0: BM-DMA at 0x1860-0x1867, BIOS settings: hda:DMA, hdb:pio
ide1: BM-DMA at 0x1868-0x186f, BIOS settings: hdc:DMA, hdd:pio
hda: ST3200826A, ATA DISK drive
Using anticipatory io scheduler
ide0 at 0x1f0-0x1f7,0x3f6 on irq 14
hda: max request size: 1024KiB
hda: 390721968 sectors (200049 MB) w/8192KiB Cache, CHS=24321/255/63, UDMA(100)
/dev/ide/host0/bus0/target0/lun0: p1 p2 < p5 >
hdc: HL-DT-ST GCE-8400B, ATAPI CD/DVD-ROM drive
ide1 at 0x170-0x177,0x376 on irq 15
kjournald starting. Commit interval 5 seconds
EXT3-fs: mounted filesystem with ordered data mode.
Adding 2650684k swap on /dev/hda5. Priority:-1 extents:1
EXT3 FS on hda1, internal journal
Generic RTC Driver v1.07
hdc: ATAPI 40X CD-ROM CD-R/RW drive, 8192kB Cache, UDMA(33)
Uniform CD-ROM driver Revision: 3.20
Capability LSM initialized
e100: Intel(R) PRO/100 Network Driver, 3.0.18
e100: Copyright(c) 1999-2004 Intel Corporation
ACPI: PCI interrupt 0000:02:08.0[A] -> GSI 20 (level, low) -> IRQ 217
e100: eth0: e100_probe: addr 0xc0100000, irq 217, MAC addr 00:09:6B:B1:4D:7F
Intel 810 + AC97 Audio, version 1.01, 10:52:51 Jul 15 2006
ACPI: PCI interrupt 0000:00:1f.5[B] -> GSI 17 (level, low) -> IRQ 209
PCI: Setting latency timer of device 0000:00:1f.5 to 64
i810: Intel ICH4 found at IO 0x18c0 and 0x1c00, MEM 0xc0080c00 and 0xc0080800, IRQ 209
i810: Intel ICH4 mmio at 0xf885fc00 and 0xf88c2800
i810_audio: Primary codec has ID 0
i810_audio: Audio Controller supports 6 channels.
i810_audio: Defaulting to base 2 channel mode.
i810_audio: Resetting connection 0
i810_audio: Connection 0 with codec id 0
ac97_codec: AC97 Audio codec, id: ADS116 (Unknown)
i810_audio: AC'97 codec 0 supports AMAP, total channels = 2
i810_audio: setting clocking to 48546
usbcore: registered new driver usbfs
usbcore: registered new driver hub
ACPI: PCI interrupt 0000:00:1d.7[D] -> GSI 23 (level, low) -> IRQ 201
ehci_hcd 0000:00:1d.7: Intel Corp. 82801DB (ICH4) USB2 EHCI Controller
PCI: Setting latency timer of device 0000:00:1d.7 to 64
ehci_hcd 0000:00:1d.7: irq 201, pci mem f88c4000
ehci_hcd 0000:00:1d.7: new USB bus registered, assigned bus number 1
PCI: cache line size of 128 is not supported by device 0000:00:1d.7
ehci_hcd 0000:00:1d.7: USB 2.0 enabled, EHCI 1.00, driver 2004-May-10
hub 1-0:1.0: USB hub found
hub 1-0:1.0: 6 ports detected
Linux agpgart interface v0.100 (c) Dave Jones
agpgart: Detected an Intel 845G Chipset.
agpgart: Maximum main memory to use for agp memory: 940M
agpgart: Detected 892K stolen memory.
agpgart: AGP aperture is 128M @ 0x88000000
USB Universal Host Controller Interface driver v2.2
ACPI: PCI interrupt 0000:00:1d.0[A] -> GSI 16 (level, low) -> IRQ 177
uhci_hcd 0000:00:1d.0: Intel Corp. 82801DB (ICH4) USB UHCI #1
PCI: Setting latency timer of device 0000:00:1d.0 to 64
uhci_hcd 0000:00:1d.0: irq 177, io base 00001800
uhci_hcd 0000:00:1d.0: new USB bus registered, assigned bus number 2
hub 2-0:1.0: USB hub found
hub 2-0:1.0: 2 ports detected
ACPI: PCI interrupt 0000:00:1d.1[B] -> GSI 19 (level, low) -> IRQ 185
uhci_hcd 0000:00:1d.1: Intel Corp. 82801DB (ICH4) USB UHCI #2
PCI: Setting latency timer of device 0000:00:1d.1 to 64
uhci_hcd 0000:00:1d.1: irq 185, io base 00001820
uhci_hcd 0000:00:1d.1: new USB bus registered, assigned bus number 3
hub 3-0:1.0: USB hub found
hub 3-0:1.0: 2 ports detected
ACPI: PCI interrupt 0000:00:1d.2[C] -> GSI 18 (level, low) -> IRQ 193
uhci_hcd 0000:00:1d.2: Intel Corp. 82801DB (ICH4) USB UHCI #3
PCI: Setting latency timer of device 0000:00:1d.2 to 64
uhci_hcd 0000:00:1d.2: irq 193, io base 00001840
uhci_hcd 0000:00:1d.2: new USB bus registered, assigned bus number 4
hub 4-0:1.0: USB hub found
hub 4-0:1.0: 2 ports detected
usb 3-2: new full speed USB device using address 2
hub 3-2:1.0: USB hub found
hub 3-2:1.0: 3 ports detected
usb 3-2.1: new full speed USB device using address 3
usbcore: registered new driver hiddev
input: USB HID v1.10 Keyboard [Mitsumi Electric Apple Extended USB Keyboard] on usb-0000:00:1d.1-2.1
input: USB HID v1.10 Device [Mitsumi Electric Apple Extended USB Keyboard] on usb-0000:00:1d.1-2.1
usbcore: registered new driver usbhid
drivers/usb/input/hid-core.c: v2.0:USB HID core driver
hw_random: RNG not detected
cpci_hotplug: CompactPCI Hot Plug Core version: 0.2
pci_hotplug: PCI Hot Plug PCI Core version: 0.5
pciehp: PCI Express Hot Plug Controller Driver version: 0.4
shpchp: shpc_init : shpc_cap_offset == 0
shpchp: Standard Hot Plug PCI Controller Driver version: 0.4
input: PC Speaker
inserting floppy driver for 2.6.8-3-686
Floppy drive(s): fd0 is 1.44M
FDC 0 is a post-1991 82077
parport: PnPBIOS parport detected.
parport0: PC-style at 0x378 (0x778), irq 7, dma 3 [PCSPP,TRISTATE,COMPAT,ECP,DMA]
e100: eth0: e100_watchdog: link up, 100Mbps, full-duplex
NET: Registered protocol family 10
Disabled Privacy Extensions on device c0300140(lo)
IPv6 over IPv4 tunneling driver
ACPI: Processor [CPU0] (supports C1, 8 throttling states)
ACPI: Power Button (FF) [PWRF]
ACPI: Thermal Zone [THM0] (57 C)
eth0: no IPv6 routers present
Unable to handle kernel paging request at virtual address 02000000
printing eip:
c016dde0
*pde = 00000000
Oops: 0000 [#1]
PREEMPT
Modules linked in: thermal fan button processor ac battery ipv6 parport_pc parport floppy pcspkr snd_intel8x0 snd_ac97_codec snd_pcm snd_timer snd_page_alloc gameport snd_mpu401_uart snd_rawmidi snd_seq_device snd shpchp pciehp pci_hotplug joydev evdev usbhid uhci_hcd intel_agp agpgart ehci_hcd usbcore i810_audio ac97_codec soundcore e100 mii capability commoncap eeprom lm90 i2c_sensor i2c_isa i2c_i801 i2c_core psmouse ide_cd cdrom genrtc ext3 jbd mbcache ide_generic piix ide_disk ide_core unix font vesafb cfbcopyarea cfbimgblt cfbfillrect
CPU: 0
EIP: 0060:[<c016dde0>] Not tainted
EFLAGS: 00010206 (2.6.8-3-686)
EIP is at __d_lookup+0x80/0x170
eax: 02000000 ebx: 02000000 ecx: 00000011 edx: c1829100
esi: c189fc08 edi: ece5ce18 ebp: dce7b424 esp: d4ce1e18
ds: 007b es: 007b ss: 0068
Process find (pid: 8759, threadinfo=d4ce0000 task=f74f7460)
Stack: 00000001 d3359714 c012a452 d4ce0000 ece5ce18 000041ed 00000000 c189fc08
d4c72000 0000000c d4ce1eac d4ce1f18 f7b58f00 d4ce1eac c0162dc0 d3358ce4
d4ce1eb4 00000001 d4ce1eac d4c72000 d3359714 d4ce1f18 c0163513 d4ce1f18
Call Trace:
[<c012a452>] in_group_p+0x42/0x80
[<c0162dc0>] do_lookup+0x30/0xb0
[<c0163513>] link_path_walk+0x6d3/0xda0
[<c012a452>] in_group_p+0x42/0x80
[<c0163e5c>] path_lookup+0x7c/0x140
[<c01640e3>] __user_walk+0x33/0x60
[<c015ea7c>] vfs_lstat+0x1c/0x60
[<c015f1cb>] sys_lstat64+0x1b/0x40
[<c010603b>] syscall_call+0x7/0xb
Code: 8b 03 0f 18 00 90 8d 6b a0 8b 7c 24 10 39 7d 14 74 2e 8b 1b
<6>note: find[8759] exited with preempt_count 1
bad: scheduling while atomic!
[<c0282c65>] schedule+0x4c5/0x4d0
[<c01447e3>] unmap_page_range+0x53/0x80
[<c01449c6>] unmap_vmas+0x1b6/0x1d0
[<c0148d95>] exit_mmap+0x85/0x170
[<c011a0f5>] mmput+0x65/0x90
[<c011e78c>] do_exit+0x15c/0x420
[<c0116c90>] do_page_fault+0x0/0x56d
[<c0107209>] die+0xf9/0x100
[<c0116e6e>] do_page_fault+0x1de/0x56d
[<c0155e33>] wake_up_buffer+0x13/0x40
[<c015791b>] __find_get_block+0x7b/0x110
[<c0155fa3>] unlock_buffer+0x13/0x20
[<c0159adc>] ll_rw_block+0x5c/0x90
[<c01579e7>] __getblk+0x37/0x70
[<f88e3940>] ext3_get_inode_loc+0x60/0x270 [ext3]
[<c0116c90>] do_page_fault+0x0/0x56d
[<c0106add>] error_code+0x2d/0x38
[<c016dde0>] __d_lookup+0x80/0x170
[<c012a452>] in_group_p+0x42/0x80
[<c0162dc0>] do_lookup+0x30/0xb0
[<c0163513>] link_path_walk+0x6d3/0xda0
[<c012a452>] in_group_p+0x42/0x80
[<c0163e5c>] path_lookup+0x7c/0x140
[<c01640e3>] __user_walk+0x33/0x60
[<c015ea7c>] vfs_lstat+0x1c/0x60
[<c015f1cb>] sys_lstat64+0x1b/0x40
[<c010603b>] syscall_call+0x7/0xb
----
>date
約4000秒のずれ?
postfixとか使ってませんか?
シェルとかで dateコマンドを使って何かしてませんか?
dateコマンドを一時的に別の名前にして
シェルなどでdateを作成して本物のdateを呼び出す
処理を作ってみては?
mv data date.org
---new date ---
#!/bin/bash
echo `date.org`" date $*" >>/tmp/date.log
date.org $*
exit $?
--------
chmod 555 date
>dmesg
find中ページフォールトが起こった後のスケジュール
が呼び出されて処理が中断してます。
2.6.10あたりまでは検索しても結構Hitしますが
原因はばらばらですね。
ext3のドライバーとは思えない。
システム時計を短期間で進めたり・戻すと同じような
操作で不具合が発生するの事がある。
時間があるならハードでない事を確認するのに
knoppix等で動作確認をお勧めします
全ソース・モジュールをコンパイルしなおししていないよう
であればFC5 / FreeBSD /OpenSuSe 等への乗り換えを
お勧めします。
>http://www.atmarkit.co.jp/flinux/rensai/watch2005/watch08a.h...
はみてませんでした。
書かれている事以外にも結構問題あると思います。
BIOSのS1/S3の設定をS3からS1に変えて一晩放置しましたが、問題は発生していません。
インストールしたばかりなのでdateで何かはしていません。
postfixは入っていませんが、exim4がデフォルトで入っていました。exim4は消しました。あとでpostfixを入れる予定です。
postfixが時刻を変えるようなことがあるのでしょうか。
----
半日後に、少し操作したら例の問題が発生しました。
同じ症状です。時間が飛びます。
>BIOSのS1/S3の設定をS3からS1
既にサーバーで運用しているかと思っました。
postfixリトライの間隔が規定値で4000秒
だったので何かカスタマイズして可能性があるかと
思って書きました。
>インストールしたばかりなのでdateで何かはしていません。
クリーンインストール状態で発生しているので
あればカーネル起因 or 環境ですね。
(memtest86パス,S3 Ready前提)
1日くらいでおかしくなると言うことなので
温度のモニターもしておくとよいと思います。
smartctlを使うとHDDによっては過去の最高可動温度を
見ることができます。
(60℃を超えているようだと熱い部類,熱対策必要
70℃以上なら何時壊れてもおかしくない状態)
PCは、環境温度5度~35℃の動作保障です。
http://packages.debian.org/cgi-bin/search_packages.pl?keywor...
http://packages.debian.org/stable/utils/smartmontools
http://miya0.dyndns.org/pc/settei/smartctl.html
http://www.aconus.com/~oyaji/suse/mrtg_suse_th.htm
>dmesg
プリンタ/シリアル/Audioを利用していないなら
当面BIOSレベルで無効にした方がよい。
(省電力)
knoppixで半日放置しました。問題ないようです。
----
debianでkernelを2.4にしてみました。
@uchiwa:~$ cat /proc/interrupts ; sleep 1; cat /proc/interrupts
CPU0
0: 38287 IO-APIC-edge timer
1: 2 IO-APIC-edge keyboard
2: 0 XT-PIC cascade
8: 4 IO-APIC-edge rtc
14: 5787 IO-APIC-edge ide0
15: 11 IO-APIC-edge ide1
16: 14 IO-APIC-level usb-uhci
18: 0 IO-APIC-level usb-uhci
19: 48 IO-APIC-level usb-uhci
20: 471 IO-APIC-level eth0
23: 0 IO-APIC-level ehci_hcd
NMI: 0
LOC: 38235
ERR: 0
MIS: 0
CPU0
0: 38388 IO-APIC-edge timer
1: 2 IO-APIC-edge keyboard
2: 0 XT-PIC cascade
8: 4 IO-APIC-edge rtc
14: 5787 IO-APIC-edge ide0
15: 11 IO-APIC-edge ide1
16: 14 IO-APIC-level usb-uhci
18: 0 IO-APIC-level usb-uhci
19: 48 IO-APIC-level usb-uhci
20: 473 IO-APIC-level eth0
23: 0 IO-APIC-level ehci_hcd
NMI: 0
LOC: 38335
ERR: 0
MIS: 0
rtcが現れました。
これでもう半日試します。
----
2.4にしたらsensorsが動かなくなりました。残念。smartctlでHDDの温度は見えています。
----
プリンタ/シリアル/AudioはOFFにしました。
18:32
ありがとうございます。
今、本体が近くに無いので順に操作できないのですが、リモートから、hwclock --showをすると正しい時刻が出ます。数分後にやってもちゃんと時刻はすすんでいます。ただ、hwclock --showを入力してから表示されるまで1分ほどかかります。
-----
18:43
再起動したらdateも正常になりました。
ntpdateのパッケージは入れましたが、定期的に実行するような設定はしていません。(パッケージをいれただけでそういう設定がされる?)
ntpdateは念のため消しました。debianです。
-----