help!请帮我分析一下错误日志

上一篇 / 下一篇  2008-08-29 10:36:29 / 个人分类:solaris资料

查看( 9 ) / 评论( 12 )
$ more /var/adm/messages
Aug 26 06:47:22 cxerp unix: WARNING: [AFT1] Uncorrectable Memory Error on CPU7 D
ata access at TL=0, errID 0x000581a1.0b672f51^M
Aug 26 06:47:22 cxerp unix:     AFSR 0x00000000.00200000<UE> AFAR 0x00000000.236
7fd70^M
Aug 26 06:47:22 cxerp unix:     AFSR.PSYND 0x0000(Score 05) AFSR.ETS 0x00 Fault_
PC 0x3c770c^M
Aug 26 06:47:22 cxerp unix:     UDBH 0x0203<UE> UDBH.ESYND 0x03 UDBL 0x00a0 UDBL
.ESYND 0xa0^M
Aug 26 06:47:22 cxerp unix:     UDBH Syndrome 0x3 Memory Module Board 3 J3101 J3
201 J3301 J3401 J3501 J3601 J3701 J3801
Aug 26 06:47:22 cxerp unix: WARNING: [AFT1] errID 0x000581a1.0b672f51 Syndrome 0
x3 indicates that this may not be a memory module problem
Aug 26 06:47:22 cxerp unix: [AFT2] errID 0x000581a1.0b672f51 PA=0x00000000.2367f
d70
Aug 26 06:47:22 cxerp unix:     E$tag 0x00000000.0a40046c E$State: Shared E$pari
ty 0x05
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x00): 0x00000000.8a5e2fc0
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x08): 0x8adc4958.8ae2bd4c
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x10): 0x8ae2bd4c.8ae2bd54
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x18): 0x8ae2bd54.00000000
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x20): 0x00000007.020bedb2
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x28): 0x00000008.00002bf8
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x30): 0x00000201.851d6800 *Bad* PSYN
D=0xff00
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x38): 0x00000000.0000a395
Aug 26 06:47:22 cxerp unix: WARNING: [AFT1] CP Error on CPU6 (caused Data access
error on CPU7), errID 0x000581a1.0b672f51^M
Aug 26 06:47:22 cxerp unix:     AFSR 0x00000000.01002000<CP> AFAR 0x00000000.236
7fd70^M
Aug 26 06:47:22 cxerp unix:     AFSR.PSYND 0x2000(Score 95) AFSR.ETS 0x00^M
Aug 26 06:47:22 cxerp unix:     UDBH 0x00a0 UDBH.ESYND 0xa0 UDBL 0x00a0 UDBL.ESY
ND 0xa0
Aug 26 06:47:22 cxerp unix: [AFT2] errID 0x000581a1.0b672f51 PA=0x00000000.2367f
d70
Aug 26 06:47:22 cxerp unix:     E$tag 0x00000000.0a40046c E$State: Shared E$pari
ty 0x05
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x00): 0x00000000.8a5e2fc0
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x08): 0x8adc4958.8ae2bd4c
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x10): 0x8ae2bd4c.8ae2bd54
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x18): 0x8ae2bd54.00000000
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x20): 0x00000007.020bedb2
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x28): 0x00000008.00002bf8
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x30): 0x00000201.851d6800 *Bad* PSYN
D=0x2000
Aug 26 06:47:22 cxerp unix: [AFT2] E$Data (0x38): 0x00000000.0000a395
Aug 26 06:47:22 cxerp unix: NOTICE: Scheduling clearing of error on page 0x00000
000.2367e000
Aug 26 06:47:22 cxerp unix: [AFT3] errID 0x000581a1.0b672f51 Above Error is in U
ser Mode
Aug 26 06:47:22 cxerp unix:     and is fatal: will reboot
Aug 26 06:47:22 cxerp unix: WARNING: [AFT1] initiating reboot due to above error
in pid 12150 (oracle)
Aug 26 06:47:24 cxerp syslogd: going down on signal 15
Aug 26 06:53:35 cxerp unix: cpu0: SUNW,UltraSPARC-II (upaid 6 impl 0x11 ver 0xa0
clock 400 MHz)
Aug 26 06:53:35 cxerp unix: cpu1: SUNW,UltraSPARC-II (upaid 7 impl 0x11 ver 0xa0
clock 400 MHz)
Aug 26 06:53:35 cxerp unix: ^MSunOS Release 5.6 Version Generic_105181-28 [UNIX(
R) System V Release 4.0]
Aug 26 06:53:35 cxerp unix: Copyright (c) 1983-1997, Sun Microsystems, Inc.
Aug 26 06:53:35 cxerp unix: mem = 2097152K (0x80000000)
Aug 26 06:53:35 cxerp unix: avail mem = 2065743872
Aug 26 06:53:35 cxerp unix: Ethernet address = 8:0:20:ae:3b:8
Aug 26 06:53:35 cxerp unix: root nexus = 5-slot Sun Enterprise E3500
Aug 26 06:53:35 cxerp unix: sbus0 at root: UPA 0x2 0x0 ...
Aug 26 06:53:35 cxerp unix: sbus0 is /sbus@2,0

以上错误信息显示的是CPU出问题了,还是内存有问题?

[本帖最后由 荷荷 于 2008-8-26 17:07 编辑]

TAG:

天使的童话 荷荷 发布于2008-08-27 08:41:06
UP~  一晚上都没人来帮忙?
michael1983发布于2008-08-27 09:37:35
个人意见:
MEM module出问题了。
具体要找sun 800工程师分析了

[ 本帖最后由 michael1983 于 2008-8-27 09:41 编辑 ]
天使的童话 荷荷 发布于2008-08-27 13:37:39

QUOTE:

原帖由 michael1983 于 2008-8-27 09:37 发表
个人意见:
MEM module出问题了。
具体要找sun 800工程师分析了
内存?谢谢~~
进程恋音符 进程音 发布于2008-08-29 10:50:29
荷  把现象说下!
天使的童话 荷荷 发布于2008-08-29 11:16:59
Aug 26 06:47:22 cxerp unix:     and is fatal: will reboot
Aug 26 06:47:22 cxerp unix: WARNING: [AFT1] initiating reboot due to above error
in pid 12150 (oracle)
Aug 26 06:47:24 cxerp syslogd: going down on signal 15
系统自动重启
进程恋音符 进程音 发布于2008-08-29 11:21:13
机器型号:是什么

一般打patch就可以搞定的,也不排除硬件问题:
如果硬件:我认为主板的可能行大,下来就是内存,CPU我感觉没有可能。
进程恋音符 进程音 发布于2008-08-29 11:22:52
手头有配件 的话  自己换着试试。
alexwwf发布于2008-08-29 15:35:00
内存和主板的可能性更大,cpu7看不出有什么问题,只是说给cpu7用的memery有错误
天使的童话 荷荷 发布于2008-08-29 16:25:51

QUOTE:

原帖由 进程音 于 2008-8-29 11:21 发表
机器型号:是什么

一般打patch就可以搞定的,也不排除硬件问题:
如果硬件:我认为主板的可能行大,下来就是内存,CPU我感觉没有可能。
应该不是patch的问题,这台机器用了差不多十年了,要是patch的问题,不会等到今天

我觉得还是硬件的问题
天使的童话 荷荷 发布于2008-08-29 16:26:32

QUOTE:

原帖由 进程音 于 2008-8-29 11:22 发表
手头有配件 的话  自己换着试试。
呵呵,莫说我们手头,就是sun公司都不知道有没有配件了
天使的童话 荷荷 发布于2008-08-29 16:28:58

QUOTE:

原帖由 alexwwf 于 2008-8-29 15:35 发表
内存和主板的可能性更大,cpu7看不出有什么问题,只是说给cpu7用的memery有错误
非常感谢您的意见
北极星上的人发布于2008-09-02 16:39:16
不是CPU的错误,报的是缓存的软错误,应该不是自动重启的直接原因,看报错关键看报了多久,只是偶尔的话就不是硬件问题。E3500也不算很老了,我这还有好几台呢,不过没什么应用了
我来说两句

(可选)

日历

« 2008-11-14  
      1
2345678
9101112131415
16171819202122
23242526272829
30      

数据统计

  • 访问量: 2203
  • 日志数: 36
  • 图片数: 1
  • 建立时间: 2007-08-01
  • 更新时间: 2008-11-10

RSS订阅

Open Toolbar