Периодически (два - три раза в сутки) отваливается второй кабинет, что влечет за собой перезагрузку всех плат.
Меняли все патчкорды, а именно между GD первого кабинета и платой PowerMEX второго кабинета. А также патчкорды между платой LANX и всеми платами двух кабинетов.
В Инцидентах вижу следующее
04/04/12 10:16:21 001008M|002/00/0/254|=2:0379=Inter ACT link HS: 23,(19,1),10.30.10.5,00:80:9f:8e:11:cc 04/04/12 10:16:21 001008M|002/--/-/---|=2:2043=Loss of the 2 CRYSTAL 04/04/12 10:16:21 001008M|002/00/-/---|=2:2042=Loss of a GD/GD3 type cpl 04/04/12 10:16:21 001008M|---/--/-/---|=2:2140=Alarm : TRUNK resources quantity critical 04/04/12 10:16:21 001008M|002/02/-/---|=2:2042=Loss of a UA type cpl 04/04/12 10:16:21 001008M|002/05/-/---|=2:2042=Loss of a Z type cpl 04/04/12 10:16:21 001008M|002/06/-/---|=2:2042=Loss of a PRA type cpl 04/04/12 10:16:21 001008M|003/--/-/---|=2:2043=Loss of the 3 CRYSTAL 04/04/12 10:16:21 001008M|002/27/-/---|=3:2490=Loss of a virtual coupler GPA (2,27) of the associated coupler GD/GD3 (2,0) 04/04/12 10:16:21 001008M|003/00/-/---|=3:2490=Loss of a virtual coupler GPA (3,0) of the associated coupler MEX (3,0) 04/04/12 10:16:21 001008M|003/01/-/---|=2:2042=Loss of a UA type cpl 04/04/12 10:16:21 001008M|003/06/-/---|=2:2042=Loss of a NDDI type cpl 04/04/12 10:16:21 001008M|003/07/-/---|=2:2042=Loss of a NDDI type cpl
Давайте сначала и подробнее. Что отваливается - 2-кабинет - это с GD или с MEX? Из вашего сообщения несколько противоречивых вещей: - "отваливается второй кабинет", - " между GD первого кабинета и платой PowerMEX второго кабинета", - 04/04/12 10:16:21 001008M|002/--/-/---|=2:2043=Loss of the 2 CRYSTAL 04/04/12 10:16:21 001008M|002/00/-/---|=2:2042=Loss of a GD/GD3 type cpl
- 04/04/12 10:16:21 001008M|003/--/-/---|=2:2043=Loss of the 3 CRYSTAL
Давайте определимся с номерами, платами и кто отпадывает. У вас по инцидентам - падает ящик 2 (с GD), а вслед за ним наступает кирдык ящику 3! с MEX.
Собственно - интересно увидет config all, а так-же пару слов по организации сети - все воткнуто в общий коммутатор (CS, GD, местные компы), или станция воткнута в отдельную подсеть (чтоб не убивали сисадмины, броадкаст и пр. сетевые хохмы).
VAD так и есть, сначала падает 2 кабинет, в котором стоит GD, а затем 3 кабинет с POWER MEX
Вся коммутация идет через LANX Вот что рассказывает config all
Crystal 0 :
+-------------------------------------------------------------------+ | Cr | cpl| cpl type | hw type | cpl state | coupler ID | |----|----|------------|-----------|--------------|-----------------| | 0 | 6 | App. Server|---------- | IN SERVICE | BAD PCMS CODE | | 0 | 10 | App. Server|---------- | IN SERVICE | BAD PCMS CODE | +-------------------------------------------------------------------+
> Reference rack number: 2
Crystal 1 :
+-------------------------------------------------------------------+ | Cr | cpl| cpl type | hw type | cpl state | coupler ID | |----|----|------------|-----------|--------------|-----------------| | 1 | 0 | UA_FICTIF| | IN SERVICE | NO PCMS CODE | +-------------------------------------------------------------------+
Crystal 2 :
+-------------------------------------------------------------------+ | Cr | cpl| cpl type | hw type | cpl state | coupler ID | |----|----|------------|-----------|--------------|-----------------| | 2 | 0 | GD3|---------- | IN SERVICE | BAD PCMS CODE | | 2 | 2 | UAI 16|---------- | IN SERVICE | BAD PCMS CODE | | 2 | 5 | SLI 16(Z)|---------- | IN SERVICE | BAD PCMS CODE | | 2 | 6 | PRA T2|---------- | IN SERVICE | BAD PCMS CODE | +-------------------------------------------------------------------+
+-------------------------------------------------------------------+ | Cr | cpl| cpl type | hw type | cpl state | coupler ID | |----|----|------------|-----------|--------------|-----------------| | 3 | 0 | pwMEX|---------- | IN SERVICE | NO PCMS CODE | | 3 | 1 | UAI 16|---------- | IN SERVICE | BAD PCMS CODE | | 3 | 2 | APPLI|---------- | LANX 16_1 | BAD PCMS CODE | | 3 | 6 | APA 8|---------- | IN SERVICE | BAD PCMS CODE | | 3 | 7 | APA 8|---------- | IN SERVICE | BAD PCMS CODE | +-------------------------------------------------------------------+
--- Inter Crystal Topology ---
+-------------------------------------------------------------------------+ | CR | CPL Type Role Free/Tot Role Type CPL | CR | |-------------------------------------------------------------------------| |003 | 00 -pwMEX (MAIN ) --- 78/78 --- ( INT_A) MGD3 - 00 |002 | |-------------------------------------------------------------------------|
Crystal 18 :
+-------------------------------------------------------------------+ | Cr | cpl| cpl type | hw type | cpl state | coupler ID | |----|----|------------|-----------|--------------|-----------------| | 18 | 0 | GD|---------- | REG NOT INIT | NO PCMS CODE | | 18 | 1 | 4645|---------- | REG NOT INIT | NO PCMS CODE | +-------------------------------------------------------------------+
Crystal 19 :
+-------------------------------------------------------------------+ | Cr | cpl| cpl type | hw type | cpl state | coupler ID | |----|----|------------|-----------|--------------|-----------------| | 19 | 0 | FICTIF| | REG NOT INIT | NO PCMS CODE | | 19 | 1 | INTIP3A| | IN SERVICE | NO PCMS CODE | | 19 | 2 | INTIP3A| | OUT OF SERV | NO PCMS CODE | | 19 | 3 | Z_FICTIF| | IN SERVICE | NO PCMS CODE | +-------------------------------------------------------------------+
--- Inter Crystal Topology ---
+-------------------------------------------------------------------------+ | CR | CPL Type Role Free/Tot Role Type CPL | CR | |-------------------------------------------------------------------------| |019 | 01 -INTIP3A (INT_A ) === 58/60 === ( MAIN) GD3 - 00 |002 | |-------------------------------------------------------------------------|
04/04/12 10:16:21 001008M|002/00/0/254|=2:0379=Inter ACT link HS: 23,(19,1),10.30.10.5,00:80:9f:8e:11:cc 04/04/12 10:16:21 001008M|002/--/-/---|=2:2043=Loss of the 2 CRYSTAL 04/04/12 10:16:21 001008M|002/00/-/---|=2:2042=Loss of a GD/GD3 type cpl 04/04/12 10:16:21 001008M|---/--/-/---|=2:2140=Alarm : TRUNK resources quantity critical 04/04/12 10:16:21 001008M|002/02/-/---|=2:2042=Loss of a UA type cpl 04/04/12 10:16:21 001008M|002/05/-/---|=2:2042=Loss of a Z type cpl 04/04/12 10:16:21 001008M|002/06/-/---|=2:2042=Loss of a PRA type cpl 04/04/12 10:16:21 001008M|003/--/-/---|=2:2043=Loss of the 3 CRYSTAL 04/04/12 10:16:21 001008M|002/27/-/---|=3:2490=Loss of a virtual coupler GPA (2,27) of the associated coupler GD/GD3 (2,0) 04/04/12 10:16:21 001008M|003/00/-/---|=3:2490=Loss of a virtual coupler GPA (3,0) of the associated coupler MEX (3,0) 04/04/12 10:16:21 001008M|003/01/-/---|=2:2042=Loss of a UA type cpl 04/04/12 10:16:21 001008M|003/06/-/---|=2:2042=Loss of a NDDI type cpl 04/04/12 10:16:21 001008M|003/07/-/---|=2:2042=Loss of a NDDI type cpl 04/04/12 10:18:02 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (binmg3) 04/04/12 10:18:02 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (binmg3) 04/04/12 10:18:28 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (binmg3) 04/04/12 10:18:28 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (binmg3) 04/04/12 10:18:35 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (binamcvb642x 04/04/12 10:18:35 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (binamcvb642x 04/04/12 10:18:36 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (bin642xconf. 04/04/12 10:18:36 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (bin642xconf. 04/04/12 10:18:40 001008M|002/00/-/---|=5:0409=The inter-ACT link over IP from (19 1) is up 04/04/12 10:18:40 001008M|002/00/-/---|=3:5874=telnet service closed 04/04/12 10:18:41 001008M|002/00/-/---|=3:5874=telnet service closed 04/04/12 10:18:41 001008M|002/00/-/---|=0:5857=GD/GA/INTIP/RGD: reason of reboot 2 04/04/12 10:18:41 001008M|002/00/-/---|=3:5874=telnet service closed 04/04/12 10:18:43 001008M|---/--/-/---|=4:2500=Dow: file /DHS3ext/vgadpcm/flash/std/vgadpcm.FR0 opening error 04/04/12 10:18:44 001008M|---/--/-/---|=4:2500=Dow: file /DHS3ext/vgadpcm/flash/std/vgadpcm.FR0 opening error 04/04/12 10:18:44 001008M|---/--/-/---|=4:2500=Dow: file /DHS3ext/vgadpcm/flash/std/vgadpcm.PT0 opening error 04/04/12 10:18:46 001008M|002/00/0/000|=2:5973=IP Dlap Released 04/04/12 10:18:48 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:18:49 001008M|---/--/-/---|=5:2141=TRUNK resources quantity normal 04/04/12 10:18:50 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:18:51 001008M|002/00/0/000|=5:2102=T2 access back to normal 04/04/12 10:18:51 001008M|002/00/0/000|=4:2113=T2 lapD not established still trying 04/04/12 10:18:51 001008M|002/00/0/000|=5:5974=IP Dlap Established 04/04/12 10:18:52 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:18:52 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:18:54 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:18:54 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:18:56 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:18:57 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:18:58 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:18:58 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:18:59 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:19:00 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:19:02 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:19:02 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:19:02 001008M|003/01/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:19:04 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:19:04 001008M|003/01/-/---|=4:0260=Beginning of downloading startibsng 04/04/12 10:19:06 001008M|002/02/-/---|=5:0261=End of downloading startibsng 04/04/12 10:19:07 001008M|003/01/-/---|=5:0261=End of downloading startibsng 04/04/12 10:19:08 001008M|003/01/-/---|=5:0261=End of downloading startibsng 04/04/12 10:19:10 001008M|002/00/-/---|=5:2019=GD/GD3 coupler commissioning 04/04/12 10:19:13 001008M|002/02/0/000|=5:3958=IBS operational 04/04/12 10:19:14 001008M|002/27/-/---|=4:2491=GPA(2,27) virtual coupler commissioning of the associated coupler GD/GD3(2,0) 04/04/12 10:19:17 001008M|002/02/0/002|=5:3958=IBS operational 04/04/12 10:19:21 001008M|002/02/0/004|=5:3958=IBS operational 04/04/12 10:19:21 001008M|002/02/0/006|=5:3958=IBS operational 04/04/12 10:19:21 001008M|002/02/0/008|=5:3958=IBS operational 04/04/12 10:19:25 001008M|003/00/-/---|=4:2491=GPA(3,0) virtual coupler commissioning of the associated coupler MEX(3,0) 04/04/12 10:19:25 001008M|002/02/0/010|=5:3958=IBS operational 04/04/12 10:19:25 001008M|002/02/0/012|=5:3958=IBS operational 04/04/12 10:19:28 001008M|002/05/-/---|=5:2019=Z coupler commissioning 04/04/12 10:19:29 001008M|002/02/0/014|=3:3954=IBS connected with just on 1 UA link, instead of 2 configured 04/04/12 10:19:29 001008M|002/02/0/014|=3:3953=Internal IBS anomaly no 1, parameters 0 255 255 255 04/04/12 10:19:29 001008M|003/06/-/---|=5:2019=NDDI coupler commissioning 04/04/12 10:19:29 001008M|002/02/0/014|=3:3954=IBS connected with just on 1 UA link, instead of 2 configured 04/04/12 10:19:29 001008M|002/02/0/014|=5:3958=IBS operational 04/04/12 10:19:29 001008M|003/01/0/002|=5:3958=IBS operational 04/04/12 10:19:29 001008M|003/01/0/000|=5:3958=IBS operational 04/04/12 10:19:31 001008M|003/07/-/---|=5:2019=NDDI coupler commissioning 04/04/12 10:19:34 001008M|002/02/-/---|=5:2019=UA coupler commissioning 04/04/12 10:19:48 001008M|003/01/-/---|=5:2019=UA coupler commissioning 04/04/12 10:20:12 001008M|002/06/0/000|=4:2113=T2 lapD not established still trying 04/04/12 10:20:42 001008M|002/06/-/---|=5:2019=PRA coupler commissioning 04/04/12 11:28:01 001008M|---/--/-/---|=3:1125=external alarm : "mtcl login"
Локалка (компы, сервера) воткнута туда-же - не в смысле прямо в LANX, а с точки зрения адресов и масок все в одной сети? Инцидентов на процах про большой трафик и запрет ethernet нет? Воткните комп с последовательным портом в GD - посмотрите, чего напишет.
Приподниму тему, ибо совпадает с моей проблемой. Есть OXE в MG шасси R12.1-m2.300-29-a-ru-c83 с дублированными процами. За последний месяц пару раз уходил в ребут GD. После первого ребута заменил коммутатор и патчкорды на абс.новые, бесперебойник стоит нормальный вроде. До этого был включен через плату LANX16. Сеть одноранговая простейшая. Теряется GD3 судя по логам, процы не пропадают. 01/02/21 09:23:12 001006M|---/--/-/---|=2:0275=ACCOUNTING: Appli ACCOUNTING : feature incident 77 1 01/02/21 09:23:12 001006S|---/--/-/---|=2:0275=ACCOUNTING: Appli ACCOUNTING : feature incident 77 1 02/02/21 22:52:29 001006M|001/00/0/254|=2:0379=Inter ACT link HS: 23,(19,1),xxx.xxx.xxx.xxx,00:80:9f:xx:xx:xx 02/02/21 22:52:29 001006M|001/--/-/---|=2:2043=Loss of the 1 CRYSTAL 02/02/21 22:52:29 001006M|001/00/-/---|=2:2042=Loss of a GD/GD3 type cpl 02/02/21 22:52:29 001006M|001/01/-/---|=2:2042=Loss of a Z type cpl 02/02/21 22:52:29 001006M|---/--/-/---|=2:2140=Alarm : SET resources quantity critical 02/02/21 22:52:29 001006M|001/02/-/---|=2:2042=Loss of a MIX type cpl 02/02/21 22:52:29 001006M|001/03/-/---|=2:2042=Loss of a Z type cpl
Посмотрел описание incinfo 23 Link out of service - No more signalling ressources" " (There is no INTIPA in service)."
Затем минуты через 3 поднимается. Пока грешу на холодное помещение, где стоит станция, может keep-alive udp замерзают в ней )). Может кто сталкивался с подобным, и еще где можно посмотреть?