Уважаемые дамы и господа! Для вас сохранен старый форум по адресу http://forum.intersyst.ru

Страницы: 1
RSS
HELP отваливается кабинет, периодически перезагружается кабинет и всё его содержимое
 
Периодически (два - три раза в сутки) отваливается второй кабинет, что влечет за собой перезагрузку всех плат.

Меняли все патчкорды, а именно между GD первого кабинета и платой PowerMEX второго кабинета. А также патчкорды между платой LANX и всеми платами двух кабинетов.

В Инцидентах вижу следующее

04/04/12 10:16:21 001008M|002/00/0/254|=2:0379=Inter ACT link HS: 23,(19,1),10.30.10.5,00:80:9f:8e:11:cc
04/04/12 10:16:21 001008M|002/--/-/---|=2:2043=Loss of the 2 CRYSTAL
04/04/12 10:16:21 001008M|002/00/-/---|=2:2042=Loss of a GD/GD3 type cpl
04/04/12 10:16:21 001008M|---/--/-/---|=2:2140=Alarm : TRUNK resources quantity critical
04/04/12 10:16:21 001008M|002/02/-/---|=2:2042=Loss of a UA type cpl
04/04/12 10:16:21 001008M|002/05/-/---|=2:2042=Loss of a Z type cpl
04/04/12 10:16:21 001008M|002/06/-/---|=2:2042=Loss of a PRA type cpl
04/04/12 10:16:21 001008M|003/--/-/---|=2:2043=Loss of the 3 CRYSTAL
04/04/12 10:16:21 001008M|002/27/-/---|=3:2490=Loss of a virtual coupler GPA (2,27) of the associated coupler GD/GD3 (2,0)
04/04/12 10:16:21 001008M|003/00/-/---|=3:2490=Loss of a virtual coupler GPA (3,0) of the associated coupler MEX (3,0)
04/04/12 10:16:21 001008M|003/01/-/---|=2:2042=Loss of a UA type cpl
04/04/12 10:16:21 001008M|003/06/-/---|=2:2042=Loss of a NDDI type cpl
04/04/12 10:16:21 001008M|003/07/-/---|=2:2042=Loss of a NDDI type cpl


Что можно еще предпринять?
 
Если перед этим инцидентов не было, то встаете на ком порт платы GD3 и смотрите, что ей не нравится перед перезагрузкой.
 
Давайте сначала и подробнее.
Что отваливается - 2-кабинет - это с GD или с MEX? Из вашего сообщения несколько противоречивых вещей:
- "отваливается второй кабинет",
- " между GD первого кабинета и платой PowerMEX второго кабинета",
- 04/04/12 10:16:21 001008M|002/--/-/---|=2:2043=Loss of the 2 CRYSTAL
04/04/12 10:16:21 001008M|002/00/-/---|=2:2042=Loss of a GD/GD3 type cpl

- 04/04/12 10:16:21 001008M|003/--/-/---|=2:2043=Loss of the 3 CRYSTAL

Давайте определимся с номерами, платами и кто отпадывает. У вас по инцидентам - падает ящик 2 (с GD), а вслед за ним наступает кирдык ящику 3! с MEX.

Собственно - интересно увидет config all, а так-же пару слов по организации сети - все воткнуто в общий коммутатор (CS, GD, местные компы), или станция воткнута в отдельную подсеть (чтоб не убивали сисадмины, броадкаст и пр. сетевые хохмы).
 
VAD   так и есть, сначала падает 2 кабинет, в котором стоит GD, а затем 3 кабинет с POWER MEX

Вся коммутация идет через LANX
Вот что рассказывает config all

Crystal 0 :

  +-------------------------------------------------------------------+
  | Cr | cpl| cpl type   | hw type   |  cpl  state  |  coupler ID     |
  |----|----|------------|-----------|--------------|-----------------|
  |  0 |  6 | App. Server|---------- |   IN SERVICE |   BAD PCMS CODE |
  |  0 | 10 | App. Server|---------- |   IN SERVICE |   BAD PCMS CODE |
  +-------------------------------------------------------------------+


> Reference rack number: 2


Crystal 1 :

  +-------------------------------------------------------------------+
  | Cr | cpl| cpl type   | hw type   |  cpl  state  |  coupler ID     |
  |----|----|------------|-----------|--------------|-----------------|
  |  1 |  0 |   UA_FICTIF|           |   IN SERVICE |    NO PCMS CODE |
  +-------------------------------------------------------------------+


Crystal 2 :

  +-------------------------------------------------------------------+
  | Cr | cpl| cpl type   | hw type   |  cpl  state  |  coupler ID     |
  |----|----|------------|-----------|--------------|-----------------|
  |  2 |  0 |         GD3|---------- |   IN SERVICE |   BAD PCMS CODE |
  |  2 |  2 |      UAI 16|---------- |   IN SERVICE |   BAD PCMS CODE |
  |  2 |  5 |   SLI 16(Z)|---------- |   IN SERVICE |   BAD PCMS CODE |
  |  2 |  6 |      PRA T2|---------- |   IN SERVICE |   BAD PCMS CODE |
  +-------------------------------------------------------------------+

  --- Inter Crystal Topology ---

  +-------------------------------------------------------------------------+
  | CR | CPL Type    Role          Free/Tot         Role    Type   CPL | CR |
  |-------------------------------------------------------------------------|
  |002 | 00 -GD3     (INT_A  )  ===  78/78 ===  (   MAIN)   pwMEX - 00 |003 |
  |-------------------------------------------------------------------------|
  |002 | 00 -GD3     (MAIN   )  ---  58/60 ---  (  INT_A) INTIP3A - 01 |019 |
  |-------------------------------------------------------------------------|

Crystal 3 :

  +-------------------------------------------------------------------+
  | Cr | cpl| cpl type   | hw type   |  cpl  state  |  coupler ID     |
  |----|----|------------|-----------|--------------|-----------------|
  |  3 |  0 |       pwMEX|---------- |   IN SERVICE |    NO PCMS CODE |
  |  3 |  1 |      UAI 16|---------- |   IN SERVICE |   BAD PCMS CODE |
  |  3 |  2 |       APPLI|---------- |    LANX 16_1 |   BAD PCMS CODE |
  |  3 |  6 |       APA 8|---------- |   IN SERVICE |   BAD PCMS CODE |
  |  3 |  7 |       APA 8|---------- |   IN SERVICE |   BAD PCMS CODE |
  +-------------------------------------------------------------------+

  --- Inter Crystal Topology ---

  +-------------------------------------------------------------------------+
  | CR | CPL Type    Role          Free/Tot         Role    Type   CPL | CR |
  |-------------------------------------------------------------------------|
  |003 | 00 -pwMEX   (MAIN   )  ---  78/78 ---  (  INT_A)   MGD3  - 00 |002 |
  |-------------------------------------------------------------------------|

Crystal 18 :

  +-------------------------------------------------------------------+
  | Cr | cpl| cpl type   | hw type   |  cpl  state  |  coupler ID     |
  |----|----|------------|-----------|--------------|-----------------|
  | 18 |  0 |          GD|---------- | REG NOT INIT |    NO PCMS CODE |
  | 18 |  1 |        4645|---------- | REG NOT INIT |    NO PCMS CODE |
  +-------------------------------------------------------------------+


Crystal 19 :

  +-------------------------------------------------------------------+
  | Cr | cpl| cpl type   | hw type   |  cpl  state  |  coupler ID     |
  |----|----|------------|-----------|--------------|-----------------|
  | 19 |  0 |      FICTIF|           | REG NOT INIT |    NO PCMS CODE |
  | 19 |  1 |     INTIP3A|           |   IN SERVICE |    NO PCMS CODE |
  | 19 |  2 |     INTIP3A|           |  OUT OF SERV |    NO PCMS CODE |
  | 19 |  3 |    Z_FICTIF|           |   IN SERVICE |    NO PCMS CODE |
  +-------------------------------------------------------------------+

  --- Inter Crystal Topology ---

  +-------------------------------------------------------------------------+
  | CR | CPL Type    Role          Free/Tot         Role    Type   CPL | CR |
  |-------------------------------------------------------------------------|
  |019 | 01 -INTIP3A (INT_A  )  ===  58/60 ===  (   MAIN)     GD3 - 00 |002 |
  |-------------------------------------------------------------------------|
 
Вот весь лог инфидентов

04/04/12 10:16:21 001008M|002/00/0/254|=2:0379=Inter ACT link HS: 23,(19,1),10.30.10.5,00:80:9f:8e:11:cc
04/04/12 10:16:21 001008M|002/--/-/---|=2:2043=Loss of the 2 CRYSTAL
04/04/12 10:16:21 001008M|002/00/-/---|=2:2042=Loss of a GD/GD3 type cpl
04/04/12 10:16:21 001008M|---/--/-/---|=2:2140=Alarm : TRUNK resources quantity critical
04/04/12 10:16:21 001008M|002/02/-/---|=2:2042=Loss of a UA type cpl
04/04/12 10:16:21 001008M|002/05/-/---|=2:2042=Loss of a Z type cpl
04/04/12 10:16:21 001008M|002/06/-/---|=2:2042=Loss of a PRA type cpl
04/04/12 10:16:21 001008M|003/--/-/---|=2:2043=Loss of the 3 CRYSTAL
04/04/12 10:16:21 001008M|002/27/-/---|=3:2490=Loss of a virtual coupler GPA (2,27) of the associated coupler GD/GD3 (2,0)
04/04/12 10:16:21 001008M|003/00/-/---|=3:2490=Loss of a virtual coupler GPA (3,0) of the associated coupler MEX (3,0)
04/04/12 10:16:21 001008M|003/01/-/---|=2:2042=Loss of a UA type cpl
04/04/12 10:16:21 001008M|003/06/-/---|=2:2042=Loss of a NDDI type cpl
04/04/12 10:16:21 001008M|003/07/-/---|=2:2042=Loss of a NDDI type cpl
04/04/12 10:18:02 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (binmg3)
04/04/12 10:18:02 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (binmg3)
04/04/12 10:18:28 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (binmg3)
04/04/12 10:18:28 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (binmg3)
04/04/12 10:18:35 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (binamcvb642x
04/04/12 10:18:35 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (binamcvb642x
04/04/12 10:18:36 001008M|002/00/-/---|=4:0740=Beginning of an INT/IP downloading @:00.80.9f.8e.11.cc (bin642xconf.
04/04/12 10:18:36 001008M|002/00/-/---|=5:0741=End of downloading of an INT/IP board @:00.80.9f.8e.11.cc (bin642xconf.
04/04/12 10:18:40 001008M|002/00/-/---|=5:0409=The inter-ACT link over IP from (19 1) is up
04/04/12 10:18:40 001008M|002/00/-/---|=3:5874=telnet service closed
04/04/12 10:18:41 001008M|002/00/-/---|=3:5874=telnet service closed
04/04/12 10:18:41 001008M|002/00/-/---|=0:5857=GD/GA/INTIP/RGD: reason of reboot 2
04/04/12 10:18:41 001008M|002/00/-/---|=3:5874=telnet service closed
04/04/12 10:18:43 001008M|---/--/-/---|=4:2500=Dow: file /DHS3ext/vgadpcm/flash/std/vgadpcm.FR0 opening error
04/04/12 10:18:44 001008M|---/--/-/---|=4:2500=Dow: file /DHS3ext/vgadpcm/flash/std/vgadpcm.FR0 opening error
04/04/12 10:18:44 001008M|---/--/-/---|=4:2500=Dow: file /DHS3ext/vgadpcm/flash/std/vgadpcm.PT0 opening error
04/04/12 10:18:46 001008M|002/00/0/000|=2:5973=IP Dlap Released
04/04/12 10:18:48 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:18:49 001008M|---/--/-/---|=5:2141=TRUNK resources quantity normal
04/04/12 10:18:50 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:18:51 001008M|002/00/0/000|=5:2102=T2 access back to normal
04/04/12 10:18:51 001008M|002/00/0/000|=4:2113=T2 lapD not established still trying
04/04/12 10:18:51 001008M|002/00/0/000|=5:5974=IP Dlap Established
04/04/12 10:18:52 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:18:52 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:18:54 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:18:54 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:18:56 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:18:57 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:18:58 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:18:58 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:18:59 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:19:00 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:19:02 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:19:02 001008M|002/02/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:19:02 001008M|003/01/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:19:04 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:19:04 001008M|003/01/-/---|=4:0260=Beginning of downloading startibsng
04/04/12 10:19:06 001008M|002/02/-/---|=5:0261=End of downloading startibsng
04/04/12 10:19:07 001008M|003/01/-/---|=5:0261=End of downloading startibsng
04/04/12 10:19:08 001008M|003/01/-/---|=5:0261=End of downloading startibsng
04/04/12 10:19:10 001008M|002/00/-/---|=5:2019=GD/GD3 coupler commissioning
04/04/12 10:19:13 001008M|002/02/0/000|=5:3958=IBS operational
04/04/12 10:19:14 001008M|002/27/-/---|=4:2491=GPA(2,27) virtual coupler commissioning of the associated coupler GD/GD3(2,0)
04/04/12 10:19:17 001008M|002/02/0/002|=5:3958=IBS operational
04/04/12 10:19:21 001008M|002/02/0/004|=5:3958=IBS operational
04/04/12 10:19:21 001008M|002/02/0/006|=5:3958=IBS operational
04/04/12 10:19:21 001008M|002/02/0/008|=5:3958=IBS operational
04/04/12 10:19:25 001008M|003/00/-/---|=4:2491=GPA(3,0) virtual coupler commissioning of the associated coupler MEX(3,0)
04/04/12 10:19:25 001008M|002/02/0/010|=5:3958=IBS operational
04/04/12 10:19:25 001008M|002/02/0/012|=5:3958=IBS operational
04/04/12 10:19:28 001008M|002/05/-/---|=5:2019=Z coupler commissioning
04/04/12 10:19:29 001008M|002/02/0/014|=3:3954=IBS connected with just on 1 UA link, instead of 2 configured
04/04/12 10:19:29 001008M|002/02/0/014|=3:3953=Internal IBS anomaly no 1, parameters 0 255 255 255
04/04/12 10:19:29 001008M|003/06/-/---|=5:2019=NDDI coupler commissioning
04/04/12 10:19:29 001008M|002/02/0/014|=3:3954=IBS connected with just on 1 UA link, instead of 2 configured
04/04/12 10:19:29 001008M|002/02/0/014|=5:3958=IBS operational
04/04/12 10:19:29 001008M|003/01/0/002|=5:3958=IBS operational
04/04/12 10:19:29 001008M|003/01/0/000|=5:3958=IBS operational
04/04/12 10:19:31 001008M|003/07/-/---|=5:2019=NDDI coupler commissioning
04/04/12 10:19:34 001008M|002/02/-/---|=5:2019=UA coupler commissioning
04/04/12 10:19:48 001008M|003/01/-/---|=5:2019=UA coupler commissioning
04/04/12 10:20:12 001008M|002/06/0/000|=4:2113=T2 lapD not established still trying
04/04/12 10:20:42 001008M|002/06/-/---|=5:2019=PRA coupler commissioning
04/04/12 11:28:01 001008M|---/--/-/---|=3:1125=external alarm : "mtcl login"
 
Локалка (компы, сервера) воткнута туда-же - не в смысле прямо в LANX, а с точки зрения адресов и масок все в одной сети?
Инцидентов на процах про большой трафик и запрет ethernet нет?
Воткните комп с последовательным портом в GD - посмотрите, чего напишет.
 
нет все в разных VLAN
 
инцидентов до падения нет никаких,
попробую подключится к GD , отпишусь
 
Приподниму тему, ибо совпадает с моей проблемой.
Есть OXE в MG шасси R12.1-m2.300-29-a-ru-c83 с дублированными процами. За последний месяц пару раз уходил в ребут GD. После первого ребута заменил коммутатор и патчкорды на абс.новые, бесперебойник стоит нормальный вроде. До этого был включен через плату LANX16. Сеть одноранговая простейшая.
Теряется GD3 судя по логам, процы не пропадают.
01/02/21 09:23:12 001006M|---/--/-/---|=2:0275=ACCOUNTING: Appli ACCOUNTING : feature incident 77 1
01/02/21 09:23:12 001006S|---/--/-/---|=2:0275=ACCOUNTING: Appli ACCOUNTING : feature incident 77 1
02/02/21 22:52:29 001006M|001/00/0/254|=2:0379=Inter ACT link HS: 23,(19,1),xxx.xxx.xxx.xxx,00:80:9f:xx:xx:xx
02/02/21 22:52:29 001006M|001/--/-/---|=2:2043=Loss of the 1 CRYSTAL
02/02/21 22:52:29 001006M|001/00/-/---|=2:2042=Loss of a GD/GD3 type cpl
02/02/21 22:52:29 001006M|001/01/-/---|=2:2042=Loss of a Z type cpl
02/02/21 22:52:29 001006M|---/--/-/---|=2:2140=Alarm : SET resources quantity critical
02/02/21 22:52:29 001006M|001/02/-/---|=2:2042=Loss of a MIX type cpl
02/02/21 22:52:29 001006M|001/03/-/---|=2:2042=Loss of a Z type cpl

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++­++++

Посмотрел описание incinfo
23   Link out of service - No more signalling ressources"
"         (There is no INTIPA in service)."

Затем минуты через 3 поднимается.
Пока грешу на холодное помещение, где стоит станция, может keep-alive udp замерзают в ней )).
Может кто сталкивался с подобным, и еще где можно посмотреть?
Изменено: fedoseevka - 03.02.2021 09:46:21 (1)
 

Холодное помещение - это какая температура? Поставьте тепловентилятор

Можно и GD поменять

Страницы: 1
Читают тему