Уважаемые дамы и господа! Для вас сохранен старый форум по адресу http://forum.intersyst.ru

Страницы: 1 2 След.
RSS
Powerfail, shutdown, инцидент 1521=Powerfail, shutdown
 
Доброго дня!
Станция OmniPCX Enterprise Релиз R9.1
С двумя процессорами. Защищена по питанию бесперебойным блоком Benning, с преобразователями 220-48 Вольт, поддерживающими заряд аккумуляторов питающих станцию. Бесперебойный блок питается в свою очередь от бесперебойного блока здания.
Три дня назад случилась неприятность, неожиданно выключился основной процессор, а запасной не подхватил управление.
Скачков питания и аварий на обоих блоках не зарегистрировано. Кабели питания никто не трогал.
Вот что было написано перед выключением:
11/09/17 11:07:13 000001M|---/--/-/---|=1:1521=Powerfail, shutdown
Такое было уже лет 8 назад на релизе R5.1. Запись была тогда про аномалию питания и так же shutdown
Вопрос в следующем- как избежать таких ситуаций?
Может параметры контроля сети как-то регулируются в программе станции (не нахожу)?
 
Железо, скорее всего - кристалл. Там процессор контролирует сигнал PSAL с небольшой платки со светодиодами в стативе (М2, М3 и т.д.) или шкафу (дата кабинет). Может быть контакт пропадал.
Настройки в swinst - Shutdown powerfail delay (по умолчанию - 0 часов 0 минут) поставьте 1 минуту:

                         ALCATEL-LUCENT
System management menu                   Installation FACILITIES 2.51.0



       1       Date & time update
       2       Autostart management
       3       Shutdown powerfail delay (Current Value : 0 h 1 m )
       4       Console configuration
       5       User's accounts management
       6       IMAP server management
       Q       Go back to previous menu

 Your choice [1..6, Q] ?
 
На резервном - была перезагрузка в этот момент? (incvisu на резервном покажет когда он стартовал, можно incvisu -b 1 посмотреть).
 
Поставил 1 минуту, спасибо!

На резервном перезагрузки не было. В его incvisu не было записи о падении основного процессора, что очень странно, ведь они в режиме дублирования работают. Посмотреть сейчас не могу, так как заменил на нём винчестер на всякий случай (ведь он не подхватил управление).
Резервный когда был основным, отваливались аналоговые телефоны. Становились не доступными и зум на них пропадал.
Изменено: dima0328 - 14.09.2017 10:08:42
 
Выравнивание базы - давно делали (mastercopy)?
Twin  - что показывает?
На main - есть инциденты со stand-by?

Ну и проверьте, что процессор вставлен хорошо (были прецеденты).
 
mastercopy месяца три не делал.
Из-за этого могут некоторые телефоны на eZ платах отключаться?

Twin каждую неделю проверяю


Redundancy State:

   Duplicated configuration    : YES

   Wished sig. transfer mode   : C1 signalling channel

   Used sig. transfer mode     : C1 signalling channel

   Transmission CPU-CPU        : READY

   Telephony redundancy        : READY

   monitel redundancy          : READY

   memloader redundancy        : READY

   All applications redundancy : READY

Инцидентов по stand-by на main нет

Процессоры как вставлены проверю. Всегда до упора задвигал.

Винчестер на stand-by с блоками по 4К стоял, а родной должен быть с блоками на 512 байт (поставил после инцидента).

Наверно в этом причина отключения аналоговых телефонов (предполагаю, что постоянная перезапись при операциях с таким винчестером если блоки не выровнять).

 
И процессора поди стоят CPU7 (с межпроцессорным обменом по С1)? Не IO2, не Ethernet.
Три месяца без выравнивания - нормально, если не было инцидентов про межпроцессорный обмен.
Инцидентов по stand-by - на main не может не быть, как минимум - что он встал в stand-by  :)  
 
CPU6s2 процессоры стоят. Обмен между ними по С1
 
Опять всё выключилось, хотя параметр Shutdown powerfail delay (Current Value : 0 h 1 m 0 s )
стоит 1 минута.
Теперь по обоим запись есть:
15/09/17 14:53:52 000001S|---/--/-/---|=1:1521=Powerfail, shutdown
15/09/17 14:53:53 000001M|---/--/-/---|=1:1521=Powerfail, shutdown

На что может реагировать плата контроля напряжения?
Изменено: dima0328 - 15.09.2017 15:28:01
 
Плата контроля напряжения может реагировать на напряжение питания (когда оно опускается ниже 46В).
У вас проблемы с питанием (или, что редко - может провод от нее плохо в АСТ вставлен).
 
Станция питается на прямую от батарей UPS. Их в свою очередь заряжают выпрямители.
Аварии на выходе питания UPS не показывает.
А можно расшифровать, что такое АСТ? У меня корпус из двух полок по 28 слотов. Плата с зелёным большим светодиодом внизу. Где АСТ можно посмотреть?
Изменено: dima0328 - 15.09.2017 16:07:42
 
Установил параметр Shutdown powerfail delay (Current Value : 0 h 10 m 0 s )  на 10 минут.
Так как проблем с контактами не нашёл пока.
Корпус Alcatel-Lucent M3 Empty Cabinet(3BA00071AD)
ACT это active phase switching? Никак её не найду на корпусе.
Изменено: dima0328 - 15.09.2017 17:35:47
 
платы IO2N - у вас есть? проблемы могут быть с ними.
У Дарта Вейдера в столе всякого навалено: карты разные галактик и портрет Гагарина.
 
АСТ - это кристалл (полка, по-вашему). Alcatel Crystall Technology. Если смотреть на кристалл сзади, справа внизу есть блок фильтров, там вправо выходят три контакта: плюс, минус и PSAL (он и интересен). От него провод(обычно, коричневый) идет на колодку внизу кабинета, от нее - на плату со светодиодом, на которой кроме светодиода есть ещё компараторы, которые следят за напряжением.
 
отключите RMA
берите ноут или комп, подключите через сом-порт на А0 (В0) и пусть пишет все в консоль. при "шайтан" перезагрузке в самом старте можно отловить причину перезагрузки
лет 5 назад или более так ноутом сидели ждали "шайтан" перезагрузку. в самом начале была строка "PSAL - чего-то-то", в общем на проце питание подыхать стало

а так интересный вопрос - у вас заземление или зануление?
на той неделе был "скачок", на 2-х ОХЕ платы GPA2 отлетели, физически надо было передернуть
Пути IP-пакета неисповедимы
Страницы: 1 2 След.
Читают тему