Имеется сервер Supermicro. Работал пол года нормально и тут в недавнее время стал сам перегружается без ведомых причин. При просмотре журнала проблем обнаружено не было. В чем может быть проблема и как ее выявить?
Windows 2008 R2 Standart SP1
RAID контроллер Adaptec
Роли: Файловый сервер. служба печати
Антивирус не установлен (скрыт за фаерволом)
У сервера 2 блока питания
В стойке стоит такой же конфигурации сервер куплен в одно время работает нормально.
Ответы
Все ответы
Со вторый серваком на базе интел были аналогичные проблемы. win 2003 std eng- решилось накатыванием апдейтов. (я это делаю раз в год)
Еще был сервак, тож на интеле. win 2003 std rus. Падал когда хотел. Решилось переустановкой винды
Это точно, что в журнале событий нет никаких сообщений о перезагрузках? Регистрируется ли после перезагрузки событие 6008, что «the previous system shutdown was unexpected»?
Из ПО Стоит MSSQL серв 2005, больше ничего особенного.
Вот ошибка из журнала событий:
Тип события: Ошибка Источник события: EventLog Категория события: Отсутствует Код события: 6008 Дата: 19.10.2010 Время: 6:51:24 Пользователь: Н/Д Компьютер: srv2010 Описание: Предыдущее завершение работы системы в 6:49:39 на 19.10.2010 было неожиданным.
Включил протоколирование загрузки в boot.ini.Ситуация следующая:
1 Вариант. Ошибка/Перезагрузка:
2 Вариант. Успешная загрузка:
ИТак, видим злополучный барьер, это между строками:
Did not load driver \SystemRoot\system32\DRIVERS\mrxsmb.sys(в обоих ситуацих не загружается и имхо причиной не является)
и Loaded driver \SystemRoot\system32\DRIVERS\CdaC15BA.sys(никаких autocad’ов не стоит, гуглил, вроде именно к этому относится процесс)
Что пытался предпринять?
Что делать не знаю, прошу корифеев своего дела помочь чайнику!
Если что не так написал, простите, я у вас новичок, исправлюсь!
Все ответы
Все-таки посмотри что происходит при зависании.
Выдает синий экран с «PFN_LIST_CORRUPT»
Выдает синий экран с «PFN_LIST_CORRUPT»
Отключите все устройства, без которых компьютер способен загрузиться, попробуйте стартануть ещё раз.
Бэкап системы есть?
Инсталляционный компакт-диск с последним сервис-паком? Можно попытаться сделать Repair.
MCPIT: Enterprise Administrator; MCT; Microsoft Security Trusted Advisor
и вообще, если в безопасном режиме нормально грузится, то проблема в драйверах, попробуйте откатить то, что недавно ставили-обновляли
А тепературу процессора, вращение вентиляторов и нормальное электропитание от блока питания от уже проверили? Еще надо снять крышку и внимательно осмотреть все электролитические конденсаторы на материнке. Если хоть один из них имеет хоть чуть-чуть вспученную крышечку (выгнутую наружу, неплоскую), то это считается большой неисправностью в системе электропитания. А, как известно всем электронщикам, любая неисправность в цепи электропитания приводит к хаотичной работе цифровых устройств(если не полный выход из строя). Неисправные конденсаторы надо очень аккуратно заменить (высока вероятность окончательного повреждения платы, надо иметь хорошие навыки ремонта) или заменить материнку. Если не удастся купить в точности такую-же, то с такимм-же чипсетом, это упростит восстановление системы.
Если вспученных конденсаторов нет, попробуйте (хоть временно) подключить другой блок питания, некоторые неисправности БП приводят к нестабильной работе цифровых устройств.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Конфигурация сервера (железо): проц: Celeron D 2,8 Ghz память: 1 Gb (2 планки) винт: WDC WD 1600JS-00MHB 2 шт. Стояли в RAID1. После сбоя. видео: интегрированное сеть: 2 сетевых интерфейса (LAN + WAN) ИБП: Back-UPS ES 525
Конфигурация сервера (ПО): Win2003 EE SP2 Сервер выполняет несколько функций: Контролер домена Файловый сервер Прокси сервер (ISA 2004 SP2) Почтовый сервер MDaemon FTP-сервер.
Сервер установлен и сконфигурирован в середине 2006 года. Работает в течении этого периода круглосуточно.
Около полугода назад был установлен еще 1 HDD на 400 Gb. Проработав около недели начали появляться ошибки, после которых машина не грузилась: Источник события: m5287 Категория события: Отсутствует Код события: 11 Дата: 12.09.2008 Время: 20:18:44 Пользователь: Н/Д Компьютер: STORAGE Описание: Драйвер обнаружил ошибку контроллера \Device\Scsi\m52871.
Удалив этот HDD все стало нормально. Перед этим пришлось рассинхронизировать RAID1. Потом я опять построил RAID1 и все было в порядке.
Перед новым годом сервер стал без видимых на то причин перегружаться.
Т.е. все работает нормально, потом пик в системнике и пошла перезагрузка. Может проработать какое-то время и опять в перезагрузку.
Замечено, что когда нет нагрузок в нерабочее время (суббота) перезагрузок нет.
Я точно знаю, что-то не так с RAID-контролером на матери. Но с этими глюками сервер проработал несколько месяцев. В журналах бы фиксировались какие-то ошибки, если бы контролер HDD «разлюбил» этот винт. Нет ничего. Как-будто RESET’ом перегружен. Но у меня есть подозрение на HDD. Возможно с ним, что-то не так. Или с БП. Сегодня собираюсь заменить БП.
Произвести замену HDD не выйдет, потому что такой точно модели я не найду.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору А зачем искать точно такую же модель HDD? Достаточно на новом винте создать аналогичный по размеру системный раздел, а потом акронисом перебросить. Перегрева проца нет?
Всего записей: 32 | Зарегистр. 16-09-2008 | Отправлено:15:57 19-01-2009
vu1tur
Moderator-Saaber
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору AgelNick Это действительно перезагрузка или BSOD с автоматическим ребутом? Если бсод — смотреть минидамп. Иначе пробовать менять: 1. БП. 2. Память. 3. Визуально осмотреть конденсаторы в цепи питания на материнке (какая, кстати?)
———- I am free of all prejudice. I hate everyone equally.
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору AgelNick Проанализируй для начала минидамп винды в помощь прога Debugging Tools for Windows 32-bit Version http://www.microsoft.com/whdc/devtools/debugging/installx86.mspx
———- В сортире лучше быть юзером, чем админом.
Всего записей: 10813 | Зарегистр. 10-12-2003 | Отправлено:18:12 19-01-2009
FIZIK
Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Такая же фигня сейчас у меня, причем на Intel мамке. 2 винта WD тоже по 160G только винты Raid Edition. Отнес в сервис. Спец с сервиса звонил, говорит на полусофтовых рейдах стандартная проблема и лечится только установкой аппаратного рейда. Даж не знаю что делать. Причем винты поодиночке работают вообще великолепно. SMART тоже говорит что все норм. А рейд рассыпается через час, максимум через сутки.
Всего записей: 193 | Зарегистр. 09-08-2004 | Отправлено:19:28 19-01-2009
на новом винте создать аналогичный по размеру системный раздел
система может не принять этот HDD.
Цитата:
Если бсод — смотреть минидамп
1. где смотреть? спасибо, ipmanyak за подсказку. качаю Debugging Tools.
Цитата:
цепи питания на материнке (какая, кстати?)
мать: ASUS P5RD1-V
1. у меня как раз стоит symantec. Завтра прогоню. 2. я смогу сделать это только на выходные. Сервер используется в течении рабочего дня все время. 3. возможен и такой вариант. заменю SATA-шлейфы.
Цитата:
Такая же фигня сейчас у меня, причем на Intel мамке. 2 винта WD тоже по 160G только винты Raid Edition. Отнес в сервис. Спец с сервиса звонил, говорит на полусофтовых рейдах стандартная проблема и лечится только установкой аппаратного рейда. Даж не знаю что делать. Причем винты поодиночке работают вообще великолепно. SMART тоже говорит что все норм. А рейд рассыпается через час, максимум через сутки.
Дело в том, что у меня raid (зеркало) работал стабильно все время. Но с встроенным raid действительно какой-то глюк. Система отказывается работать с дополнительным HDD в обычном режиме.
1) лов-эндовая логика не лучший выбор для построения сервера.
«лов-эндовая логика» это как?
Я беспокоюсь не за потерю данных, а за стабильную работу сервера, которая сейчас у меня нарушена.
итак: как я и говорил, у меня стоит 2 одинаковых винта (WDC WD 1600JS-00MHB) по 160 Гб.
1-й винт сейчас установлен в сервере. 2-й я снял и проверил на ошибки с помощью HD Tune PRO 3.50. Триальная версия на 15 дней. Ошибок нет. Температура винта 42 градуса.
Код:
HD Tune Pro: WDC WD1600JS-00MHB1 Health ID Current Worst ThresholdData Status (01) Raw Read Error Rate 200 200 51 0 Ok (03) Spin Up Time 212 208 21 2358 Ok (04) Start/Stop Count 100 100 0 84 Ok (05) Reallocated Sector Count 200 200 140 0 Ok (07) Seek Error Rate 200 200 51 0 Ok (09) Power On Hours Count 65 65 0 25580 Ok (0A) Spin Retry Count 100 253 51 0 Ok (0B) Calibration Retry Count 100 253 51 0 Ok (0C) Power Cycle Count 100 100 0 84 Ok (BE) Airflow Temperature 60 41 45 40 Ok (C2) Temperature 107 88 0 40 Ok (C4) Reallocated Event Count 200 200 0 0 Ok (C5) Current Pending Sector 200 200 0 0 Ok (C6) Offline Uncorrectable 200 200 0 0 Ok (C7) Ultra DMA CRC Error Count 200 200 0 0 Ok (C8) Write Error Rate 200 200 51 0 Ok
Power On Time : 25580 Health Status : Ok
Вирусов нет. Точнее есть 2 трояна, которые лежали в кряках прог.
На сервере я заменил БП. Поставил более мощный.
Поменял SATA-кабели. Я доверяю больше ASUS (родным), но поставил другие. временно.
Сегодня поставил на проверку сервер на вирусы. Завтра выясню, что есть.
Почему неожиданно перезагружается сервер Windows Server 2012R2?
Установил Windows Server 2012 R2 На сервер по терминалу работают пользователи. В течении дня сервак неожиданно уходит в ребут с ошибкой ниже. Как вылечить?
Средний 1 комментарий
Криптопровайдер на сервере есть? «Внезапная перезагрузка сервера 2012R2 Standart!»
Ключевая строка для поиска «Путь сбойного модуля: C:\Windows\system32\schannel.dll»
«Победил откатил ВСЕ обновления, и накатил заново! ПОБЕДА»
От разработчиков: Вначале ставим КриптоПро (4.x) потом ViPnet (4.x) Если не так перенакатываем ViPNet CSP Regsvr32 /u itcssp Для windows 8.1 проверяем ключ реестра HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Lsa\OSConfig\Security Packages Ни sspp ни cpssl быть не должно, должен быть schannel
Сергей Программист 1С, «много сотрудников на удаленках по сотовому инету. «
Если количество IP адресов конечно (не весь мир) то вполне реально на маршрутизаторе ограничить диапазон подсетей, с которого есть доступ на RDP. (белый список) Если введение белого списка невозможно, то можно вести чёрный список. Хорошие результаты даёт внесение в чёрный список подсетей провайдеров Китая. После этого количество попыток взлома заметно уменьшается.
Если на сервере включить расширенное протоколирование событий RDP, то должны быть IP адреса с которых пытались установить соединение. Вот их и блокировать, сразу подсетями.
Сергей Программист 1С, Задача обезопасить RDP достаточно типовая, решений много. Главное выбрать подходящее по бюджету и возможности внедрения. Вот, к примеру. «Как узнать что/что пытается авторизироваться? Всем спасибо. Брутили RDP, в штатном фаерволе в правилах касаемых рдп и фтп в вкладке «область» указал свой IP. После этого все прекратилось.
Поставил еще эту единственную в своем роде бесплатную программку:
Windows Server. Проблема циклической перезагрузки при обновлении.
Данная проблема заключается в том, что после установки некоторых обновлений, Windows просит перезагрузки, во время которой пытается продолжить установку. Но из-за ошибок при установке не может завершить обновление, откатывает его и инициирует перезагрузку, во время которой все повторяется по новой. Данной проблеме подвержены Windows Server 2008 и Windows Vista (особенно версии ранее SP2) и потенциально Windows Server 2008 R2 и Windows 7.
Столкнувшись с данной проблемой многие администраторы не видят другого выхода, кроме как переустановка системы. Но не стоит спешить. За установку обновлений при загрузке отвечает файл C:\Windows\winsxs\pending.xml, достаточно удалить или переименовать данный файл и система нормально загрузится. Это можно сделать с любого загрузочного диска, дающего доступ к файловой системе, или сняв жесткий диск и подключив его к другому ПК.
Вставляем диск в дисковод и загружаемся, но вместо привычной кнопки «Установка» нажимаем на ссылку «Восстановление системы».
Запускаем командную строку и вводим единственную команду:Выходим, перезагружаемся. После удачной загрузки рекомендуем детально разобраться, какое именно обновление привело к данному сбою.