Бесперебойная работа оборудования. Обеспечение бесперебойной работы автомойки

13.12.2016, ВТ, 11:30, Мск

Современный мир все больше полагается на автоматизированные системы в самых разных областях человеческой деятельности. Растет число приложений, к непрерывной работе которых выдвигаются повышенные требования. Специалисты НПП «Родник» представляют коробочное решение Stratus everRun Enterprise, которое поможет быстро и просто обеспечить бесперебойную работу программного решения или сервиса.

По мере того как ИТ-системы становятся все более привычными, возрастают ожидания к их надежности - все меньше пользователей готовы мириться с простоями или отказами сервисов, от которых ожидаешь непрерывной работы. Для простых информационных или справочных систем отключение на небольшое время не слишком важно. Но для систем, ориентированных на работу и обслуживание пользователей, или корпоративных сервисов для сотрудников это уже менее терпимо.

Далее по степени критичности идут «служебные» системы, например, системы видеонаблюдения и обеспечения безопасности, системы управления зданиями или контроля и наблюдения за производством. Если подобные подсистемы отключатся из-за отказа управляющего ПО, это может привести к дорогостоящим, опасным и даже угрожающим жизни последствиям. С нефункциональной системой нет никакого способа узнать о возникновении чрезвычайной ситуации или оповестить сотрудников об обязательной эвакуации. Возможны и экономические потери от простоя подобных информационных систем, а иногда и юридические обязательства. В этом случае на надежности и отказоустойчивости лучше не экономить.

И, наконец, основные «производственные» процессы. В зависимости от предметной области (банковские системы, управление технологическими процессами, торговые системы и управление продажами и т.п.), такие решения могут быть разными по сложности и стоимости и обычно являются узкоспециальными. Обеспечение их непрерывной работы - важнейшая задача, и может решаться разными способами, в зависимости от масштаба систем и их взаимосвязанности.

Доступный сервис

С целью классификации компьютерные системы обычно разделяют по времени непрерывной работы, в процентах от общей длительности работы. Зачастую доступность сервиса или системы характеризуется параметром в 99–99,9% времени, и число «99,9» выглядит очень надежно. Но на практике это означает до 90 часов простоя в течение года, или же до полутора часов в неделю. Для восстановления работы такой системы обычно используется ее перезапуск, или восстановление из резервной копии.

Недостатки такого способа очевидны - эта процедура требует времени, что не всегда допустимо. Современные сервисы чаще всего работают на виртуальных машинах (ВМ), которые в случае сбоя требуется перезапустить.

Системы высокой доступности работоспособны 99,95–99,99% времени. Здесь используются кластерные системы и технологии, в которых выполнено то или иное запараллеливание сервисов и систем. «Высокая доступность», тем не менее, может означать до нескольких часов простоя в течение года. В зависимости от решения, дублирующий сервис или система могут находиться в так называемом «холодном» резерве, в этом случае для ее запуска требуется какое-то время. Также следует отметить сложность кластерных технологий и повышенные требования к квалификации ИТ-персонала. Кластеры сложны и отнимают много времени на развертывание, требуют тестирования и непрерывного административного контроля. Программное обеспечение обычно приходится лицензировать для каждого из серверов кластера. В результате в случае роста кластерной системы общая стоимость владения быстро растет.

Основные области применения Stratus everRun:

Системы видеонаблюдения и контроля доступа

Cиловые структуры

Финансы и банковские услуги

Телекоммуникации

Медицина

Государственный сектор

Производство

Транспорт и логистика

Непрерывная доступность (англ. fault tolerance) – до 99,999% времени. Такой уровень надежности системы достигается специализированными программными и аппаратными решениями. В зависимости от предметной области (управление технологическими процессами, банковские системы), такие комплексы могут быть очень разными по сложности и стоимости.
Но, как отмечалось выше, есть и менее требовательные сферы применения, от которых ожидается непрерывная работа. Сюда можно отнести системы управления зданиями, системы внешнего контроля (видеонаблюдения), системы контроля доступа, и тому подобные. Вряд ли пользователи будут счастливы, если пропадет сигнал со всех видеокамер и датчиков, или система вентиляции цеха или здания остановит работу.

Готовое решение

Специализированные ИТ-системы, как правило, сложны, требуют настройки и высокой квалификации персонала. Но если они пользуются успехом, то установка и обслуживание со временем упрощаются. Появляются готовые к развертыванию комплексы, не требующие повышенного внимания.

Для систем непрерывной доступности одним из таких решений является программный пакет everRun Enterprise компании Stratus. Он специально спроектирован так, чтобы обеспечить сохранение данных даже при аппаратных или программных сбоях.

Преимущества решения

При использовании everRun Enterprise приложение «живет» в двух ВМ на двух физических серверах. Если одна ВМ выходит из строя, приложение продолжает работать на другом сервере без перерывов или потери данных. Это достигается за счет постоянного считывания состояния работающей виртуальной машины и сохранения ее параметров. В случае сбоя последнее состояние системы переносится на параллельно работающую ВМ, так что выполнение приложений не прерывается. Серверы системы могут быть географически разнесены для повышения надежности.

Программное обеспечение Stratus everRun предназначено для того, чтобы обеспечить непрерывную работу служебных приложений и целостность собираемых данных. При этом система, разумеется, обладает функционалом и для быстрого аварийного восстановления в случае крупного отказа. Решения Stratus everRun базируются на использовании стандартного оборудования, и защищают любые приложения для MS Windows Server и Linux от отказов и сбоев в работе аппаратной части серверов.

Как отмечает представитель компании-интегратора «Родник» Иван Кириллов , «внедрение everRun Enterprise позволяет избежать построения сложной сетевой инфраструктуры, развертывания и настройки дополнительного управляющего ПО, а также затрат на обучение персонала, которые требуются при эксплуатации традиционных кластерных систем».

Как everRun Enterprise обеспечивает непрерывную работу и сохранение данных приложений, развернутых на виртуальных машинах

Выход из строя оборудования может нанести серьезный ущерб работе организации. Поэтому в компании АРТИ разработан комплекс мер по предотвращению возможных поломок и сокращению до минимума времени ремонта офисной техники клиентов.

Регулярная профилактика оборудования

При заключении договора на обслуживание сертифицированные инженеры проводят на регулярной основе профилактические работы офисной техники. Согласно опыту, оптимальным является проведение профилактики раз в месяц, вне зависимости от того, были ли сбои в работе аппаратов или нет. Схема нашего обслуживания предполагает прикрепление постоянного инженера, который, как и персональный доктор, отлично знает условия работы Вашего оборудования и его состояние.

После каждого визита инженера результаты произведенных работ и рекомендации актируются и заносятся в нашу специализированную информационную систему. В дальнейшем собранные данные позволяют своевременно подготовить предложения по модернизации парка. Они также служат основной для предоставления нашим клиентам детальных отчетов о состоянии оборудования, проведенных работах за любой период времени и произведенных затратах на содержание офисной техники.

Прогнозирование поломок и планирование замены ресурсных запчастей

Информационная система Сервисного центра является для инженеров инструментом прогнозирования возможных поломок и планирования оптимального времени замены ресурсных запчастей до остановки оборудования.

Налаженные бизнес-процессы предоставления сервисных услуг в совокупности с информационной системой позволяет:

    Быстро оценить уровень загрузки и износа каждого конкретного аппарата.

    Максимально точно прогнозировать необходимость замены ресурсных деталей.

    Прогнозировать на будущие периоды уровень затрат на поддержание оборудования в работоспособном состоянии.

    Предоставлять аналитические отчеты для заказчика на регулярной основе.

Кредитная схема на замену расходных материалов и запасных частей

Сервисный центр АРТИ по договору на комплексное обслуживание предоставляет расходные материалы и запасные части в кредит. Оплата производится по факту замены в конце отчетного периода на основании подписанных клиентом актов. Это позволяет добиться минимизации простоя оборудования, сократить административные расходы и в целом улучшить все бизнес-процессы компании, связанные с подготовкой документов.

Преимущества использования данной схемы:

  • Предоставление одного детализированного счета (со всеми подтверждающими документами) вместо десятка счетов от разных поставщиков.
  • Снижение простоя оборудования, связанного с задержками в оплате счетов на расходные материалы и запасные части.
  • Оплата только того, что реально было использовано - в отличие от контрактов с авансовой оплатой.
  • Сокращение административных затрат (отделы ХОЗУ, IT и бухгалтерии) на взаимодействие с разными обслуживающими организациями и экономия времени Ваших сотрудников.
  • Своевременное проведение всех необходимых работ, а также поставка оригинальных расходных материалов и запасных частей.

Определяющей частью функционирования любой информационной системы является наличие современной материально-технической базы, в данном случае средств вычислительной техники и средств коммуникаций. Сейчас попробуем освятить этот вопрос применительно к состоянию дел в администрации Рыбинска.


  1. Аппаратное обеспечение.
В настоящее время в здании администрации используется около 100 рабочих станций (без учета компьютеров департамента финансов). 45 % этого парка уже перешли барьер технического и морального износа, еще 15% приблизились к этому пределу.

В первую очередь наблюдается несоответствие требований к вычислительной технике и решаемых на ней задач в следующих подразделениях администрации: общий отдел, департамент строительства и инвестиций, управление экономического развития. Помимо морального износа компьютеров (технические характеристики не обеспечивают требований установленных операционных систем и программного обеспечения), присутствует износ механический (это касается лазерных принтеров и электронно-лучевых мониторов).

Не все службы администрации укомплектованы компьютерами в достаточном количестве по числу сотрудников, осуществляющих документооборот, электронную корреспонденцию и выполняющих другие задачи, связанные с наличием вычислительной техники. Также не все подразделения обеспечены достаточным количеством принтеров и оптических устройств ввода информации (сканеров).

Принятие неотложных мер по исправлению сложившейся ситуации не терпит отлагательств. Чтобы безнадежно не отставать от требований, выдвигаемых техническим прогрессом в отрасли высоких технологий, необходимо ежегодно подвергать замене примерно пятую часть парка вычислительной техники.

Таким образом, по прошествии пяти лет будет завершаться цикл технического переоснащения, рекомендованный и диктуемый условиями развития рынка компьютерной индустрии. Примерная расчетная стоимость одного рабочего места составляет 27-29 тысяч рублей без учета программного обеспечения, таким образом годовые затраты на переоснащение парка вычислительной техники составят примерно 550-600 тысяч рублей.

Помимо приобретения новой техники для установки на рабочие места, необходимо создать резервный фонд средств вычислительной техники, заменяемых частей и расходных материалов, используемый в случае экстренных ситуаций, связанных с потерей работоспособности отдельных единиц действующего парка и обеспечения неотложных задач (например, при изменениях в структуре администрации или обеспечение избирательных комиссий).

2. Программное обеспечение.

Работа персональных компьютеров невозможна без соответствующего современного программного обеспечения. Операционные системы и офисные программные продукты, установленные на каждом рабочем месте, должны приобретаться как непременный компонент компьютера. Если специализированные программы, требующее поддержки производителем (например продукты 1С), приобретаются легально, то продукты Microsoft, установленные на каждом компьютере в настоящее время в администрации нелицензированы.

В силу недостаточного финансирования приоритеты сдвигались в пользу приобретения дополнительных аппаратных средств, экономя на программных. Ситуацию упрощает то, что особенно дорогостоящие продукты, необходимые для обеспечения работы серверов, заменены на свободно распространяемые и в чем-то более эффективные и производительные продукты семейства Unix. Использование их на рабочих станциях не приемлемо в силу достаточной сложности их освоения персоналом и проблем совместимости.

В последнее время в стране ужесточились требования по соблюдению авторских прав, созданы структуры при правоохранительных органах, осуществляющих контроль за соблюдением действующего законодательства в этой сфере. Поэтому необходимо срочное исправление текущей ситуации.

Стоимость необходимого минимума программного обеспечения составляет около трети стоимости компьютера. Существенной экономии средств можно достичь, участвуя в программе Microsoft по лицензированию продуктов для государственных и образовательных учреждений, приобретая только право использования продуктов, без носителей и документации.

Все вышесказанные решения относительно приобретения вычислительной техники и лицензионного программного обеспечения могут выступать как рекомендации для всех подразделений отдельных юридических лиц администрации.


  1. Локальная и корпоративная сеть.
Локально-вычислительная сеть (ЛВС) в здании администрации спроектирована и смонтирована в 2000 году, с учетом существующих на тот момент потребностей (витая пара, 100 мегабит). С тех пор произошло много изменений в организационной структуре администрации, добавилось более половины рабочих станций от прежнего количества (всего около 150). Ввиду того, что финансирование работ по монтажу сети было сокращено вдвое, она была построена, чтобы удовлетворить задачи текущего момента, без перспектив на дальнейшее развитие. И поэтому, уже давно мы столкнулись со следующими проблемами:

Высокая сегментированность сети. Недостаточное количество соединений в кабельной структуре и узкие межстенные отверстия делают невозможным подключение рабочих станций к существующему активному оборудованию. Используется просто добавление новых активных устройств, практически в каждый кабинет, что вызывает дополнительные ошибки в работе сети (коллизии). Соединительные провода кладутся поверх кабельных каналов, следствием чего является неэстетичный вид рабочих мест.

Возросший объем передачи данных по сети. Узким местом становятся участки между этажными и центральным коммутаторами.

Необходимо финансирование на поэтапную модернизацию ЛВС, которая включает в себя:

Замену активного оборудования на устройства со скоростью передачи 1 Гбит/с, с приоритизацией трафика и расширенными функциями управления;

Перекладка сегментов сети с учетом количества рабочих мест и одновременная прокладка дополнительных кабельных соединений с расчетом внедрения в перспективе IP телефонии и оборудования средств пожарной и охранной сигнализации (в первую очередь в левом крыле второго этажа, где размещаются департаменты строительства и инвестиций и управление экономического развития);

Модернизация и замена серверного оборудования, установка средств обеспечения бесперебойного питания и устройств сетевого хранения данных для резервного копирования.
4. Связь между подразделениями администрации.

Подразделения администрации размещаются в зданиях, территориально удаленных друг от друга. В настоящие время по арендованной медной паре (технология DSL, скорость передачи данных 0,5–2 Мбит/с) объединены ЛВС администрации и ЛВС следующих служб:

Департамент ЖКХ, транспорта и связи (Стоялая, 19);

Департамент недвижимости, департамент по управлению земельными ресурсами (связь с управлением градостроительства и архитектуры отсутствует),(Крестовая, 77);

Централизованные бухгалтерии управления образования (Крестовая, 19) и департамента здравоохранения и фармации (Преображенский пер., 2);

Департамент по социальной защите населения (нет связи с управлением по делам образования и департаментом здравоохранения и фармации, расположенными в этом здании),(Крестовая, 139);

Департамент культуры и спорта (Чкалова, 89)

Не осуществлено подключение (в том числе и из-за отсутствия технических возможностей):

Отдел ЗАГС (Гоголя, 10);

Отдел по делам несовершеннолетних и защите их прав (Расплетина,9);

Архивный отдел (Ухтомского, 8).

Большой проблемой является отсутствие высокоскоростного подключения к зданию по адресу Крестовая,77, где расположены службы, непосредственно заинтересованные в использовании единой информационной системы. Решением может быть объединение ЛВС департаментов в этом здании и организация радиоканала со зданием администрации (Рабочая, 1). Скорость передачи данных - 50 Мбит/с, стоимость оборудования и монтажных работ – 150-200 тыс. рублей.

Перспективным решением была бы прокладка волоконно-оптического кабеля по столбам электрического освещения от здания администрации (Рабочая, 1) до здания общественно-культурного центра (Чкалова,89). По предварительной оценке, стоимость разработки технического задания проекта по прокладке кабеля и его реализации составит 1.7-2.0 млн. рублей. Это позволило бы связать высокоскоростным каналом передачи данных (не менее 100 Мбит/с) все перечисленные выше подразделения администрации и создать внутреннюю телефонную корпоративную сеть с единой нумерацией, которая бы интегрировалась в цифровую телекоммуникационную сеть органов власти Ярославской области и решить в ближайшем будущем высокоскоростной обмен информации по линии административного управления всех уровней, в том числе создания Единой диспетчерской службы и систем оповещения ГУ МЧС.
5. Подготовка персонала

В заключение хотелось бы заострить внимание на следующем моменте. Для эффективного решения всех задач, связанных с информационными технологиями и просто использованием вычислительной техники, необходима соответствующая подготовка персонала. Непременным условием этого видится ввод в штатное расписание всех крупных структур администрации на уровне департаментов и управлений квалифицированных сотрудников, осуществляющих системное администрирование и обеспечивающих оперативный контроль за работоспособностью вычислительной техники и локально-вычислительных сетей, отвечающих за информационное взаимодействие. Сейчас этого нет в департаменте ЖКХ транспорта и связи и департаменте по культуре и спорту.

Помимо этого обязан добавить, что возросший объем работ по администрированию сети администрации с учетом требований к безопасности и защите информации требует большого количества времени и необходимо срочно вводить в структуру центра информатизации штатную единицу для решения этих вопросов.

Для любой компании крайне важна бесперебойная работа ее IT-инфраструктуры, особенно серверов и установленного на них программного обеспечения. Прекращение доступа к Интернет, электронной почте, базам данных и другим приложениям неминуемо приведет к серьезным сбоям в бизнес-процессах компании.

Для обеспечения стабильной работы приложений серверное оборудование должно отвечать высоким требованиям по надежности. Одним из основных методов повышения надежности сервера является резервирование его подсистем путем дублирования компонентов: процессора, оперативной памяти, сетевых подключений, дисковых и твердотельных накопителей, устройств охлаждения, блоков питания. Отказ дублированного компонента не приводит к отказу сервера в целом, но может снизить его производительность. Устранение неисправности обычно выполняется без остановки работы сервера путем "горячей" замены отказавшего компонента.

Однако полное резервирование в рамках традиционной серверной архитектуры невозможно. Такие компоненты сервера как системная плата и контроллер дисков обычно не дублируются. Поэтому их выход из строя будет означать отказ сервера в целом и, как следствие, аварийную остановку всех приложений. Какова вероятность такой ситуации?

Надежность сервера определяется параметром MTBF — средним временем наработки на отказ. MTBF сервера можно вычислить теоретически — на основании известных значений MTBF серверных компонентов. С помощью данного метода мы рассчитали MTBF типового сервера и получили значение, равное 10 годам (детали расчета). Для такого сервера вероятность выхода из строя в течение одного года будет равна 10%.

Согласно статистике нашего сервисного центра серверы Team имеют среднее время наработки на отказ 25 лет, коэффициент готовности 99,99% и вероятность выхода из строя в течение одного года около 4%. При этом в отличие от "теоретического" расчета наша статистика учитывает любые отказы, в том числе и отказы дублированных компонентов, которые не приводят к отказу сервера в целом.

Очевидно, что столь высокие показатели надежности вполне достаточны для обеспечения устойчивой работы серверных приложений и соответствуют потребностям большинства компаний малого и среднего бизнеса.

Однако для некоторых компаний внеплановая остановка бизнес-приложений (пусть даже очень маловероятная) неприемлема. Например, одним из клиентов нашей компании является предприятие непрерывного цикла с численностью работников 150 человек. Производственный процесс на предприятии управляется при помощи специализированного серверного приложения. Остановка этой программы означает остановку производства. Восстановление работоспособности приложения после аппаратного или программного сбоя может занять несколько часов и на протяжении этого времени производство будет простаивать. Поэтому требуется обеспечить гарантированную непрерывность работы этого приложения как необходимое условие непрерывности всего бизнес-процесса.

Переход на виртуальную платформу VMware позволяет решить эту задачу.

Предлагаемое решение основано на использовании кластера двух (или более) серверов с общей системой хранения. В таком кластере все компоненты (в том числе компоненты системы хранения) продублированы. Восстановление работы приложений в случае отказа одного из серверов обеспечивается средствами виртуализации.

В штатном режиме на каждом сервере работает свой набор приложений, каждое приложение — в отдельной виртуальной машине. Все приложения изолированы друг от друга и не влияют на работу других приложений. Виртуальные машины и данные, с которыми они работают, хранятся на общем дисковом массиве, доступ к которому имеют оба сервера. Распределение виртуальных машин по серверам изначально задается администратором. Им же для каждой виртуальной машины выделяется часть аппаратных ресурсов сервера, при этом коэффициент загрузки каждого сервера может достигать 70-80%.

Непрерывность работы приложений обеспечивается средствами виртуальной платформы, которые осуществляют постоянный мониторинг виртуальных машин. В случае остановки виртуальной машины из-за отказа сервера она автоматически перезапустится на другом сервере. После устранения причины отказа и включения сервера виртуальные машины автоматически вернутся на "свой" сервер без прерывания работы.

Данное решение позволяет выполнять плановые работы по техническому обслуживанию серверов без остановки приложений. Перед выключением сервера его приложения "переезжают" на другой сервер, а после завершения работ возвращаются обратно.

Важным достоинством данного решения является его универсальность, поскольку оно подходит для любых приложений и не накладывает практически никаких ограничений на тип гостевых операционных систем виртуальных машин. Этим оно выгодно отличается от службы кластеров Microsoft Windows Server. Другими преимуществами решения являются более эффективное использование аппаратных ресурсов серверов, а также простота внедрения и администрирования.

Состав решения

Решение по обеспечению непрерывной работы серверных приложений на виртуальной платформе VMware включает следующие компоненты:

  1. Два (или более) сервера Team . Все серверы Team совместимы с платформой VMware.
  2. Дисковый RAID-массив с полным резервированием подсистем.
  3. VMware Essentials Plus Kit в качестве платформы виртуализации.
  4. Лицензии на операционные системы в соответствии с количеством виртуальных машин.
  5. Необходимые пользователю серверные приложения.

В рамках внедрения данного решения наша компания готова выполнить следующие работы:

  1. Подбор конфигурации серверов с требуемым уровнем производительности.
  2. Подбор системы хранения.
  3. Поставку серверов, системы хранения и другого необходимого оборудования.
  4. Поставку программного обеспечения.
  5. Монтаж и подключение оборудования.
  6. Установку и настройку платформы виртуализации.
  7. Установку и настройку виртуальных машин, операционных систем и приложений.
  8. Тестирование системы и ввод в эксплуатацию.
  9. Сопровождение в рамках гарантийного обслуживания и, по желанию, по договору аутсорсинга.

В составе решения мы бесплатно предоставим восемь часов работы сертифицированного специалиста VMware и Microsoft для консультаций, обучения и работ по внедрению решения.