Как перезапустить гостевую машину, которая перестала отвечать?

Как перезапустить гостевую машину, которая перестала отвечать?

Появился компьютер, который после перезагрузки не включался. Это виртуальная машина в среде Linux KVM. Так как работа машины важна и перерыв в работе более 15 минут был критичен была сделана следующая конфигурация:
1. Включен мониторинг доступности и активности агента Kaseya
2. Написана процедура, которая перезапускает в среде KVM требуемый компьютер
Начнем с описания процедуры перезапуска машины и после этого настроим мониторинг работоспособности

Процедура перезапуска машины

В процедуре проверим в каком состоянии с точки зрения виртуализации находится машина - включена она или нет. Если включена, то остановим её и спустя несколько секунд запустим машину. Сама процедура выглядит так:

Теперь достаточно настроить слежение за работоспособностью

Мониторинг работоспособности агента

Воспользуемся отслеживанием активности агента Kaseya. В параметрах мониторинга стстуса агента дадим следующие параметры:
  • Считать аварией неактивность в течении 10 минут
  • Повторить аварию, если состояние сохранится через час
  • В случае аварии сделать запись об аварии, отправить e-mail на адрес o.malykh@it-plus.plus и выполнить процедуру восстановления работоспособности на хостовой машине ohls 

Результат работы мониторинга

Мы получили достаточно стабильно работающий сервис. Каждая неработоспособность нам известна и по статистика остановок планируем найти причину остановок. Но пока ма не нашли причину, пользователи с минимальными задержками используют службы с этого сервиса.