Vmware caf management agent service за что отвечает
hostd is an app that runs in the Service Console that is responsible for managing most of the operations on the ESX machine. It knows about all the VMs that are registered on that host, the luns/vmfs volumes visible by the host, what the VMs are doing, etc. Most all commands or operations come down from VC through it. i.e, powering on a VM, VM vMotion, VM creation, etc.
vpxa also runs on the Service Console and talks to VC. I believe it acts as an intermediary between VC and hostd. I think it also does some housekeeping on the ESX host, but not as much as hostd.
Subscribe to 4sysops newsletter!
Another issue you might encounter with ESXi agents is that sometimes the performance data collection between the ESXi server and your vCenter is not working properly. Or some performance data might be available, but no recent data is available. This usually means something broke and isn't working. If performance data isn't available, usually you can fix this problem by restarting the VMware management agents too.
Описание ошибки "vsphere ha agent is not reachable"
И так у меня есть кластер построенный на базе гипервизоров Vmware ESXI 6.5. В какой-то момент система мониторинга прислала оповещение, что один из хостов стал недоступен и часть виртуальных машин стала неактивна. Когда я залез на vCenter, то обнаружил, что один из хостов имеет состояние "not responding". Выбрав его там красовалось 2 алерта:
Cannot synchronize host. vSphere HA agent s for this host has an error. vSphere ha agent is not reachable.
Виртуальные машины благополучно переехали на другой хост с падением операционных систем. Сам ESXI хост по сети отвечал, команда ping отображала, что он доступен.
Direct console user interface (DCUI)
You can use the DCUI if you are in the server room and have a screen attached to your server, or you can do it remotely via Dell Remote Access Controller (DRAC), Intelligent Platform Management Interface (IPMI), or another remote system.
Note: You can also access the DCUI via SSH session by simply typing "dcui" after logging in as root user. In the lab we use the PuTTY SSH client for this job.
The steps:
- Connect to the console of the ESXi host.
- Press F2 to customize the host and log in as root.
- Go to Troubleshooting Options and choose Restart Management Agents.
Restart ESXi management agents via DCUI
Which agents need a restart and what's their role? ^
The management agents synchronize VMware components and let you access the ESXi host through the vSphere Client or vCenter Server.
They are included and installed by default when installing ESXi. You might need to restart the management agents if remote access is interrupted depending on whether your ESXi host is managed by vCenter or is a standalone ESXi host (without vCenter management).
The hostd daemon or service runs on every ESXi host and performs major tasks like VM power on and power off. But when an ESXi host joins a vCenter Server, it activates a vpxa agent and talks to a vpxd service that runs in vCenter Server.
SSH client
The second option is to use an SSH client, connect remotely to your host, and use a command-line code.
You'll get this output:
Restart ESXi management agents via CLI
Note: Don't forget that before you SSH into ESXi, you need to enable the ESXi shell or SSH.
To do so, you have to connect to your ESXi host via a web browser. Then select the host and go to Actions. From there you can start the ESXi shell and SSH service.
Enable SSH on an ESXi host
If you want to check which services are running, use this command:
You'll get a view of all services. There are quite of few of them, and you don't really need to know them all—just a couple.
Some of these services are off by default as they only start when you activate certain cluster features, such as VMware virtual storage area network (vSAN).
Check which services are running
Как перезапустить службу через консоль
-
, так как по умолчанию он отключен.
- Через локальную консоль или клиента ssh вводим команду /sbin/services.sh restart. Она перезапустит все службы.
Если у вас LACP на сети управления, то выполнять services.sh restart не нужно. Необходимо перезапускать отдельно модулями /etc/init.d/ (vpxa, host.d и fdm) restart
Если вам нужно перезапустить агента управления (Management agents) или vCenter Agent, то делается это отдельными модулями.
Чтобы посмотреть список всех модулей, введите:
Чтобы перезапустить сеть управления на конкретном сетевом интерфейсе, воспользуйтесь командой:
Список сетевых интерфейсов можно получить командой:
Ранее я вам приводил список команду в ESXI консоли, и вы помните там команду, которая выводит список всех служб и их статус.
Чтобы получить список работающих процессов, введите esxtop.
Will restarting management agents affect my VMs? ^
No, but it might affect any tasks that may be running on the ESXi host at the time of the restart. But there are no worries for VMs. I'd simply make sure that no backup jobs are running and as such, no snapshots are currently taken.
Also, the management service IP connectivity will drop during a restart of the management agents on the ESXi hosts.
Steps to restart VMware ESXi agents ^
There are two ways of restarting the agents. You can use the direct console user interface (DCUI) or you can do it via a remote Secure Shell (SSH) session.
понедельник, 18 сентября 2017 г.
Vmware hostd and vpxa on ESXi 5.X
The vmware-hostd management service is the main communication channel between ESX/ESXi hosts and VMkernel. If vmware-hostd fails, ESX/ESXi hosts disconnects from vCenter Server/VirtualCenter and cannot be managed, even if you try to connect to the ESX/ESXi host directly. It knows about all the VMs that are registered on that host, the luns/vmfs volumes visible by the host, what the VMs are doing, etc. Most all commands or operations come down from VC through it. i.e, powering on a VM, VM vMotion, VM creation, etc.
It acts as an intermediary between VC and hostd. The vCenter Server Agent, also referred to as vpxa or the vmware-vpxa service, is what allows a vCenter Server to connect to a ESX host. Specifically, vpxa is the communication conduit to the hostd, which in turn communicates to the ESX kernel.
Restart the vpxa service
Note:- If you have SSH enabled on your ESXi server these services can also be restarted and even if these are restarted by you then also your SSH session will not be impacted.
VPXD-It is Vcenter Server Service. If this service is stopped then we will not able to connect to Vcenter Server via Vsphere client.
VPXA-It is the agent of Vcenter server. also known as mini vcenter server which is installed on the each esx server which is managed by Vcenter server. What are the management action we are performing on top of the vcenter server. (Like:- Increasing/Decreasing RAM & HDD, Making any type of changes in cluster, doing vmotion. This agent collects all information from the vcenter server and pass this information to the kernal of the esx server.
HOSTD- This is the agent of ESX server, here VPXA pass the information to the HOSTD and hostd pass the information to ESX server.
In ESX, you have only hostd and (if you have vCenter) vpxa.
These are daemon (services) for remote management:
- hostd is used to remote management using VIC
- vpxa is used by vCenter (the vpxd part of vCenter) to remote manament
hostd is the daemon for direct VIC connection (when you use Virtual Infra Client (VIC) to connect to your ESX).
Устранение ошибки
В результате поиска причин, были некоторые проблемы с сетью и их победили сетевые инженеры. Оставался вопрос, что делать с хостом. Начав процесс изучения, поддержка Vmware подсказала, что необходимо произвести перезапуск агентов управления (Management Agents). Загвоздка была в том, что ssh доступ к ESXI у меня выключен по соображениям безопасности, но выход был, это порт управления, в серверах Dell он называется IDRAC.
Подключившись в нему, я увидел привычный интерфейс ESXI, вам необходимо авторизоваться и пройти в раздел "Troubleshooting Options".
Далее вы делаете "Restart Management Agents", чтобы перезапустить агента управления.
Выставите опцию "Collect extra Troubleshooting infrmation", для записи дополнительного лога ESXI, чтобы потом произвести более детальный анализ, что произошло. Обратите внимание, что будет предупреждение:
Restart the management agents will disconnect all remote management software. This will affect all running services. Collection of extra troubleshooting information can take a noticeable amount of time.
В результате вы увидите, что будут перезапущены службы по управлению агентами.
Открываем ваш vCenter и проверяем, пропала ли ошибка "Cannot synchronize host".
Еще одним из методов устранения проблемы с хостом ESXI в статусе "not responding", при условии доступности его по сети, является попытка произвести "Disconnect" хоста и заново его подключить, мы такое уже проделывали при ошибке "Vsphere ha agent for this host has an error vsphere ha agent cannot be correctly installed". Напоминаю делается это через правый клик по нужному хосту и пункт "Connection - Disconnect". После чего, то же самое, вы только выбираете "Connection - Connect"
One error message VMware ESXi gives is a message saying, "Virtual machine creation may fail because the agent is unable to retrieve VM creation options from the host." During troubleshooting scenarios, this message basically says the ESXi management agent isn't communicating with the host.
Vladan Seget is an independent consultant, professional blogger, vExpert 2009-2021, VCAP-DCA/DCD and MCSA. He has been working for over 20 years as a system engineer.
- How to use VMware vSAN ReadyNode Configurator - Fri, Dec 17 2021
- VMware Tanzu Kubernetes Toolkit version 1.3 new features - Fri, Dec 10 2021
- Disaster recovery strategies for vCenter Server appliance VM - Fri, Nov 26 2021
You also might experience a connection problem to the host; you cannot connect directly to the ESXi host or manage it under vCenter Server. As such, restarting the agents will most likely solve the problem. You could possibly do a full reboot, but this requires shutting down all virtual machines (VMs) or moving them to another host.
Fortunately, it is also possible to restart certain services on a host without affecting the VMs running on it. Here are several questions users might ask when this situation occurs.
Как перезапустить службу управления через графический интерфейс
Первый метод, это использование DSUI, для этого подключитесь, непосредственно к серверу, залогиньтесь на него и найдите пункт "Restart Management Network".
Перезапуск сервисов в Vmware ESXI 5.5 и ниже. Подключитесь через клиента, перейдите в пункт "Configuration", далее "Properties"
Выбираем нужный сервис и переходим в пункт "Options"
И с помощью кнопки делаем Restart.
В Vmware ESXi 6 и выше, уже используется HTML клиент, для управления хостом. Подключитесь к нему, перейдите в пункт "Manage-Services", выберите сервис, и в самом верху есть кнопка действия "Actions", она позволит выполнить рестарт.
Vmware hostd and vpxa on ESXi 5.X
The vmware-hostd management service is the main communication channel between ESX/ESXi hosts and VMkernel. If vmware-hostd fails, ESX/ESXi hosts disconnects from vCenter Server/VirtualCenter and cannot be managed, even if you try to connect to the ESX/ESXi host directly. It knows about all the VMs that are registered on that host, the luns/vmfs volumes visible by the host, what the VMs are doing, etc. Most all commands or operations come down from VC through it. i.e, powering on a VM, VM vMotion, VM creation, etc.
It acts as an intermediary between VC and hostd. The vCenter Server Agent, also referred to as vpxa or the vmware-vpxa service, is what allows a vCenter Server to connect to a ESX host. Specifically, vpxa is the communication conduit to the hostd, which in turn communicates to the ESX kernel.
Restart the vpxa service
Note:- If you have SSH enabled on your ESXi server these services can also be restarted and even if these are restarted by you then also your SSH session will not be impacted.
VPXD-It is Vcenter Server Service. If this service is stopped then we will not able to connect to Vcenter Server via Vsphere client.
VPXA-It is the agent of Vcenter server. also known as mini vcenter server which is installed on the each esx server which is managed by Vcenter server. What are the management action we are performing on top of the vcenter server. (Like:- Increasing/Decreasing RAM & HDD, Making any type of changes in cluster, doing vmotion. This agent collects all information from the vcenter server and pass this information to the kernal of the esx server.
HOSTD- This is the agent of ESX server, here VPXA pass the information to the HOSTD and hostd pass the information to ESX server.
In ESX, you have only hostd and (if you have vCenter) vpxa.
These are daemon (services) for remote management:
- hostd is used to remote management using VIC
- vpxa is used by vCenter (the vpxd part of vCenter) to remote manament
hostd is the daemon for direct VIC connection (when you use Virtual Infra Client (VIC) to connect to your ESX).
Алгоритм перезапуска служб в VMware ESXi
Есть два метода перезапуска сервисов в гипервизоре ESXI:
- Графический метод
- Через консоль управления
Final words ^
VMware vSphere management sometimes requires you to administer the solution via command-line interface (CLI). Some admins do not really like this, but after memorizing the first few commands, the curiosity usually picks up, and you try to explore more and more. You can troubleshoot, monitor, or manage ESXi or vSphere from the command line.
Перезапуск Management agents в ESXi и терпение
Бывает такое, что ESXi отключается от vCenter, но виртуальные машины, запущенные на нем, продолжают работать, это означает, что проблема в сервисах гипервизора, отвечающих за коммуникацию с vCenter'ом (Troubleshooting an ESXi/ESX host in non responding state).
При этом по умолчанию SSH на ESXi хостах выключен. И соответственно остается только DCUI - радуемся, что у нас есть iDRAC, iLO, etc. или бежим к серверу.
Ну и здесь все не без проблем. Нажав F2 в DCUI и введя пароль нас ожидает новая проблема, ничего дальше не происходит, окошко логина висит, а в меню мы попасть не можем. Тут нам поможет только терпение, в таком состоянии логин может идти несколько минут, а бывает, что и 15-20 минут. Ждем.
Дождавшись входа на нужно найти пункт меню Troubleshooting Options и выбрать Restart Management Agents:
К сожалению, это не всегда помогает, иногда нужно подключится по SSH, почитать логи и выполнить какие-нибудь команды. Проще простого.
Для это нам нужно включить SSH через DCUI, выбираем пункт меню Troubleshooting Options и Enable SSH. Вот здесь нас снова ожидает большой сюрприз, DCUI перестает реагировать на клавиатуру. Это может продолжаться полчаса, а может и несколько часов. Терпение, ждем и SSH включен. Дело за малым, подключиться по SSH и выполнить команды:
Читайте также: