Wbincludes:WB6...7: Errata, Mosquitto 1.4 Persistence File

Материал из Wiren Board
Версия от 09:59, 7 июля 2023; A.Degtyarev (обсуждение | вклад) (Новая страница: «'''Описание''' Перестаёт работать веб-интерфейс, перестают приходить MQTT-сообщения. Также может рваться связь по VPN, медленно работать консоль, контроллер может самопроизвольно перезагружаться. '''Причины и подробное описание''' Проблема вызвана не обору...»)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Описание

Перестаёт работать веб-интерфейс, перестают приходить MQTT-сообщения. Также может рваться связь по VPN, медленно работать консоль, контроллер может самопроизвольно перезагружаться.

Причины и подробное описание

Проблема вызвана не оборудованием или программным обеспечением, разработанным компанией Wiren Board, а является следствием бага в MQTT-брокере mosquitto, используемом MQTT в контроллере: Unexpected growth in the .db file.

Эта проблема связана с так называемым persistence file. Брокер mosquitto, если не может отправить сообщение кому-то из подключенных клиентов, сохраняет сообщение в оперативной памяти. Например, это может случиться, когда настроена пересылка сообщений на другой брокер, подключенный через bridge, но внезапно пропала связь. Когда связь восстановится, сообщения из оперативной памяти будут отправлены. Однако если за время отсутствия связи сервис mosquitto был перезапущен (например, если выключался контроллер), то эти данные будут утеряны. Чтобы не допустить утерю данных, брокер mosquitto может сохранять такие сообщения не только в оперативную память, но и на накопитель в persistence file, откуда потом загрузит информацию при следующем запуске. Подробнее в статье How to set up persistent storage for Mosquitto MQTT broker.

Persistence file можно включать или выключать в настройках mosquitto. На контроллерах Wiren Board он по умолчанию включен.

Из-за ошибки в коде mosquitto persistence file может вырастать до размера 50 Мбайт и более, хотя при нормальной работе он обычно меньше 25 Мбайт. При следующем запуске mosquitto не может обработать такой большой файл и в итоге не запускается. Из-за этого также перестают работать работать веб-интерфейс и отправка MQTT-сообщений. Также persistence file большого размера может занять всё свободное место на разделе, из-за чего может перестать работать другой софт контроллера, в том числе VPN и SSH. Также в некоторых версиях ПО контроллера за статусом сервиса mosquitto следил watchdog, и из-за того, что сервис не запускался, watchdog перезапускал контроллер.

Проверить размер persistence file можно командой du -h /var/lib/mosquitto/mosquitto.db.

Этот баг исправлен в mosquitto версии 1.5.6. В Debian 9 «stretch» включен только mosquitto до версии 1.4.10-3+deb9u4, в котором баг всё ещё есть. В Debian 11 «bullseye» включен mosquitto версии 2.0.7-3 и старше, поэтому там этого бага никогда не было.

Пути обхода

Чтобы вернуть контроллер в рабочее состояние:

  1. Удалите persistence file. Это можно сделать любым способом, но так как ПО контроллера, включая SSH, может работать медленно из-за недостатка свободного места, удобнее всего это сделать с помощью отладочной консоли: rm /var/lib/mosquitto/mosquitto.db. Если из-за проблем в работе контроллера у вас не получается удалить persistence file, можете выполнить factory reset.
  2. В /etc/mosquitto/mosquitto.conf поменяйте persistence true на persistence false.
  3. Перезапустите контроллер.
  4. Ещё раз удалите persistence file.

С отключенным persistence file данная проблема не будет возникать, однако в редких случаях, описанных в разделе «Причины и подробное описание», некоторые MQTT-сообщения могут быть не доставлены. Поэтому лучше после этого сразу обновить контроллер до Debian 11 «bullseye» (инструкция) и вернуть параметр persistence true в /etc/mosquitto/mosquitto.conf.