How to diagnose: различия между версиями

11 946 байт добавлено ,  4 месяца назад
Нет описания правки
 
(не показаны 43 промежуточные версии 3 участников)
Строка 1: Строка 1:
{{DISPLAYTITLE: Диагностика ошибок в работе контроллера Wiren Board}}
{{DISPLAYTITLE: Диагностика ошибок в работе контроллера Wiren Board}}
[[Image: journalctl — logs.png |400px|thumb|right| Просмотр системного журнала с помощью journalctl]]
[[Image: journalctl — logs.png |400px|thumb|right| Просмотр системного журнала с помощью journalctl]]
[[Image: WebUI 2.0 logs.png |400px|thumb|right| Просмотр системного журнала в веб-интерфейсе контроллера Wiren Board {{SupportedSinceRelease|release=wb-2110|nobanner=true}}]]
[[Image: Web-Configs-2.0 logs.png |400px|thumb|right| Просмотр системного журнала в веб-интерфейсе контроллера Wiren Board]]
== Введение ==
== Введение ==
Если в работе контроллера Wiren Board возникают ошибки — найти причину поможет анализ системного журнала. Так же полезно проверить, что вы используете [[Wiren Board Firmware Update| свежую версию ПО]].
Если в работе контроллера Wiren Board возникают ошибки — найти причину поможет анализ системного журнала.


В контроллерах Wiren Board используется системный сервис журналов journald, который обрабатывает события на запись в лог и сохраняет их в бинарные файлы. По умолчанию настроена очистка старых сообщений журнала, которая не позволит ему занять всё свободное пространство.
В контроллерах Wiren Board используется системный сервис журналов journald, который обрабатывает события на запись в лог и сохраняет их в бинарные файлы. По умолчанию настроена очистка старых сообщений журнала, которая не позволит ему занять всё свободное пространство.
Строка 9: Строка 9:
Читать журналы можно двумя способами:
Читать журналы можно двумя способами:
* из консоли с помощью [[journalctl]].
* из консоли с помощью [[journalctl]].
{{SupportedSinceRelease
* из веб-интерфейса с помощью инструмента [[Wiren Board Web Interface#mqtt-channels | Системный журнал]].
| release = wb-2110
|content=
* из веб-интерфейса с помощью [[Wiren Board Web Interface#logs | инструмента Logs]].
}}


О том, что искать в системном журнале, читайте в разделах [[#Основы|Основы]] и [[#Примеры типовых неисправностей |Примеры типовых неисправностей]].
Цель диагностики — локализовать и устранить неисправность, общий алгоритм:
# Сформулируйте проблему: контроллер перезагружается или не включается, Modbus-устройство работает нестабильно, не работает 4G-модем, не работает веб-интерфейс и т.д.
# Смотрите, есть ли в системном журнале ошибки. Прочитайте разделы [[#Основы|Основы]] и [[#Примеры типовых неисправностей |Примеры типовых неисправностей]] — это даст вам понимание того, как всё устроено и поможет понять, что именно искать.
# Если нашли в журнале ошибки — внимательно прочитайте их, они дадут понимание того, что происходит и кто виноват. Дополнительно поищите упоминание проблемы на портале техподдержки, возможно, кто-то уже с ней сталкивался и есть готовое решение.
# Если из текста ошибки и результатов поиска на форуме непонятно, что происходит — проверьте, что вы используете свежую версию ПО. Если это не так — [[Wiren_Board_Software#update| обновите прошивку контроллера]].


Если вы не смогли самостоятельно определить причину ошибок в работе контроллера, создайте тему на [https://support.wirenboard.com форуме техподдержки], приложите записи системного журнала или [[Wiren_Board_Web_Interface#Settings -> System (Настройки -> Системные) |архив с диагностической информацией]] и мы постараемся помочь.
В случае, если вы не смогли самостоятельно определить и устранить причину проблемы, создайте тему на [https://support.wirenboard.com форуме техподдержки]: подробно опишите проблему и приложите записи системного журнала или [[Wiren_Board_Web_Interface#diagnostic |архив с диагностической информацией]]. Рекомендуем перед созданием темы прочитать [https://support.wirenboard.com/faq Советы по оформлению сообщений].
 
Обмен файлами с контроллером можно организовать по протоколу SFTP(SSH File Transfer Protocol), смотрите инструкцию в статье [[View controller files from your computer|Просмотр файлов контроллера с компьютера]].


== Основы ==
== Основы ==
=== Как устроено ПО контроллера ===
=== Как устроено ПО контроллера ===
[[File:MQTT.png | thumb | 600px | Через [[MQTT]] работают драйверы внутренних функций, внешних устройств, веб-интерфейс, система правил]]
[[File:DebianLinux.png| thumb | 600px | Через [[MQTT]] работают драйверы внутренних функций, внешних устройств, веб-интерфейс, система правил]]


В основе программной архитектуры Wiren Board — MQTT-брокер, в который пишут информацию различные сервисы wb:
В основе программной архитектуры Wiren Board — MQTT-брокер, в который пишут информацию различные сервисы wb:
Строка 42: Строка 44:
Подробнее читайте в статье [[Wiren_Board_Software|Программное обеспечение Wiren Board]].
Подробнее читайте в статье [[Wiren_Board_Software|Программное обеспечение Wiren Board]].


Обмен файлами с контроллером можно организовать по протоколу SFTP(SSH File Transfer Protocol). Подробные инструкции смотрите в статье [[View controller files from your computer|Просмотр файлов контроллера с компьютера]].
На контроллер Wiren Board можно установить ПО сторонних разработчиков, которое может сбоить и блокировать нормальную работу контроллера — помните об этом. В большинстве случаев стороннее программное обеспечение так же оставляет записи в системном журнале.


=== Полезные команды ===
=== Полезные команды ===
Команды ниже выполняются в консоли контроллера, подключиться к которой можно через [[SSH]] или через [[Debug UART | отладочный порт]].
Команды ниже выполняются в консоли контроллера, подключиться к которой можно через [[SSH]] или [[Debug UART | отладочный порт]].
 
==== Информация о контроллере ====


Посмотреть, когда был запущен контроллер:
Посмотреть, когда был запущен контроллер:
Строка 90: Строка 94:
/dev/mmcblk0p6  4.7G  1.1G  3.4G  24% /mnt/data
/dev/mmcblk0p6  4.7G  1.1G  3.4G  24% /mnt/data
tmpfs            50M    0  50M  0% /run/user/0
tmpfs            50M    0  50M  0% /run/user/0
</syntaxhighlight>
А так можно узнать, сколько занимают места подкаталоги:
<syntaxhighlight lang="console">
# du -h --max-depth=1
6.9M    ./.cache
12K    ./.ssh
46M    ./.npm
328M    ./zigbee2mqtt
20K    ./.config
16K    ./.local
4.0K    ./.nano
32K    ./tmp
381M    .
</syntaxhighlight>
Посмотреть нагрузку на процессор и оперативную память в разрезе загруженных программ:
<syntaxhighlight lang="console">
# top
top - 08:52:05 up 16:32,  1 user,  load average: 0.36, 0.54, 0.60
Tasks:  96 total,  3 running,  68 sleeping,  0 stopped,  0 zombie
%Cpu(s):  7.9 us,  3.3 sy,  0.0 ni, 88.5 id,  0.0 wa,  0.0 hi,  0.3 si,  0.0 st
KiB Mem :  507820 total,    33124 free,  130160 used,  344536 buff/cache
KiB Swap:  262140 total,  262140 free,        0 used.  398184 avail Mem
  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM    TIME+ COMMAND                                                                   
1119 root      20  0  913636  22576  11176 S  2.3  4.4  36:08.75 wb-rules                                                                 
3642 root      20  0  59272  5408  4812 S  1.6  1.1  12:52.91 wb-mqtt-adc                                                               
14919 root      20  0    5396  2380  1892 R  1.6  0.5  0:00.55 top                                                                       
  349 mosquit+  20  0    8176  5008  3912 S  1.3  1.0  11:31.22 mosquitto                                                                 
    1 root      20  0  25728  5060  3704 S  0.7  1.0  3:14.82 systemd                                                                   
1129 root      20  0  62212  8256  5368 S  0.7  1.6  7:12.36 main                                                                     
4262 root      20  0  59320  6180  5580 S  0.7  1.2  4:20.00 wb-mqtt-gpio
</syntaxhighlight>
</syntaxhighlight>


Строка 96: Строка 134:
# uname -a
# uname -a
Linux wirenboard-AYXIHFQ6 5.10.35-wb6 #1 Thu Sep 30 00:33:57 UTC 2021 armv7l GNU/Linux
Linux wirenboard-AYXIHFQ6 5.10.35-wb6 #1 Thu Sep 30 00:33:57 UTC 2021 armv7l GNU/Linux
</syntaxhighlight>
==== Управление сервисами ====
Проверить статус сервиса и посмотреть его последние 10 сообщений в системном журнале можно командой <code>systemctl status <имя сервиса></code>:
<syntaxhighlight lang="console">
# systemctl status wb-mqtt-serial
● wb-mqtt-serial.service - MQTT Driver for serial devices
  Loaded: loaded (/lib/systemd/system/wb-mqtt-serial.service; enabled; vendor preset: enabled)
  Active: active (running) since Mon 2021-11-08 22:21:59 +04; 12h ago
Main PID: 8180 (wb-mqtt-serial)
  CGroup: /system.slice/wb-mqtt-serial.service
          └─8180 /usr/bin/wb-mqtt-serial
Nov 09 02:29:54 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 6 coil(s) @ 0 of device modbus:241: Serial protocol error: request timed out
Nov 09 02:46:10 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 2 input(s) @ 270 of device modbus:58: Serial protocol error: request timed out
Nov 09 02:46:41 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 1 coil(s) @ 2 of device modbus:58: Serial protocol error: request timed out
Nov 09 02:53:57 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 6 discrete(s) @ 0 of device modbus:241: Serial protocol error: request timed out
Nov 09 03:54:33 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 6 discrete(s) @ 0 of device modbus:241: Serial protocol error: request timed out
Nov 09 05:39:59 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 3 discrete(s) @ 0 of device modbus:111: Serial protocol error: request timed out
Nov 09 06:50:47 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 1 holding(s) @ 0 of device modbus:58: Serial protocol error: request timed out
Nov 09 08:47:36 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 2 input(s) @ 270 of device modbus:58: Serial protocol error: request timed out
Nov 09 10:11:34 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 1 discrete(s) @ 4 of device modbus:58: Serial protocol error: request timed out
Nov 09 10:12:15 wirenboard-AYXIHFQ6 wb-mqtt-serial[8180]: WARNING: [modbus] failed to read 2 input(s) @ 270 of device modbus:58: Serial protocol error: request timed out
</syntaxhighlight>
Получить список запущенных сервисов и их статусы:
<syntaxhighlight lang="bash">
systemctl list-units --type=service
</syntaxhighlight>
Управление сервисом:
<syntaxhighlight lang="bash">
systemctl start <имя сервиса>
systemctl stop <имя сервиса>
systemctl restart <имя сервиса>
</syntaxhighlight>
Включить или выключить автозапуск сервиса:
<syntaxhighlight lang="bash">
systemctl disable <имя сервиса>
systemctl enable <имя сервиса>
</syntaxhighlight>
</syntaxhighlight>


== Примеры типовых неисправностей ==
== Примеры типовых неисправностей ==
=== Контроллер перезагружается ===
=== Контроллер неожиданно стал вести себя странно ===
Контроллер может перезагружаться по ряду причин:
Надо попытаться точно определить, про происходит и отделить внешние проблемы от внутренних: остановить стороннее ПО, отключить подключённые устройства, проверить стабильность питания.
* Нестабильное питание — просадки напряжения питания ниже допустимого значения могут вызвать перезагрузку.
* Нехватка места на eMMC.
* Зависание программ и сервисов — сработает watchdog, которые перезагрузит контроллер.
* Перезагрузка вызвана пользователем, например, командой <code>shutdown -r now</code>.


Сперва стоит проверить качество питания: уровень напряжения, отсутствие «просадок». Попробуйте подключить контроллер к другому блоку питания.
Ещё бывает, что по каким-то причинам кончилось свободное место на eMMC, проверить можно так:
<syntaxhighlight lang="console">
#  df -HT
Filesystem    Type      Size  Used Avail Use% Mounted on
/dev/root      ext4      1.1G  859M  98M  90% /
devtmpfs      devtmpfs  251M    0  251M  0% /dev
tmpfs          tmpfs    260M    0  260M  0% /dev/shm
tmpfs          tmpfs    104M  1.2M  103M  2% /run
tmpfs          tmpfs    5.3M    0  5.3M  0% /run/lock
/dev/mmcblk0p6 ext4      5.1G  2.0G  2.8G  42% /mnt/data
tmpfs          tmpfs      52M    0  52M  0% /run/user/0
</syntaxhighlight>


Если питание стабильно, то причину перезагрузки ищите в сообщениях watchdog и ядра ОС Linux (dmesg). Если контроллер перезагружается в цикле и вы не можете попасть в консоль, попробуйте [[watchdog | отключить watchdog]].
Загляните в список известных неисправностей, нет ли там проблем с похожими симптомами: [[WB_6:_Errata|Wiren Board 6: Errata]], [[WB_7:_Errata|Wiren Board 7: Errata]].
 
=== Проблемы с serial-устройствами ===
Если устройства, подключённые к портам RS-485 работают нестабильно — проверьте [[RS-485:Физическое подключение|физическое подключение]]. Несоблюдение рекомендаций по организации шины RS-485 и плохой контакт в клеммах — частые причины проблем.


=== Serial-устройства работают нестабильно ===
Узнать, с каким именно устройством проблемы, можно:
Узнать, с каким именно устройством проблемы, можно:
* в веб-интерфейсе контроллера, на вкладке ''Devices'' — каналы такого устройства будут окрашены красным;
* в веб-интерфейсе контроллера, на вкладке ''Devices'' — каналы такого устройства будут окрашены красным;
* в сообщениях драйвера ''wb-mqtt-serial'' — ищите ошибки обмена error и warning. Если сообщения об ошибках обмена возникают периодически — повод проверить физическое подключение устройств.
* в сообщениях драйвера ''wb-mqtt-serial'' — ищите ошибки обмена error и warning. Если сообщения об ошибках обмена возникают периодически — повод проверить физическое подключение устройств.


Если ошибок обмена в сообщениях драйвера нет, но устройство не работает — включите вывод отладочных сообщений. Как это сделать, смотрите в описании драйвера [[wb-mqtt-serial]].
Если ошибок обмена в сообщениях драйвера нет, но устройство не работает — включите вывод отладочных сообщений. Как это сделать, смотрите в описании драйвера [[wb-mqtt-serial#Включение отладки | wb-mqtt-serial]].


После того как вы определились с проблемным устройством — подключите его на отдельный порт RS-485, настройте и добейтесь стабильной работы: проверьте параметры подключения, снизьте скорость обмена, убедитесь, что в устройстве выставлен верный стоп-бит.
После того как вы определились с проблемным устройством — подключите его коротким проводом на отдельный порт RS-485, настройте и добейтесь стабильной работы: проверьте параметры подключения, снизьте скорость обмена, убедитесь, что в устройстве выставлен верный стоп-бит.


Диагностика устройств, которые работают по протоколу Mosbus TCP или Modbus Over TCP почти не отличается от тех, что подключены к контроллеру по RS-485. Разница лишь в том, что у вас добавляется ещё одно звено — локальная сеть, через которую подключены устройства.
Диагностика устройств, которые работают по протоколу Mosbus TCP или Modbus Over TCP почти не отличается от тех, что подключены к контроллеру по RS-485. Разница лишь в том, что у вас добавляется ещё одно звено — локальная сеть, через которую подключены устройства.
{| class="wikitable" style="max-width:1200px"
|+ Частые симптомы и методы диагностики
|-
! Порядок проверки
! Симптомы
! Возможная причина
! Диагностика
|-
| 1
| Устройство не работает или работает нестабильно
| Неверные настройки подключения
| Проверьте, что настройки порта RS-485 и устройства одинаковые. Если устройство работает нестабильно, обратите внимание на стоп-бит
|-
| 2
| Устройство не работает или работает нестабильно. В системном журнале периодически возникают ошибки обмена
| Проблемы с шиной RS-485: плохой контакт, обрывы или наводки на шине
| Подключите устройство коротким проводом напрямую к контроллеру. Если проблема ушла — проверяйте шину RS-485 на отсутствие физических повреждений и соответствие рекомендациям: [[RS-485:Физическое подключение|RS-485:Физическое подключение]]
|-
| 3
| Устройство работает нестабильно, в системном журнале есть ошибки таймаута и ''invalid CRC''
| На шине два устройства с одинаковыми адресами
|
* Физически отключите проблемное устройство от шины, запомните его адрес.
* Считайте с помощью утилиты [[modbus_client]] один из регистров по тому же адресу. Для устройств Wiren Board удобно считывать регистр 128.
* Если ответ пришёл — на линии есть двойник. Смените устройствам адреса на свободные.
|-
| 4
| Устройство стороннего производителя работает нестабильно
| Проблемы в устройстве
|
* Подключите устройство на отдельный порт и добейтесь стабильной работы.
* Верните устройство на шину к другим устройствам.
* Если проблемы вернулись — производитель устройства не полностью реализовал Modbus-протокол. Решение: использовать устройство на отдельном порту или не использовать его совсем.
|}


=== Не работают модули WBIO ===
=== Не работают модули WBIO ===
Не работают один или несколько модулей — проверьте правильность [[IO_modules | подключения и настройки]].
Сперва проверьте правильность [[IO_modules | подключения и настройки]].


Если модули правильно подключены и настроены, но не работают:
Если модули правильно подключены и настроены, но не работают:
Строка 137: Строка 256:
Перед началом диагностики, попробуйте просто перезагрузить страницу с очисткой кэша браузера — часто помогает. Обычно это можно сделать нажатием клавиш <kbd>Ctrl</kbd>+<kbd>Shift</kbd>+<kbd>R</kbd> или <kbd>Ctrl</kbd>+<kbd>F5</kbd> — комбинация зависит от вашего браузера.
Перед началом диагностики, попробуйте просто перезагрузить страницу с очисткой кэша браузера — часто помогает. Обычно это можно сделать нажатием клавиш <kbd>Ctrl</kbd>+<kbd>Shift</kbd>+<kbd>R</kbd> или <kbd>Ctrl</kbd>+<kbd>F5</kbd> — комбинация зависит от вашего браузера.


Если это не помогло ищите в логах сообщения от ''wb-mqtt-serial'' и ''wb-mqtt-confed''. Особенно интересны сообщения типов ''error'' и ''warning''.
Если это не помогло:
* ищите в логах сообщения от ''wb-mqtt-serial'' и ''wb-mqtt-confed''. Особенно интересны сообщения типов ''error'' и ''warning''.
* проверьте файл конфигурации и шаблоны по [[wb-mqtt-serial#Диагностика неполадок | инструкции]].
 
=== Контроллер перезагружается ===
Контроллер может перезагружаться по ряду причин:
* Нестабильное питание — просадки напряжения питания ниже допустимого значения могут вызвать перезагрузку.
* Нехватка места на eMMC.
* Зависание программ и сервисов — сработает watchdog, которые перезагрузит контроллер.
* Перезагрузка вызвана пользователем, например, командой <code>shutdown -r now</code>.
 
Сперва стоит проверить качество питания: уровень напряжения, отсутствие «просадок». Попробуйте подключить контроллер к другому блоку питания.
 
Если питание стабильно, то причину перезагрузки ищите в сообщениях watchdog и ядра ОС Linux (dmesg). Если контроллер перезагружается в цикле и вы не можете попасть в консоль, попробуйте [[watchdog | отключить watchdog]].


=== Контроллер не включается ===
=== Контроллер не включается ===
Строка 145: Строка 277:
* индикатор загорается и спустя пару минут начинает мигать зелёным — ОС контроллера загрузилась: попробуйте подключиться к нему по [[SSH]]. Если это удалось, точнее сформулируйте неисправность: не заходит в веб-интерфейс, не работают подключённые устройства и т.п. Потом начинайте диагностику.
* индикатор загорается и спустя пару минут начинает мигать зелёным — ОС контроллера загрузилась: попробуйте подключиться к нему по [[SSH]]. Если это удалось, точнее сформулируйте неисправность: не заходит в веб-интерфейс, не работают подключённые устройства и т.п. Потом начинайте диагностику.


Описание состояний индикатора контроллера смотрите в [[Wiren Board#Индикация этапов загрузки | документации]].
Описание состояний индикатора контроллера смотрите в [[Wiren Board#Индикация этапов загрузки | документации]]. Если у вас не получилось выяснить причину поломки, создайте тему на [https://support.wirenboard.com портале технической поддержки] и приложите всю собранную информацию.
 
== Полезные ссылки ==
* [[Заглавная страница | Документация устройств Wiren Board]] — описание устройств, схемы подключения, инструкции по обновлению и т.п.
* [https://support.wirenboard.com Портал технической поддержки] — техподдержка и помощь сообщества.
* [[WB_FAQ| Ответы на часто задаваемые вопросы (FAQ)]] — сборник полезных советов и ссылок.
* [https://translate.google.ru/ Онлайн-переводчик от Google] — если у вас трудности с переводом сообщений журнала, воспользуйтесь переводчиком.