[DevOps] Системы мониторинга IT-инфраструктуры

preview_player
Показать описание
Метрики:
--- сбор:
- prometheus / victoriametrics
- zabbix
--- визуализация:
- grafana
- zabbix

Логи:
--- сбор:
- Elastic stack (elasticsearch / filebeat / logstash / graylog и др)
--- визуализация:
- kibana
- graylog
- grafana

Профилирование / трассировка:
- jaeger
- zipkin

Алертинг:
- graylog
- grafana
- alertmanager
- zabbix

Благодарность и задать вопрос -
Рекомендации по теме
Комментарии
Автор

По поводу логов - мы используем loli (c promtail) + grafana. Для питона либа useful-logs, что бы все было в json. Все остальные логи то же в в json. Вполне достаточно. Просто настраивается, масштабируется и ищется что нужно.

rostislavmalyshev
Автор

Отличный материал, можно видео минут на 15 про егеря/зипкина и примерами?

deleted
Автор

Интересует алертинг из графаны. Если можешь, то расскажи, пож.

lulnryc
Автор

На последнем месте решил попробовать мониторить и алертить прометейем и алерт мэнэджером, и столкнулся с проблемой, что в алерте было куча не нужной информации, все это сложно читаемой, выяснил что под алертинг нужно писать свой шаблон на го темплэйт, изрядно намучившись...написав шаблон для алерта, и вот стандартные алерты от системных метрик выглядят уже боле-менее читаемо, столкнулся с тем чтоб под алерты от докера нужно писать свой шаблон, в итоге плюнул и поставил заббикс. Подхожу к тому что собирать метрики, алертить лучше срадствами заббикса, к нему же можно подрубить графану.

iskanderchanyshev
Автор

Всем привет, только что смотрел видео по Python короче говоря мне нужна ссылка на тот питон, который использует Be Geek, в своих видео буду очень благодарен у меня олимпиада, а я не могу найти его, но даже после олимпиады он будет мне нужен так что буду ждать

nightraid