Андрей Паньгин, Леонид Талалаев, Артем Дроздов — Непрерывное профилирование в облаке с помощью eBPF

preview_player
Показать описание
Ближайшая конференция — JPoint 2025, 3–4 апреля (Москва + трансляция).
— —
Профилированием работающего в продакшене Java-приложения сегодня едва ли кого можно удивить. Но как найти проблему с одним из тысячи хостов, если запускать профайлер уже поздно? Вот бы можно было увидеть профиль любого приложения на любом отрезке времени в прошлом! Такая «машина времени» была внедрена в масштабах всей облачной инфраструктуры «Одноклассников».

Спикеры расскажут о сложностях реализации непрерывного профилирования (нельзя просто так взять и запустить везде async-profiler). Уделят внимание технологии eBPF и её роли в получившемся решении. Отдельно остановятся на инфраструктуре для сбора, хранения и отображения профилей. И, конечно же, покажут, как выглядит конечный результат для пользователя.

Рекомендации по теме
Комментарии
Автор

Паньгин, один из немногих спикеров, чьи доступные выступления нужно смотреть все.

denis_iii
Автор

Спасибо за доклад. Вы проделали классную работу. У меня возник только один вопрос. Все это кажется немного переусложненным, в то время как Google еще в 2010 публиковал статью Google-Wide Profiling: A Continuous Profiling Infrastructure for Data Centers, с которой вы наверняка знакомы. Описаный в ней подход звучит сильно проще при этом не сильно уступая по функциональности. Вполне возможно, что Google по прежнему использует GWP на своей архитектуре и, возможно даже предлагает именно его в качестве Cloud Profiling клиентам Google Cloud. Какие преимущества есть у вашего подхода, по сравнению с GWP?

ИванРусанов-щх
Автор

Господи, научитесь не картавя рассказывать вещи.

maximstepanenko