Евгений Варавва, 'SRE в Google'

preview_player
Показать описание
Доклад "SRE в Google"

В докладе "SRE в Google" я бы хотел рассказать в двух словах о команде SRE, принципах её работы, отличии от devops или sys. admin, показать несколько примеров наших трудов.
Команда SRE в Google круглосуточно работает над обеспечением надёжности, производительности и доступности программной инфраструктуры, а также основных пользовательских приложений. Наша цель – обеспечить максимальную скорость разработки новых сервисов и фич, не жертвуя при этом качеством существующих продуктов. Эта работа, чаще всего, включает в себя:
* Разработку метрик для минимизации рисков не попадания в SLA, в сотрудничестве с командами, ответственными за разработку нового функционала. Например введение т.н. "бюджета простоя", разработка процесса частичного выкатывания нового кода и настроек и др.
* Мониторинг доступности и простоя сервисов. При необходимости, принятие неотложных корректирующих действий, координация пост-мортемов.
* Планирование мощности и потребности, приобретение необходимых ресурсов и выполнение необходимых действий по разворачиванию, сворачиванию, необходимых для обеспечения нужной производительности.
* Консультации по системной архитектуре, начиная с ранних этапов многих продуктов. Оценка готовности к Production, координация запусков.
* Установление и догматизация процессов, балансирующих аптайм, быстродействие, риски приложения и пользовательские ощущения.
Рекомендации по теме
Комментарии
Автор

Да, снято ужасно, но по факту тут самое важное - это то, что он говорит.

olegmykolaichenko
Автор

Что за идиот управлял камерой?
В чем фишка держать докладчика в левой половине экрана, снимая стену? Слайды не видны вовсе, зато голов зрителей на четверть кадра.

MrVitalyty