А давайте-ка что-нибудь сломаем? А то всё строим и строим, чиним и
чиним. Скука смертная.
Давайте сломаем так, чтобы нам за это ничего не было мало того,
чтобы нас за это безобразие ещё и похвалили. А потом заново всё
построим да так, что будет на порядок лучше, отказоустойчивей и
быстрее.
И снова сломаем.
Думаете, это конкурс по применению самого секретного инструмента
всей нашей космонавтики Big Russian Space Hammer?
Нет, это онлайн-интенсив SRE. Так уж получилось, что каждый курс
Слёрм SRE никогда и ни за что непохож на предыдущий. Просто
потому что никогда не угадаешь, что в огромной сложной системе, к
которой каждую секунду подключаются тысячи и тысячи пользователей,
а сама аудитория составляет несколько миллионов, может отвалиться,
сломаться, затупить, заглючить и ещё сотнями способов испортить
настроение дежурной смене SRE-инженеров.
В декабре мы проведём очередной интенсив по
SRE.
Устроим небольшую ретроспективу. Вспомните, как всего лишь
несколько лет назад HR устраивали забеги наперегонки, кто ухватит в
свою компанию побольше DevOps-инженеров. Приз поменялся. Теперь
они, как следящая система Панцирь-С1, осматривают окружающее
пространство, выискивают SRE-инженеров. Я рассказывал в статье
Евгений Варавва, разработчик в Google. Как описать Google в 5
словах, как живётся SRE-инженеру в Google, и как даже такая
корпорация испытывает дефицит в SRE-специалистах.
На онлайн интенсиве Слёрм SRE в
декабре за три дня, с 10:00 и до 19:00, вы научитесь обеспечивать
быстродействие, отказоустойчивость и доступность сайтов в условиях
ограниченных ресурсов, ликвидировать IT-инциденты и проводить
разбор полётов так, чтобы проблемы не повторялись.
Спикеры курса:
Иван Круглов. Staff Software Engineer в Databricks. Имеет
опыт в enterprise компаниях по распределенной доставке и обработке
сообщений, BigData и web-stack, поиску, построению внутреннего
облака, service mesh.
Павел Селиванов. Senior DevOps Engineer в Mail.ru Cloud
Solutions. На счету десятки выстроенных инфраструктур и сотни
написанных пайплайнов CI/CD. Сертифицированный администратор
Kubernetes. Автор нескольких курсов по Kubernetes и DevOps.
Регулярный докладчик на Российских и международных IT
конференциях.
Всё будет проходить жёстко, непредсказуемо и на практике. Вы будете
строить, ломать и чинить причём порой в самых разных
последовательностях.
Строить: Вам предстоит сформулировать показатели SLO, SLI,
SLA для сайта, состоящего из нескольких микросервисов; разработать
архитектуру и инфраструктуру, которая их обеспечит; собрать,
протестировать и задеплоить сайт; настроить мониторинг и
алёртинг.
Ломать: Вы рассмотрите внутренние и внешние факторы
ухудшения SLO: ошибки разработчиков, отказы инфраструктуры, наплыв
посетителей, DoS-атаки. Научитесь разбираться в устойчивости, error
budget, практике тестирования, управлении прерываниями и с
операционной нагрузкой.
Чинить: Вас натренируют быстро и эффективно организовать
работу группы по ликвидации аварии в минимальные сроки: подключить
коллег, оповестить интересантов (stakeholders), выстроить
приоритеты.
Изучать: Вы сможете разобрать подход к сайту с точки зрения
SRE. Проанализировать инциденты. Определить, как избежать их в
будущем: улучшить мониторинг, изменить архитектуру, подходы к
разработке и эксплуатации, регламенты. Автоматизировать
процессы.
Онлайн-интенсив
SRE имитирует реальные условия время на восстановление
работоспособности сервиса будет предельно ограничено. Как в
настоящей жизни, как в реальной рабочей ситуации.
Узнать условия курса SRE, а также изучить полную программу можно по
ссылке.
Онлайн-интенсив запланирован на декабрь 2020 года. Для тех, кто
оплатит участие заранее, мы подготовили скидку.
Готовы к напряжённому обучению, нестандартным задачам и внезапным
авариям?
Просто не будет. Будет профессиональный рост.