
Инженер по обеспечению доступности систем (SRE)
Обязанности
О нас
Департамент инфраструктуры и поддержки ищет Инженеров по обеспечению доступности систем (SRE). Мы обеспечиваем работу тысяч серверов и инфраструктурного ПО для корпоративных и клиентских сервисов компании. Мы верим в концепцию Infrastructure-as-a-Code, а также в то, что инфраструктура имеет огромное значение в успехе продукта.
Мы ищем человека, который сможет войти в продуктовую команду, погрузиться в текущий стек разработки, CI/CD пайплайн, найти общий язык с DevOps командой, организовать деплой кода в прод и обеспечивать его работоспособность.
Вы нам подходите, если вы:
- имеете опыт работы в качестве DevOps или SRE инженера не менее 3-х лет;
- понимаете устройство ядра Linux, его модулей, а также процессов управления потоками, задачами, памятью;
- знакомы с системами виртуализации - VMware ESXi, KVM, Xen;
- обладаете глубокими знаниями контейнеризации (Docker) и опыт работы с k8s;
- знаете и имеете практический опыт работы с Git в связке с любым CI/CD;
- знаете и умеете использовать Terraform и Ansible/Puppet/Chef;
- пишете на Python на уровне Junior+;
- хорошо ориентируетесь в сборе метрик процессов, обработке логов и настройке алертинга; желательный стэк: Zabbix, Prometheus, ELK;
- имеете базовые знания в области сетевых технологий;
Будет плюсом, если вы: - проектировали высоко-нагруженные, масштабируемые и отказоустойчивые сервисы (монолитные или микросервисные);
- умеете читать код на Go на уровне Junior+;
- обладаете практическим опытом эксплуатации высоконагруженных и распределенных SQL/NoSQL DB;
Требования
Вам предстоит:
- контролировать выпуск в prod нового "кода", весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений;
- организовать качественный мониторинг и алертинг инфраструктуры и приложения;
- быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема);
- проведение DR тестов согласно DRP, псогласование изменений продукта (изменение архитектуры, дизайна, масштабирование), оценка рисков и целесообразности;
- строгая оценка систем на соответствие Стандарту по архитектурным решениям для внутренних АС и Требованиях к эксплуатации ПО и контроль устранения недоработок, в том числе внесение изменений в системах, находящихся в промышленной эксплуатации.
Условия
- Необходимая техника для работы;
- Обучение за счет компании;
- Офис напротив Библиотеки им Ленина;
- Гибкое начало рабочего дня, а также возможна удаленка;
- ДМС + стоматология;
Расскажите об этой вакансии в соцсетях