logo

Инженер по обеспечению доступности систем (SRE)

Откликнуться

Обязанности

О нас

Департамент инфраструктуры и поддержки ищет Инженеров по обеспечению доступности систем (SRE). Мы обеспечиваем работу тысяч серверов и инфраструктурного ПО для корпоративных и клиентских сервисов компании. Мы верим в концепцию Infrastructure-as-a-Code, а также в то, что инфраструктура имеет огромное значение в успехе продукта.

Мы ищем человека, который сможет войти в продуктовую команду, погрузиться в текущий стек разработки, CI/CD пайплайн, найти общий язык с DevOps командой, организовать деплой кода в прод и обеспечивать его работоспособность.

Вы нам подходите, если вы:

  • имеете опыт работы в качестве DevOps или SRE инженера не менее 3-х лет;
  • понимаете устройство ядра Linux, его модулей, а также процессов управления потоками, задачами, памятью;
  • знакомы с системами виртуализации - VMware ESXi, KVM, Xen;
  • обладаете глубокими знаниями контейнеризации (Docker) и опыт работы с k8s;
  • знаете и имеете практический опыт работы с Git в связке с любым CI/CD;
  • знаете и умеете использовать Terraform и Ansible/Puppet/Chef;
  • пишете на Python на уровне Junior+;
  • хорошо ориентируетесь в сборе метрик процессов, обработке логов и настройке алертинга; желательный стэк: Zabbix, Prometheus, ELK;
  • имеете базовые знания в области сетевых технологий;

    Будет плюсом, если вы:
  • проектировали высоко-нагруженные, масштабируемые и отказоустойчивые сервисы (монолитные или микросервисные);
  • умеете читать код на Go на уровне Junior+;
  • обладаете практическим опытом эксплуатации высоконагруженных и распределенных SQL/NoSQL DB;

Требования

Вам предстоит:

  • контролировать выпуск в prod нового "кода", весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений;
  • организовать качественный мониторинг и алертинг инфраструктуры и приложения;
  • быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема);
  • проведение DR тестов согласно DRP, псогласование изменений продукта (изменение архитектуры, дизайна, масштабирование), оценка рисков и целесообразности;
  • строгая оценка систем на соответствие Стандарту по архитектурным решениям для внутренних АС и Требованиях к эксплуатации ПО и контроль устранения недоработок, в том числе внесение изменений в системах, находящихся в промышленной эксплуатации.

Условия

  • Необходимая техника для работы;
  • Обучение за счет компании;
  • Офис напротив Библиотеки им Ленина;
  • Гибкое начало рабочего дня, а также возможна удаленка;
  • ДМС + стоматология;
Расскажите об этой вакансии в соцсетях

Отклик на вакансию:

Откликаясь на вакансию, вы даете согласие на обработку ваших персональных данных и соглашаетесь с политикой конфиденциальности Cloud.ru