DevOps/SRE инженер
Прямой работодатель Tutu.ru ( tutu.ru )
Опыт работы от 3 до 5 лет
Привет, я Максим из ИТ Платформы. Мы разрабатываем и поддерживаем облачную платформу на базе OpenShift, сами разрабатываем инструменты, автоматизируем процессы, оказываем поддержку и коммуницируем со всеми подразделениями компании. Мы называем наш продукт ИТ платформа. Помогаем всем разработчиками компании выстраивать для своих приложений правильные процессы. Предоставляем все необходимое для разработки и запуска микросервисных продуктов в облаке. Миссия облачной платформы помогать Туту.ру становиться высокопроизводительной компанией (high performance organization).
ИТ Платформа — это ключевая инфраструктура и ключевые процессы для разработки. Мы делаем очень важную в компании вещь, без которой разработка стояла мёртво. Благодаря ИТ платформе можно создать и выложить новый сервис за минуты, без согласований, без заявок в джире. Наша команда активно развивает ИТ платформу, мы внедряем новые практики и процессы, в масштабах компании мы меняем DX к лучшему.
Мы ищем опытного SRE инженера, готового в дальнейшем заниматься развитием инфраструктуры и инструментов для обеспечения надежности и высокой доступности.
Немного про стек:
- OKD 4.7 (open source openshift);
- сервера Dell PowerEdge R640;
- Сеть Cilium, Prometheus, Grafana, Rook, Linstor, Tekton плюс наши контроллеры на python и go lang.
Что нужно будет делать в проекте:
- Осуществлять поддержку baremetal кластеров OpenShift.
- Разбираться в проблемах (сеть, oom, dns, с чем-то сложным и непонятным, когда что-то идет не так).
- Автоматизировать эксплуатацию кластеров (сделать скейлинг, развивать мониторинг, настраивать новые метрики).
- Настроить регулярные бэкапы.
- Добавлять функционал в кластера (персистент хранилище, cloud native DB).
Что для этого нужно?
Мы ждем, что вы:
- Владеете глубокими знаний в linux, умеете настраивать и дебажить linux-системы, разбираться с чем-то сложным и непонятным.
- Имеете опыт эксплуатации нагруженных baremetal-кластеров kubernetes или openshift.
- Работали с сетевыми системами для контейнеров - cilium или calico, а так же с хранилищами ceph, linstor.
- Сталкивались с terraform, ansible и grafana, Prometheus.
Структура собеседования:
Собеседование из трех этапов. Скрининг с руководителем (30-40 мин), потом с командой (эти два этапа можно разбить, а можно провести в один день), потом финалка с HR и заместителем CTO.
О компании
Весь положенный набор плюшек: ДМС со стоматологией, кухня в офисе, страховка на путешествия, ноутбук, премии по результатам работы, регулярная переиндексация зарплаты раз в квартал и так далее. Обучение, книги, обмен опытом.