O seu navegador está desatualizado. Talvez o site não seja exibido corretamente. Atualize o navegador.

Senior System Engineer (Admins Team) | Semrush

Senior System Engineer (Admins Team)

Saint Petersburg, Russia

Semrush — продуктовая IT-компания. С 2008 года мы разрабатываем онлайн-платформу для интернет-маркетологов, с помощью которой можно отслеживать эффективность сайта, оценивать положение продукта в сети, анализировать конкурентов и многое другое. Уже 3 года подряд наш инструмент получает премию WORLD’S BEST SEARCH SOFTWARE.

Сегодня нашим сервисом пользуются 7 000 000+ пользователей из Америки, Европы, Азии и Австралии, а над созданием трудятся более 1 000 человек по всему миру. С самого основания мы привержены своим фундаментальным ценностям: всегда отдавать приоритет людям, а не процессам, приспосабливаться к переменам, а не следовать строгому плану.

У нас плоская структура — между админом и CEO два уровня и нет лишних менеджеров и бюрократии. Напрямую общаемся с разработчиками и DevOps’ами.

Продуктовых команд больше 50. Они кросс-функциональны и сами отвечают за свой продукт. Пишут на Python, Java, Go. Приложения деплоят через Gitlab и мониторят через Prometheus. С деплоем и мониторингом помогает команда SRE. Во многих командах есть DevOps, либо кто-то из разработчиков берёт эту роль на себя.

О команде

В нашей команде 16 инженеров, которые находятся в Праге и СПб.

Наша цель — дать командам разработки возможность управлять инфраструктурой самостоятельно. Для этого разрабатываем инструменты и адаптируем инфраструктурные сервисы для команд. Один из таких инструментов — GOST. Он управляет инфраструктурой в Google Cloud через Terraform: >600 проектов, >100k ресурсов. В этом квартале добавим управление внутренностями Kubernetes через GOST.

Мы чередуем работу с заявками от команд и проектами: 1 неделя на заявках, 2 недели на проектах.

Для нас ценно обеспечить продуктовым командам быструю и качественную поддержку. Поэтому у нас нет линий поддержки с эскалациями. Мы сами решаем заявки команд и улучшаем процесс поддержки. Анализируем запросы и собираем feedback.

У нас есть On-call дежурства — это одна неделя в квартал. В нерабочее время приходят только критичные алерты. Каждую аварию мы подробно разбираем, чтобы в будущем вставать по ночам приходилось меньше.

Technology Stack

В компании придерживаемся необходимого набора технологий — всё подряд не тащим и избегаем дублирования, но есть и “так исторически сложилось”. При этом постоянно ищем новые технологии и подходы.

Инфраструктура в US: Data Center и Google Cloud. В прошлом году мигрировали с железа в Google Cloud и Kubernetes. На железе остались кластера ClickHouse и PostgreSQL, бэкапные хранилища.

Сервера Supermicro и Dell сетапим через MAAS. Spine-and-Leaf сеть построена на Juniper. Железом и сетью занимается отдельная команда Data Center Administrators.

Основные технологии:

  • Infra: Google Cloud, Kubernetes, Data Center
  • OS: Debian & Ubuntu
  • IaC: Terraform, Ansible, Puppet
  • Code: Gitlab & Gitlab CI/CD
  • Monitoring: Prometheus, Victoria Metrics, Grafana, Splunk
  • Web: Nginx, Envoy, HAProxy
  • Databases: PostgreSQL, MySQL, ClickHouse, MongoDB, Redis, Spanner
  • Other: Vault, Artifactory, RabbitMQ
  • Пишем на Python, Bash, и немного на Go

Чем будешь заниматься:

Большинство задач связаны с Google Cloud и Kubernetes.

  • С помощью Terraform конфигурировать сервисы в Google Cloud, изучать новые продукты облака и помогать разработчикам использовать их.
  • Разворачивать Kubernetes кластера в GKE и обслуживать инфраструктурные сервисы в них. Например, у нас используются свои ingress и monitoring (метрики, логи). Помогать с troubleshooting в k8s.
  • Поддерживать и улучшать средства автоматизации и управления, например дорабатывать GOST, писать Ansible Roles и pipelines для Gitlab CI/CD, покрывать тестами IaC.
  • Создавать инструменты и процессы, с помощью которых продуктовые команды могут управлять своей инфраструктурой. Например, автоматизировать копирование бэкапов из Google Cloud в Data Center или написать свой оператор для Kubernetes
  • Работать с тикетами от команд

Необходимые технические навыки:

Уметь всё-всё необязательно. Понимаем, что можно быть крутым DevOps, SRE или old-school Admin. Иметь разные компетенции и глубину знаний.

  • В Public Cloud разворачивать инфраструктуру, в идеале GCP, но подойдут и AWS, Azure — главное иметь представление про облака и отличия от железа.
  • Сетапить Kubernetes кластера или быть CKA не обязательно, но надо знать устройство Kubernetes. Настроить RBAC, выкатить ingress, объяснить чем отличается endpoint от service или annotation от label. Здорово, если будет опыт с Kubernetes в production.
  • Linux — это твой дом, где ты не гость и знаешь его устройство. Можешь найти и починить, если что-то сломалось. Troubleshooting на уровнях железа, сети, вызовов приложения.
  • IaC — звучит обыденно и на Ansible есть свои Roles, но норм и Chef, Salt, Puppet. Terraform вообще шик.
  • Деплоить через Gitlab CI/CD. Если предпочитаешь другие CI/CD и можешь отличить pipeline от job, добавить зависимости или прокинуть артефакты между job’ами, то тоже ок.
  • Nginx сконфигурировать и задебажить. Можешь отличить proxy_pass от upstream, а map от if. Знаешь как устроен HTTP протокол и TLS/SSL.
  • DB: SQL и NoSQL. Мы не ищем DBA, но работать с базами данных надо уметь. Поднять кластер, настроить бэкапы и мониторинг для PostgreSQL или MySQL. Ценим и MongoDB, ClickHouse, Redis.
  • Мониторить на Prometheus Stack, но мы и сами только в прошлом году слезли с Zabbix. Важно понимать суть: что мониторить? и зачем? когда алертить? Хорошо бы уметь агрегировать логи.
  • На Bash или Python написать простой скрипт. Круто если можешь создавать сложные программы, или хочешь расти в этом направлении.

Будет очень круто, если ты:

  • Работал в высоконагруженных web-проектах.
  • Создавал высокодоступные системы. Начиная от web-балансировки и заканчивая базами данных.

У нас ты получишь:

  • Свободу в выборе технологий и инструментов. Спектр технологий и подходов в компании очень широкий, и ты сможешь участвовать в его формировании.
  • Возможность узнать, как круто работать без давления извне. Когда команда самостоятельно принимает решения и отвечает за продукт.

Что мы готовы предложить:

  • На данный момент наши сотрудники придерживаются формата “работа из дома“, а вообще СПб офис располагается совсем рядом со ст.м. Московские ворота (10 минут прогулочным шагом). Надеемся, скоро мы все туда вернемся.
  • Гибкое начало рабочего дня, которое подойдет как жаворонку, так и сове. Ты можешь начать день в период с 9:00 до 12:00.
  • Agile-подход в работе (с удовольствием всему научим).
  • Различные тренинги/онлайн-курсы/конференции/книги для прокачивания твоих hard- и soft-скиллов.
  • Поддержка твоих спортивных увлечений и компенсация стоимости абонементов (зал/танцы/скалодромы и прочее на твой выбор).
  • Занятия по английскому языку. Сейчас они проводятся в формате онлайн.
  • Крутые вечеринки и корпоративы! Да, тоже в онлайн-режиме, но нам все равно весело:)

Candidate-se a este trabalho

Adoraríamos saber mais sobre você. Deixe-nos uma mensagem, e entraremos em contato.
Nome
E-mail
Telefone
Comentárioopcional
Currículo