Старший DevOps инженер

31 марта

Зарплата не указана

Требования

DevOps-инженер

Senior

Linux

TCP

Kubernetes

Условия

Можно удалённо

Компания

IT_One

Стратегический партнер по цифровизации российского бизнеса и государственных органов

Описание вакансии

Компания IT_One - стратегический партнер по цифровизации российского бизнеса и государственных органов. Наша команда реализует крупнейшие проекты цифровой трансформации.

Реализовали более 600 проектов для государственных и крупных коммерческих заказчиков.Собрали большую команду, в которой сочетаются профессионализм, опыт и молодость.

Более 2500 сотрудников. Офисы в Москве, Санкт-Петербурге и Омске.

Мы набираем IT специалистов в большую команду для работы на проектах для одного из крупнейших Банков РФ из топ-3.
Ai-copilot для инженеров (АС Филин).

Мы - команда, которая строит внутреннюю платформу AI Copilot для разработчиков, аналитиков и тестировщиков.
Наша стратегия - максимальное использование open-source инструментов и больших языковых моделей, с учетом информационной безопасности. Мы не привязываемся к одному вендору или решению: архитектура спроектирована так, чтобы гибко менять модели и инструменты по мере развития рынка.

Быть частью нашей команды означает:
• Работать на передовой AI-инженерии внутри банковского контура — с реальными ограничениями по безопасности, инфраструктуре и compliance, где каждое архитектурное решение имеет вес;
• Проектировать и запускать агентные пайплайны, подбирая лучшие на рынке модели и клиенты для работы с ними - и менять их, когда появляется что-то лучше;
• Решать инженерные задачи инференса больших моделей - как на ограниченных GPU-ресурсах обеспечить скорость и качество для сотен пользователей одновременно;
• Не просто «выкатить инструмент», а изменить привычки работы целых команд - через обучение, внутреннее сообщество, круглые столы и поиск реальных кейсов применения ИИ в повседневных задачах

Почему это интересно?
AI Copilot — это не «ещё один внутренний инструмент». Это платформа, которая меняет способ работы инженеров во всём банке.
«А что с этим будем делать потом?»
Рынок AI-инструментов растёт каждый месяц. Модели становятся умнее, клиенты — мощнее, кейсов — больше. Мы строим не фиксированное решение, а живую платформу, которая будет расти вместе с рынком. Если тебе интересно не просто использовать ИИ, а определять, как его будут использовать сотни инженеров, — это твой проект.

Обязанности:

• Поддержка и развитие существующей инфраструктуры (30+ серверов, Kubernetes-кластеры);
• Построение и автоматизация CI/CD-пайплайнов для сборки, тестирования и развертывания сервисов;
• Управление контейнерной инфраструктурой (Docker, Kubernetes, Helm);
• Настройка и сопровождение систем мониторинга, логирования и алертинга;
• Автоматизация инфраструктуры с помощью IaC (Terraform, Ansible);
• Построение и поддержка инфраструктуры для доставки и обслуживания ML-моделей в продакшн (inference serving, версионирование, оркестрация ML-пайплайнов);
• ML-специфичный мониторинг: latency inference-сервисов, GPU utilization, деградация качества предсказаний;
• Оптимизация использования вычислительных ресурсов, включая GPU для inference.

Требования:

• Администрирование Linux (RHEL/Ubuntu, уровень не ниже RHCE или эквивалентный опыт);
• Docker: multi-stage builds, оптимизация образов, registry;
• Kubernetes: workload types, resource management, autoscaling, networking, RBAC;
• Helm chart разработка, Kustomize;
• Опыт построения CI/CD-пайплайнов (GitLab CI, TeamCity, Jenkins или аналоги);
• GitOps-подход (ArgoCD или аналоги);
• IaC: Terraform (modules, state management), Ansible (playbooks, roles, vault);
• Мониторинг: Prometheus, Grafana, ELK/Loki;
• Сетевой стек: TCP/IP, HTTP/gRPC, Ingress, API Gateway;
• Git, понимание Git Flow / trunk-based development;
• Скриптинг на Python и Bash;
• Опыт работы с PostgreSQL или другими СУБД.

Будет плюсом:

• Общее понимание MLOps-подходов и желание работать в этом направлении;
• Знакомство с GPU-инфраструктурой: NVIDIA drivers, CUDA, GPU-scheduling в Kubernetes (GPU Operator, device plugin, MIG);
• Знакомство с ML-serving решениями (vLLM, Triton, TorchServe, BentoML);
• Знакомство с оркестрацией ML/data-пайплайнов (Airflow, Kubeflow Pipelines);
• Опыт работы с model registry (MLflow, W&B);
• Понимание форматов моделей и оптимизации inference (ONNX, TensorRT, квантизация);
• Опыт работы с S3-совместимыми хранилищами (MinIO, Ceph);
• Практики DevSecOps: container scanning (Trivy), SAST/DAST, secret management (Vault);
• Опыт работы с высоконагруженными системами.

Вместе с интересной работой мы предлагаем:

Официальное трудоустройство по ТК РФ в аккредитованную IT компанию;
Полностью белая заработная плата;
ДМС после испытательного срока;
Корпоративное обучение и сертификация, возможности профессионального развития и карьерного роста;
Программа корпоративных скидок и привилегий (Best Benefits);
Совместные активности, мероприятия и другие well-being активности.