Привет! Я Сергей

Фото Сергея

Я инженер по машинному обучению и специализируюсь на внедрении языковых моделей в реальные продукты. Работаю с инференсом, дообучением и агентскими системами. Помогаю бизнесам внедрять ИИ быстро и эффективно.

Мои услуги

Настройка инференса языковых моделей (vLLM, SGLang)

Выстраиваю стабильную и быструю систему инференса языковых моделей — от базового запуска до продакшн-интеграции. Настраиваю vLLM или SGLang в зависимости от задачи. Работаю с локальными кластерами и облаками.

Выстраиваю стабильную и быструю систему инференса языковых моделей — от базового запуска до продакшн-интеграции. Настраиваю vLLM или SGLang в зависимости от задачи: vLLM — для скоростного батчинга и масштабируемости, SGLang — для мультихостовых запусков со сложной логикой. Работаю как с локальными кластерами, так и с облачной инфраструктурой клиента (Kubernetes, bare metal, виртуалки).

Что получает клиент:

  • Быстрый отклик модели с минимальными затратами
  • Интеграция с CRM, API, ботами, веб-интерфейсами
  • Поддержка кастомных токенизаторов, моделей, LoRA-адаптаций

Как работаем: обсуждаем требования, выбираем стек, настраиваю всё под ключ — от загрузки модели до мониторинга инференса. Возможна последующая поддержка и оптимизация.

Дообучение LLM под задачи пользователя в облаке

Помогаю запустить дообучение языковой модели на приватных данных клиента — в Nebius, AWS и других облаках. Подбираю подход к обучению, провожу оценку качества, интегрирую результат.

Помогаю запустить дообучение языковой модели на приватных данных клиента — быстро, безопасно и без лишней головной боли. Работаю с облачными платформами вроде Nebius и AWS. Подбираю нужный тип дообучения: full fine-tuning, LoRA, QLoRA или prompt tuning — в зависимости от задачи и бюджета.

Что получает клиент:

  • Модель, адаптированную под терминологию и стиль клиента
  • Инфраструктуру для дообучения: скрипты, трекеры, логгеры
  • Рекомендации по качеству датасета и метрикам

Как работаем: клиент даёт данные и задачу, я организую пайплайн: от предобработки до обучения, проверки и вывода результата. Возможна интеграция модели в конечное приложение.

Настройка агентской системы для решения прикладных задач

Создаю агента, который действует: собирает данные, обрабатывает информацию, вызывает API. Это может быть бизнес-ассистент, бот для анализа или генерации текстов и SQL-запросов.

Создаю мультитул на базе LLM — с цепочками действий, внешними вызовами, памятью, доступом к API и базам данных. Это может быть ассистент для менеджера, бот для аналитики или LLM, которая сама пишет отчёты и генерирует SQL.

Что получает клиент:

  • Решение "под ключ" для автоматизации рутины
  • Агент, который реально действует: запрашивает, анализирует, отвечает
  • Возможность обучения на пользовательских сценариях

Как работаем: начинаем с обсуждения задач, далее строю MVP агента, тестируем на кейсах, дорабатываем и внедряем. Поддержка и донастройка по необходимости.

Связаться со мной

Почта: sergei.vorobyov01@gmail.com

Telegram: @serv01