Я инженер по машинному обучению и специализируюсь на внедрении языковых моделей в реальные продукты. Работаю с инференсом, дообучением и агентскими системами. Помогаю бизнесам внедрять ИИ быстро и эффективно.
Выстраиваю стабильную и быструю систему инференса языковых моделей — от базового запуска до продакшн-интеграции. Настраиваю vLLM или SGLang в зависимости от задачи. Работаю с локальными кластерами и облаками.
Выстраиваю стабильную и быструю систему инференса языковых моделей — от базового запуска до продакшн-интеграции. Настраиваю vLLM или SGLang в зависимости от задачи: vLLM — для скоростного батчинга и масштабируемости, SGLang — для мультихостовых запусков со сложной логикой. Работаю как с локальными кластерами, так и с облачной инфраструктурой клиента (Kubernetes, bare metal, виртуалки).
Что получает клиент:
Как работаем: обсуждаем требования, выбираем стек, настраиваю всё под ключ — от загрузки модели до мониторинга инференса. Возможна последующая поддержка и оптимизация.
Помогаю запустить дообучение языковой модели на приватных данных клиента — в Nebius, AWS и других облаках. Подбираю подход к обучению, провожу оценку качества, интегрирую результат.
Помогаю запустить дообучение языковой модели на приватных данных клиента — быстро, безопасно и без лишней головной боли. Работаю с облачными платформами вроде Nebius и AWS. Подбираю нужный тип дообучения: full fine-tuning, LoRA, QLoRA или prompt tuning — в зависимости от задачи и бюджета.
Что получает клиент:
Как работаем: клиент даёт данные и задачу, я организую пайплайн: от предобработки до обучения, проверки и вывода результата. Возможна интеграция модели в конечное приложение.
Создаю агента, который действует: собирает данные, обрабатывает информацию, вызывает API. Это может быть бизнес-ассистент, бот для анализа или генерации текстов и SQL-запросов.
Создаю мультитул на базе LLM — с цепочками действий, внешними вызовами, памятью, доступом к API и базам данных. Это может быть ассистент для менеджера, бот для аналитики или LLM, которая сама пишет отчёты и генерирует SQL.
Что получает клиент:
Как работаем: начинаем с обсуждения задач, далее строю MVP агента, тестируем на кейсах, дорабатываем и внедряем. Поддержка и донастройка по необходимости.