RAG системы: от теории к продакшену

Overview

Этот курс посвящён созданию систем генерации с дополнением извлечёнными данными (РАГ) — надёжного подхода, который соединяет сильные стороны семантического поиска и больших языковых моделей. Мы проходим весь путь: от понимания архитектуры и проектирования пайплайна до развёртывания в продакшене с учётом производительности, стоимости, безопасности и наблюдаемости. Курс построен практично: вы разберёте реальные паттерны, научитесь выбирать инструменты и принимать инженерные решения, которые работают в боевых условиях.

Для кого

Инженеры машинного обучения и практики искусственного интеллекта, которым нужен устойчивый к галлюцинациям подход для приложений, зависящих от знаний.
Бэкэнд‑разработчики, создающие интеллектуальные сервисы и интеграции с моделями на стороне сервера.
Энтерпрайз‑разработчики и исследователи, реализующие системы с расширенным поиском и корпоративной безопасностью.
Профессионалы, которым требуется извлекать ценность из больших массивов документов, систем вопросов‑ответов и корпоративных баз знаний.

Что вы получите

Чёткое понимание архитектуры РАГ и её места среди альтернатив: дообучение и контекстное обучение.
Навыки интеграции больших языковых моделей: проектирование подсказок, управление температурой, окнами контекста и затратами по токенам.
Глубокое понимание семантического и ключевого поиска: плотные и разрежённые методы, БМ25, переранжирование, гибридные стратегии.
Умение работать с эмбеддингами и векторными базами данных: выбор моделей, метрик сходства, индексов и стратегий масштабирования.
Практические техники чанкирования: фиксированное, с перекрытием и семантическое, а также обработка сложных форматов документов, включая мультимодальные.
Стандартизированная оценка РАГ‑систем: стенды, метрики качества извлечения и ответа, анализ ошибок, сбор обратной связи.
Производственные практики: архитектура на масштабе, кэширование на разных уровнях, экономия токенов, мониторинг и наблюдаемость, безопасность и приватность.

Почему это важно

РАГ позволяет строить приложения, которые опираются на проверяемые источники, уменьшают риск галлюцинаций и быстрее адаптируются к меняющимся данным. Это делает подход особенно подходящим для корпоративных чат‑ботов, систем вопросов‑ответов, анализа документов, поддержки сотрудников и клиентов. В отличие от полного дообучения моделей, РАГ снижает стоимость владения и ускоряет обновление знаний: достаточно переиндексировать документы и поддерживать эффективный поиск.

Предварительные требования

Опыт разработки на Питоне и базовое понимание машинного обучения.
Желателен опыт бэкэнда и работы с базами данных, очередями и контейнерами.

Curriculum

9 Sections
65 Lessons
Lifetime

Expand all sectionsCollapse all sections

Instructor

Pavel Salovskii

I lead a team of Data Science and Software Engineers, driving technical architecture and management for various AI, ML, and Big Data products. I have over 17 years of experience.
I am passionate about applying AI and ML solutions to different domains and industries, such as Medical Science, Finance, LegalTech, and MedTech. I have successfully developed and launched a Medical Science Big Data product on the Cloud platform, using video analytic techniques and image processing algorithms. I have also developed an innovative ML model based on GPT technology for the Board of Members AI-Copilot and built several Big Data products for Lead Generation and Risk Scoring. My mission is to create value and impact through AI and ML and to empower my team and clients with the latest technologies and methodologies such as Generative AI.