RAG системы: от теории к продакшену
Этот курс посвящён созданию систем генерации с дополнением извлечёнными данными (РАГ) — надёжного подхода, который соединяет сильные стороны семантического поиска и больших языковых моделей. Мы проходим весь путь: от понимания архитектуры и проектирования пайплайна до развёртывания в продакшене с учётом …
Overview
Этот курс посвящён созданию систем генерации с дополнением извлечёнными данными (РАГ) — надёжного подхода, который соединяет сильные стороны семантического поиска и больших языковых моделей. Мы проходим весь путь: от понимания архитектуры и проектирования пайплайна до развёртывания в продакшене с учётом производительности, стоимости, безопасности и наблюдаемости. Курс построен практично: вы разберёте реальные паттерны, научитесь выбирать инструменты и принимать инженерные решения, которые работают в боевых условиях.
Для кого
- Инженеры машинного обучения и практики искусственного интеллекта, которым нужен устойчивый к галлюцинациям подход для приложений, зависящих от знаний.
- Бэкэнд‑разработчики, создающие интеллектуальные сервисы и интеграции с моделями на стороне сервера.
- Энтерпрайз‑разработчики и исследователи, реализующие системы с расширенным поиском и корпоративной безопасностью.
- Профессионалы, которым требуется извлекать ценность из больших массивов документов, систем вопросов‑ответов и корпоративных баз знаний.
Что вы получите
- Чёткое понимание архитектуры РАГ и её места среди альтернатив: дообучение и контекстное обучение.
- Навыки интеграции больших языковых моделей: проектирование подсказок, управление температурой, окнами контекста и затратами по токенам.
- Глубокое понимание семантического и ключевого поиска: плотные и разрежённые методы, БМ25, переранжирование, гибридные стратегии.
- Умение работать с эмбеддингами и векторными базами данных: выбор моделей, метрик сходства, индексов и стратегий масштабирования.
- Практические техники чанкирования: фиксированное, с перекрытием и семантическое, а также обработка сложных форматов документов, включая мультимодальные.
- Стандартизированная оценка РАГ‑систем: стенды, метрики качества извлечения и ответа, анализ ошибок, сбор обратной связи.
- Производственные практики: архитектура на масштабе, кэширование на разных уровнях, экономия токенов, мониторинг и наблюдаемость, безопасность и приватность.
Почему это важно
РАГ позволяет строить приложения, которые опираются на проверяемые источники, уменьшают риск галлюцинаций и быстрее адаптируются к меняющимся данным. Это делает подход особенно подходящим для корпоративных чат‑ботов, систем вопросов‑ответов, анализа документов, поддержки сотрудников и клиентов. В отличие от полного дообучения моделей, РАГ снижает стоимость владения и ускоряет обновление знаний: достаточно переиндексировать документы и поддерживать эффективный поиск.
Предварительные требования
- Опыт разработки на Питоне и базовое понимание машинного обучения.
- Желателен опыт бэкэнда и работы с базами данных, очередями и контейнерами.
Curriculum
- 9 Sections
- 65 Lessons
- Lifetime
- 1. Основы РАГ и архитектура9
- 1.1JPYS 1.1 Что такое генерация с дополнением извлечёнными данными и зачем она нужна
- 1.2JPYS 1.2 РАГ против дообучения и контекстного обучения
- 1.3JPYS 1.3 Компоненты и рабочий процесс пайплайна РАГ
- 1.4JPYS 1.4 Галлюцинации больших моделей и как РАГ снижает риск
- 1.5JPYS 1.5 Практические применения РАГ в бизнесе
- 1.6JPYS 1.6 Метрики оценки РАГ‑систем
- 1.7JPYS 1.7 Строительные блоки современных РАГ‑систем
- 1.8JPYS 1.8 Фреймворки и инструменты для РАГ
- 1.101JPYS 1. Квиз3 Questions
- 2. Основы больших языковых моделей9
- 2.1JPYS 2.1 Базовое устройство: трансформеры и механизм внимания
- 2.2JPYS 2.2 Популярные модели: ДжиПиТи, Клод, Ллама — сравнение
- 2.3JPYS 2.3 Токенизация и практические ограничения по токенам
- 2.4JPYS 2.4 Контекстные окна и ограничения памяти
- 2.5JPYS 2.5 Основы проектирования подсказок для РАГ
- 2.6JPYS 2.6 Подсказки с малым числом примеров и контекстное обучение
- 2.7JPYS 2.7 Выбор температуры и контроль детерминизма вывода
- 2.8JPYS 2.8 Интеграция с провайдерами через прикладные интерфейсы (АПИ)
- 2.101JPYS 2. Квиз3 Questions
- 3. Концепции информационного поиска9
- 3.1JPYS 3.1 Теория информационного поиска: базовые понятия
- 3.2JPYS 3.2 Плотный и разрежённый поиск: подходы
- 3.3JPYS 3.3 БМ25: поиск по ключевым словам
- 3.4JPYS 3.4 Семантический поиск и меры близости смысла
- 3.5JPYS 3.5 Расширение запросов и переформулирование
- 3.6JPYS 3.6 Алгоритмы ранжирования релевантности
- 3.7JPYS 3.7 Фильтрация и переранжирование: стратегии
- 3.8JPYS 3.8 Метрики оценки систем поиска
- 3.101JPYS 3. Квиз3 Questions
- 4. Векторные базы данных и эмбеддинги10
- 4.1JPYS 4.1 Текстовые эмбеддинги и векторные представления
- 4.2JPYS 4.2 Модели эмбеддингов: СентенсТрансформерс и ОпенЭйАй
- 4.3JPYS 4.3 Меры сходства векторов: косинусное, евклидово и другие
- 4.4JPYS 4.4 Архитектура и основы векторных баз данных
- 4.5JPYS 4.5 Популярные векторные базы: Пайнкон, Вивиэйт, Милвус
- 4.6JPYS 4.6 Стратегии индексирования для эффективного поиска
- 4.7JPYS 4.7 Масштабирование векторных БД в продакшене
- 4.8JPYS 4.8 Качество эмбеддингов и выбор размерности
- 4.9JPYS 4.9 Дообучение эмбеддингов под специфичные домены
- 4.101JPYS 4. Квиз3 Questions
- 5. Чанкирование и обработка документов9
- 5.1JPYS 5.1 Предварительная обработка и очистка документов
- 5.2JPYS 5.2 Стратегии чанкирования: фиксированное, с перекрытием, семантическое
- 5.3JPYS 5.3 Оптимизация размера фрагмента и величины перекрытия
- 5.4JPYS 5.4 Извлечение метаданных и обогащение
- 5.5JPYS 5.5 Обработка различных форматов документов
- 5.6JPYS 5.6 Обработка мультимодальных документов
- 5.7JPYS 5.7 Иерархическое чанкирование и индексирование
- 5.8JPYS 5.8 Динамическое чанкирование по содержанию
- 5.101JPYS 5. Квиз3 Questions
- 6. Построение и оценка РАГ‑систем9
- 6.1JPYS 6.1 Реализация РАГ с нуля: сквозной пример
- 6.2JPYS 6.2 Перепись и расширение запросов: техники
- 6.3JPYS 6.3 Управление контекстным окном и конкатенация
- 6.4JPYS 6.4 Генерация ответов с учётом найденного контекста
- 6.5JPYS 6.5 Кэширование: стратегии для производительности
- 6.6JPYS 6.6 Стенды и фреймворки для оценки РАГ
- 6.7JPYS 6.7 Анализ ошибок и отладка РАГ‑систем
- 6.8JPYS 6.8 Сбор обратной связи и оптимизация
- 6.101JPYS 6. Квиз3 Questions
- 7. Продвинутые техники РАГ9
- 7.1JPYS 7.1 Поиск по нескольким документам и междокументное извлечение
- 7.2JPYS 7.2 Диалоговый РАГ с управлением историей
- 7.3JPYS 7.3 Гибридный поиск: сочетание плотного и разрежённого
- 7.4JPYS 7.4 Маршрутизация запросов и агентный поиск
- 7.5JPYS 7.5 Рекурсивные и иерархические паттерны поиска
- 7.6JPYS 7.6 Интеграция графов знаний с РАГ
- 7.7JPYS 7.7 Мультимодальный РАГ: изображения и документы
- 7.8JPYS 7.8 Индексирование в реальном времени и потоковые обновления
- 7.101JPYS 7. Квиз3 Questions
- 8. Развёртывание и оптимизация в продакшене9
- 8.1JPYS 8.1 Архитектура РАГ‑систем на масштабе
- 8.2JPYS 8.2 Проектирование прикладного интерфейса для РАГ‑приложений
- 8.3JPYS 8.3 Оптимизация задержки и многоуровневое кэширование
- 8.4JPYS 8.4 Оптимизация стоимости и экономия токенов
- 8.5JPYS 8.5 Мониторинг и наблюдаемость для РАГ
- 8.6JPYS 8.6 Безопасность и приватность данных: практики
- 8.7JPYS 8.7 Эксперименты А/Б и непрерывное улучшение
- 8.8JPYS 8.8 Стратегии развёртывания: Докер, Кубернетес, бессерверные
- 8.101JPYS 8. Квиз3 Questions
- JPYS Финальный квиз1







