RAG_helper

Author	SHA1	Message	Date
AR 15 M4	52b46bc53e	feat(sprint6c+sprint7): терминология, сверка примеров с кодом, мульти-RAG (часть A) Спринт 6c — терминология и сверка документации с реальным кодом: - Словарь терминов в static/docs.html: «маршрутизатор» вместо «роутер», «защитное условие» вместо «guard», «пошаговая ветка» вместо «многошаговая». Разделены концепты «намерение» (intent) и «ветка» (branch) с пометкой, что в коде они хранятся как одна сущность 1:1. - Песочница: «Решение маршрутизатора» виден всегда (зелёный/жёлтый), счётчик переключений «N из 3» отдельной плашкой, бейджи под словарь. - Настройки: «Условия перехода» → «Защитные условия (guards, JSON)». - GRAPH_ARCHITECTURE_v4.md: имена полей thread_state и слоты приведены к реальной БД (db/models/thread_state.py) и таксономии промптов шагов (prompts/intents/new_booking/steps/). Ссылки на _v2 примеры. На v3 поставлена шапка «устарело». - 4 примера переписаны как _v2: реальные current_intent_code/ current_step_code/slots_json, реальные allowed_next без двойных переходов, реальная таксономия слотов name/reason/specialist/preferred_time/confirmed. Удалены вымышленные CRM tool calls и слоты, которых нет в коде. - static/example.html — параметризованная страница с навигацией между 4 примерами; роут GET /api/docs/examples/{name} в main.py отдаёт markdown без дублирования файлов. - Редактирование документов в Отладке: GET/PUT /documents/{id}/raw, textarea с переразметкой и обновлением Chroma при сохранении. Спринт 7, часть A — мульти-RAG через подписку ветка↔документы: - Миграция: таблица intent_documents (M:N), модель IntentDocument, индекс по document_id для обратного поиска. - API: GET/PUT /intents/{code}/documents и GET/PUT /documents/{id}/intents с PUT-семантикой «полный список», атомарно. Сервис services/intent_document_service.py. - Retrieval-фильтр в chat_service: подтягивает document_ids активной ветки и передаёт в vectorstore.query(). Дефолт пустой подписки — document_ids=[] (= 0 чанков), не «вся коллекция»: пустая подписка означает «ветка не настроена», подмешивать случайное хуже, чем ничего. vectorstore.query() различает None (нет фильтра) и [] (0). - UI Настроек: блок «Документы базы знаний» в правом сайдбаре, всегда видим независимо от вкладки, сортировка по имени, счётчик «N из M», PUT при сохранении. - UI Отладки: третья кнопка «привязка» рядом с «удалить» — раскрывашка со списком веток (галочки), быстрая привязка прямо на странице загрузки. - Песочница: блок «Срез RAG» с подпиской/найдено, ворнинг при пустой подписке. Поле rag_subscription в QueryResponse и ChatResponse. - Системный промпт страницы Отладки переехал в обычную ветку _debug («Страница отладки»). Удалён prompts/system_prompt.md и логика DEFAULT_SYSTEM_PROMPT в llm_client. routers/query.py подтягивает активный конфиг ветки _debug и её подписки. Дефолт пустой подписки для _debug — None (вся коллекция), не [] как для пациентских — чтобы Отладка работала «из коробки». На странице Отладки info-bar показывает активную версию и счётчик подписок, ссылка → Настройки. - Тест-блок «Тест-вопрос» в центре Настроек: расширил /query параметрами intent_code (default _debug), system_prompt (override для теста черновика из textarea), disable_rag (для _router). Редактор промпта обёрнут в <details open> — можно свернуть до одной строки. Под ним — три колонки результата (RAG / промпт / ответ). Для _router показывается подсказка про отсутствие RAG. Документы: - data/datasets/*.md — наработки по 6 веткам (рабочие материалы оператора). - docs/BRANCH_MAP_AND_PROMPTS_v1.md, docs/OPTIMIZATION_CONVERSION_v1.md, docs/guides/state_machine_and_slots.md. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-27 20:00:44 +05:00
AR 15 M4	9eef2dab3a	feat(sprint6a): блок A — structured output, intent_steps, sticky-удержание Заменили строковый тег [STATE: ...] из Спринта 5 на структурированный выход ветки в виде JSON-блока в хвосте ответа: {state_after, slots_updated}, парсимый балансировкой скобок. Шаги state machine вынесены из монолитного промпта в таблицу intent_steps (intent_id FK, code, name, order_index, system_prompt, allowed_next JSON, guards JSON) и редактируются через UI. Валидатор переходов сверяет state_after с allowed_next и блокирует невалидные прыжки. Базовый промпт new_booking разбит на base + 6 файлов шагов (intro/qualify/ present/offer_time/book/close), которые сидятся при старте через ensure_seed_steps. В chat_service промпт собирается как base + step + блок [ТЕКУЩЕЕ СОСТОЯНИЕ]. Попутно реализован мини-блок G (sticky state machine): когда диалог идёт по sm-ветке и роутер на новой реплике предлагает другую — state НЕ сбрасывается, в системный промпт ветки подаётся блок [ПОДСКАЗКА РОУТЕРА], LLM сама решает (STATE_JSON или INTENT_CHANGE). Это сняло ключевую дыру Спринта 5: «Меня зовут Алексей» / «болит ухо» внутри записи больше не сбрасывают сценарий. Промпт ветки new_booking ужесточён: бытовые жалобы — это повод записи (слот reason + сочувствие), не повод уводить в medical_question. Шаг present теперь использует reason в формулировке. Промпт _router расширен живыми примерами для всех 6 веток, особенно для reschedule («не смогу подойти», «перенесите»). Надёжность внешнего LLM: - ретрай в LLMClient с паузой 500 мс + новое исключение LLMUnavailableError; - ретрай в RouterClient (DeepSeek периодически моргает); - /chat при ошибке делает session.rollback() и возвращает 503 с понятным сообщением — больше не остаётся «диалогов-призраков» с одной репликой; - UI убирает свой пузырь и возвращает текст в поле ввода для повторной отправки. UI «Настройки» — добавлена вкладка «Шаги» для веток с state machine: список шагов chip-ами, редактор промпта/имени/allowed_next/guards, сохранение через PATCH /intents/{code}/steps/{step_code} без версионирования. Иконка ⓘ возле поля «Правила» открывает popover с пояснением, что туда писать. UI «Песочница»: - блок «Состояние диалога» показывает имя шага из intent_steps (а не сырое число), для не-sm-веток пишется «без пошагового сценария»; - подсветка illegal-переходов (валидатор отклонил state_after) и parse_error для sm-веток; - блок «Решение роутера» развёрнут в три исхода: «попал в ту же ветку» / «удержались в ветке» / «ветка сама передала управление через INTENT_CHANGE»; - секция «Найденные фрагменты» сворачивается, карточки чанков раскрываются по клику — правый сайдбар стал компактнее. Терминология (по договорённости — простой русский в UI): - «тред» → «диалог» в текстах для оператора (в коде/API thread_id оставлен); - «sticky state machine» → «удержались в ветке»; - «state machine» → «пошаговый сценарий» в видимых местах. SPRINTS.md: блок G в Спринте 6b сокращён — sticky-логика уже сделана здесь, осталась только вторая линия (передача thread_state в системный промпт самого роутера для ещё более точной первичной классификации). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 11:45:42 +05:00
AR 15 M4	4e45b8b181	feat(sprint2.5): логи, вынесение системного промпта, markdown-рендер Три подряд доработки по плану Спринта 2.5. 1) Логи. Проблема: uvicorn ставит handlers на root-logger до того, как отработает наш lifespan, поэтому logging.basicConfig там был no-op, и logger.exception ничего не писал. Переносим basicConfig на уровень импорта main.py с force=True — наш StreamHandler перебивает uvicorn-овский root, остальные логгеры (uvicorn.access, uvicorn.error, alembic, chromadb) остаются со своими форматами. В lifespan basicConfig больше не зовётся. 2) Системный промпт вынесен из services/llm_client.py в prompts/system_prompt.md. LLMClient читает файл при импорте модуля через _load_system_prompt(); если файла нет — пустая строка + warning. Это задел под Спринт 3, где промпт будет редактируемым и версионируемым — физически положить его как файл дешевле, чем держать в исходниках. 3) Markdown в ответах ассистента. Подключены marked и DOMPurify с CDN в sandbox.html. Рендер через renderMd(text): marked.parse + DOMPurify.sanitize — защищает от <script> на случай, если LLM вернёт сырой HTML. Реплики пациента остаются plain text (esc). Добавлены стили для p/ul/ol/code/pre/a/h1-h3/blockquote внутри .msg.assistant, чтобы всё выглядело уместно в пузыре. Обёртка msg-body введена, чтобы разделить контент и msg-meta. План в SPRINTS.md уточнён по переиндексации — будет отдельный endpoint. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:53:01 +05:00
AR 15 M4	3c2657ab99	feat(sprint2): диалог с памятью треда — POST /chat + CRUD тредов Второй кусок Спринта 2: агент теперь помнит контекст. RAG-retrieval делается по последней реплике пациента, в LLM уходит системный промпт + последние 20 сообщений треда + новая реплика + найденные фрагменты. Backend: - services/chat_service: send_message — создаёт тред при необходимости (auto-имя из первой реплики + UTC-дата), сохраняет user-реплику до вызова LLM (чтобы не потерять при сбое), делает retrieval, грузит историю треда (desc/limit 20 → reversed для хронологии), зовёт llm.chat, сохраняет ответ ассистента вместе с sources_json и assembled_prompt, обновляет thread.updated_at. Плюс list_threads с JOIN-выборкой превью первой реплики и счётчика сообщений, get_thread_detail через selectinload, rename_thread, delete_thread (CASCADE на FK делает уборку сообщений автоматически, но explicit delete оставлен для подсчёта удалённых). - services/llm_client.chat: принимает history=[{role, content}, ...], собирает messages = [system, ...history, user-с-RAG]; assembled_prompt дампит всю цепочку в виде [SYSTEM]/[USER]/[ASSISTANT]-блоков для отображения в Debug UI. - routers/chat: POST /chat, обрабатывает LookupError → 404. - routers/threads: GET /threads, GET /threads/{id}, PATCH /threads/{id} (переименовать), DELETE /threads/{id}. - models: ChatRequest, ThreadRenameRequest; ChatResponse, ThreadInfo, ThreadListResponse, ThreadDetailResponse, MessageInfo, ThreadDeleteResponse. Запуск: - В lifespan main.py: автоматический alembic upgrade head через asyncio.to_thread (сам alembic делает asyncio.run внутри, его нельзя звать из уже работающего event loop). LLMClient инициализируется один раз при старте — вместо создания на каждый запрос. E2E проверено: новый тред → агент отвечает и просит представиться; вторая реплика в том же треде — агент помнит контекст; PATCH переименовывает; DELETE удаляет тред с каскадом на сообщения. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:11:59 +05:00
AR 15 M4	a7f78d71b2	feat: Спринт 1 — RAG-ядро, загрузка wiki и Debug UI FastAPI + ChromaDB + E5-large + DeepSeek по паттерну work-pcs-dr-cdss, адаптированному под пациентский контекст: - services: embeddings (E5-large с префиксами), vectorstore (коллекция operators_wiki), document_processor (PDF/DOCX/TXT/MD + чанкер с FAQ- паттерном под wiki), llm_client (системный промпт ассистента клиники), rag_pipeline (одиночный вопрос → retrieval → ответ). - routers: /health, /documents (upload, list, chunks, delete), /query. - static/index.html: шапка со статусом, блок базы знаний с раскрытием чанков по клику, блок тест-вопроса с 3-колоночным ответом (чанки со score / собранный промпт / ответ LLM). - Порт 8003 (8001 занят CDSS, 8002 — voicenote). E2E проверен: загрузка wiki_test.md → 2 чанка, вопрос «как записать ребёнка к лору?» → top score 84.8%, корректный ответ DeepSeek. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-22 14:57:34 +05:00

5 Commits