RAG_helper

Author	SHA1	Message	Date
AR 15 M4	dc9538027c	chore(data): чистка датасетов под чанкер v2 + кейсы регрессии 4 веток - data/datasets/*.md: вынесены служебные блоки (мета, источники, что доделать) в отдельные docs/wiki_meta_<branch>.md по конвенции ТЗ 8.5 — парсер индексирует только то, что физически лежит в data/datasets/ - data/datasets/doctors.md: новый датасет (список врачей по специальностям) - eval/branch_cases_<intent_code>.jsonl: новые наборы для price_question, medical_question, escalate_human, reschedule (база для Спринта 8.6) - eval/branch_cases_general_info.jsonl: точечная правка кейсов Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-04 10:04:07 +05:00
AR 15 M4	bb5e3f5eb3	feat(sprint8b): регрессия ответов веток · general_info + фикс PRAGMA foreign_keys Параллель к 8a, но проверяем не код intent от роутера, а содержимое ответа конкретной ветки на одиночную реплику. Старт — general_info, 46 кейсов. Логика pass/fail (для одного кейса): - A — RAG-секция: среди retrieved-чанков есть кусок с section == expected_doc_section (точное совпадение). Если поле не задано — пропускаем. - B — keywords: обязательные expected_keywords встречаются в predicted_answer (case-insensitive). По умолчанию все; поддерживаются keywords_min: N и keywords_any: true. Запрещённые expected_must_not — ни одного. - Pass = A ∧ B. Незаданные поля не проверяются. - Кэш: (text_hash, branch_config_id) → {answer_text, retrieved_sections}. Привязан к версии промпта ветки. Смена версии = пустой кэш = свежий прогон. Правка JSONL без изменения text → pass/fail пересчитывается без LLM. Backend: - Таблицы eval_branch_runs / eval_branch_run_cases / eval_branch_predictions. Миграция m9g1f7e89j56. - services/eval_branch_run_service.py: загрузка JSONL, фоновый прогон через asyncio.create_task, кэш, оценка A+B с поддержкой keywords_min/keywords_any. - chat_service.run_branch_single_turn — изолированный single-turn без роутера и треда (использует существующий config_service + vectorstore + llm). - API: POST /eval/branch-runs, GET /eval/branch-runs?intent_code=, GET /eval/branch-runs/{id}, GET /eval/branch-cases-with-status?intent_code=. UI (static/regression.html): - Селектор режима «Роутер / Ветка · general_info». Логика пикера переиспользуется (фильтры, диапазон, массовый выбор, счётчик «новые / в кэше»). - Для режима «Ветка»: фильтр по coverage, колонки секция/coverage, keywords, частота, кэш. Drill-down прогона: ожидание, retrieved-секции, причины fail, полный ответ ветки. База кейсов (eval/branch_cases_general_info.jsonl) — от пользователя, 46 кейсов по схеме {text, intent, coverage, expected_doc_section?, expected_keywords?, expected_must_not?, keywords_min?, keywords_any?, count?, note?}. Связанная правка SQLite (нашли при удалении документа в этом спринте): - db/session.py: connect-listener PRAGMA foreign_keys=ON на каждое подключение. Без этого ondelete=CASCADE в SQLite не enforced, и удаление документа оставляло подписки в intent_documents висячими (что давало пустой RAG и fail регрессии). - Миграция n0h2g8f9a0k67 — одноразовая чистка существующих висячих подписок. docs/SPRINTS.md: Спринт 8b → ✅ Закрыт. Diff vs предыдущий прогон для веток и кнопка «Сбросить кэш регрессии» вынесены в docs/BACKLOG.md. Также включены обновлённые data/datasets/general_info.md и price_question.md (рабочий материал оператора), и черновик eval/branch_cases_price_question.jsonl для следующего захода (8b на price_question). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-03 01:20:59 +05:00
AR 15 M4	60f8a7b398	feat(sprint7.6): оптимизация воронки new_booking до 4 шагов (вариант 2) Воронка сжата с 6 шагов до 4: intro → qualify → book → close. Спецификация: docs/OPTIMIZATION_CONVERSION_v1.md. Цель: сравнимая с конкурентом (NEXTBOT/Александра) конверсия — ≤3 реплик бота до запроса телефона, содержательный ответ на жалобу в первом осмысленном сообщении. Промпты шагов: - intro.md — переписан. Приветствие + открытый вопрос «что беспокоит?». Имя НЕ спрашиваем (слот name со шага снят), оно собирается на book вместе с телефоном. Если пациент сразу написал жалобу — не зацикливаемся, переходим в qualify. - qualify.md — переписан. Обязательный 5-пунктовый шаблон ответа на жалобу: эмпатия (одна фраза) → 2-3 ЛОР-гипотезы из RAG-выдержек («может быть связано с») → специалист → услуга/цена («при необходимости назначит») → бинарный CTA «записать?». Если в выдержках нет гипотез/цен — пункт пропускается, не сочиняем. Если жалоба не описана (пациент сразу «хочу записаться к ЛОРу») — пропускаем гипотезу/услугу, оставляем эмпатию-формальность + специалист + CTA. Три особые ситуации сохранены: ребёнок (require_legal_rep), конкретный врач (waitlist_flag), первичная жалоба на слух (needs_surgologist_first). - book.md — переписан. Одной репликой: подтверждение плана с использованием {specialist}/{reason} + запрос телефона + имени (если ещё не было в истории). При is_child=true — обращение к родителю, legal_rep_phone используется, если уже собран. - present.md — DEPRECATED. Файл оставлен в репо на случай отката (вариант 1 спецификации). Внутри — заглушка «попал по ошибке — выходи на book». - close.md и offer_time.md не тронуты (offer_time станет актуален с реальным календарём). allowed_next в SEED_INTENT_STEPS: - intro: [intro, qualify] (без изменений) - qualify: [qualify, book] (раньше: [qualify, present]) - present: [book] (изоляция; раньше: [present, qualify, offer_time]) - offer_time: [offer_time, book] (deprecated, без изменений) - book: [book, qualify, close] (раньше: [book, qualify, offer_time, close]) - close: [close] (без изменений) migrate_new_booking_allowed_next_v2(session) — одноразовая миграция в services/intent_step_service.py. При старте для каждого шага new_booking сравнивает текущий allowed_next_json с дореформенным значением (_PRE_SPRINT_7_6_ALLOWED_NEXT). Если совпадает — обновляет на новое из SEED. Если оператор правил вручную — пропускает, warning в лог. Идемпотентна (на повторных запусках ничего не делает). Подключена в main.py lifespan после ensure_seed_guards. Защитное условие require_legal_rep на qualify сохранено. Теперь блокирует переход qualify → book (раньше qualify → present). Логика та же: при is_child=true и пустых legal_rep_name/legal_rep_phone валидатор отклоняет переход. eval/MANUAL_CASES.md — markdown-чеклист для ручных прогонов: - §A: 5 конверсионных кейсов (храп+уши, боль в горле, тугоухость, насморк >месяца, звон в ушах) с чеклистом 5 пунктов на первый ответ и проверкой ≤3 реплик до телефона. - §B: регрессия 8 ручных сценариев из блока H Спринта 6b со ссылками на docs/examples/*_v2.md. SPRINTS.md: Спринт 7.6 → ✅ Закрыт по коду. Применение промптов в БД и ручная регрессия — за оператором (через UI «Настройки → Шаги» для каждого из 4 шагов new_booking). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 21:04:09 +05:00
AR 15 M4	74befa484d	feat(sprint7.5): обновление промптов 4 веток + eval-каркас и тест-кейсы в UI Настроек Промпты веток (по docs/BRANCH_MAP_AND_PROMPTS_v1.md): - reschedule.md — полная замена. Одношаговый сценарий из 6 пунктов: action (cancel/reschedule), patient_name, patient_phone, original_time, preferred_new_time. Слоты хранит вызывающая система, STATE_JSON не используется. - price_question.md — добавлены 3 пункта: эндоскопия 1000₽ при первичном ЛОР-приёме, лечебные процедуры доплачиваются, ОМС только сурдолог (последний пункт работает только при подтверждении в базе). - medical_question.md — расширена карта жалоб → специалист (ЛОР / сурдолог / аллерголог / иммунолог / пульмонолог); добавлен пункт про беременность, онкологию, психиатрию — мягко сказать «специализированная клиника», не предлагать запись. - general_info.md — добавлены разделы «Отзывы и социальное доказательство», «Преимущества клиники», «Сокращения». Условия выхода расширены до 5 интентов. escalate_human и new_booking не трогаем (escalate — карта говорит «не менять»; new_booking — отдельный Спринт 7.6 по docs/OPTIMIZATION_CONVERSION_v1.md). Применение в БД — вручную через UI «Настройки» (вариант A): оператор копирует текст из .md, сохраняет как новую версию + активирует. Файлы — только seed. Eval-каркас (заготовка под Спринт 8): - eval/router_cases_booking.jsonl (875 кейсов new_booking) и eval/router_cases_other.jsonl (698 кейсов: general_info 295, price 165, escalate 139, medical 59, reschedule 40). CSV-исходники рядом. - eval/README.md — формат, глоссарий, что это и зачем. - routers/eval.py: GET /eval/router-cases?intent_code=...&limit=... Lazy-кэш, сортировка по count desc, фильтр по expected_intent. UI Настроек — выбор готового кейса в тест-блоке: - Полоса «Готовый кейс:» с datalist (поиск по началу строки) + кнопка «🎲 Случайный» + счётчик кейсов для активной ветки. - При выборе — текст подставляется в textarea вопроса. - Загружается при выборе ветки. Если кейсов 0 (для _router, _debug) — скрыто. - Полная подсистема прогона (run.py, отчёты, baseline) — Спринт 8. SPRINTS.md: - Спринт 7 (мульти-RAG, часть A) → ✅ Закрыт (коммит `52b46bc`). - Заведён Спринт 7.5 «Обновление промптов 4 веток» (этот спринт). - Заведён Спринт 7.6 «Оптимизация воронки new_booking до 4 шагов» по OPTIMIZATION_CONVERSION_v1.md. - В идеи на потом: сквозные правила всех веток (BRANCH_MAP §2), отложенная документация Спринта 7 (docs.html карточка термина, GRAPH_ARCHITECTURE_v5, README про мульти-RAG). Также: docs/COMPETITOR_ALEXANDRA_top100.md — рабочие материалы пользователя по конкурентному боту (NEXTBOT/Александра), используется как baseline для оптимизации воронки в Спринте 7.6. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-28 20:49:02 +05:00

4 Commits