Files
RAG_helper/docs/wiki_meta_new_booking.md
AR 15 M4 dc9538027c chore(data): чистка датасетов под чанкер v2 + кейсы регрессии 4 веток
- data/datasets/*.md: вынесены служебные блоки (мета, источники, что доделать)
  в отдельные docs/wiki_meta_<branch>.md по конвенции ТЗ 8.5 — парсер
  индексирует только то, что физически лежит в data/datasets/
- data/datasets/doctors.md: новый датасет (список врачей по специальностям)
- eval/branch_cases_<intent_code>.jsonl: новые наборы для price_question,
  medical_question, escalate_human, reschedule (база для Спринта 8.6)
- eval/branch_cases_general_info.jsonl: точечная правка кейсов

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-04 10:04:07 +05:00

61 lines
8.4 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
purpose: Рабочие пометки редактора по содержимому датасета ветки записи. НЕ для индексации в РАГ.
moved_from: data/datasets/new_booking.md (вынесены 2026-05-03 — служебные H1-секции попадали в индекс наравне с шагами воронки и засоряли retrieved).
audience: Аксей (разработка), Наталья (наполнение вики).
---
# Источники и история файла new_booking.md
## Источники выгрузки (Yandex Wiki)
- homepage/sluzhba-administratorov/obshhaja-informacija/struktura-kliniki/*
- homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/lor-otorinolarintolog/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/allergolog-immunolog/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/pulmonolog/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/otonevrolog/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/surdrlog/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/foniatr/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/klinika-doktora-pirogova/*
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md
## Внутренние источники
- `docs/OPTIMIZATION_CONVERSION_v1.md` — ТЗ по оптимизации воронки. Воронка после оптимизации: `intro → qualify → book → close` (4 шага, вариант 2 блока C).
## История изменений
- **2026-05-03**: вынесены YAML-frontmatter и три служебных H1-блока («Что нужно сверить и дополнить», «Что НЕ должно попадать в датасет ветки», «Источники и приоритет»). Они попадали в индекс наравне с шагами воронки и могли вытеснять реальный контент.
# Что нужно сверить и дополнить (рабочие пометки)
- **Цена приёма Ворончихиной Н. В.** В разделе «Особенности записи к отоневрологу» — 4100/2750 руб. В скриптах записи (старый сводный документ) фигурировало 4300 руб. Сверить с актуальным прайсом перед запуском ветки в продакшен.
- **Цена приёма Ивановой А. А.** Аналогично — 3000 руб. в особенностях vs 3200 руб. в скриптах. Расхождение источников.
- **Цена приёма аллерголога Чепиковой Е. Н.** В таблице первичных времён указан её слот, но Чепикова в декрете — пометка о её недоступности должна транслироваться пациенту.
- **Возрастные границы для детей у каждого врача.** Сейчас известны только некоторые: Семерикова Н. А. — с 0 лет, Макарова Л. Г. — с 7 лет, Анфилатов А. В. — с 2 лет, Абыденков А. В. — с 2 лет, Ворончихина Н. В. — с 4 лет, ЛОР-телемед в Пирогове — с 3–4 лет. Для остальных врачей нужна явная пометка в вики.
- **Покрытие жалоб.** ТЗ оптимизации в блоке B упоминает 5 контрольных кейсов: храп + уши, боль в горле, тугоухость, насморк > месяца, звон в ушах. Все они здесь покрыты. На втором заходе стоит добавить: головокружение у пожилых, кровотечения из носа, голос (для фониатра — отдельно), кашель у ребёнка (для пульмонолога/аллерголога), боль и припухлость лимфоузлов, хроническая боль в ушах у ныряльщиков.
- **Расписание для подбора времени.** Пока реальный календарь не подключён, шаг `book` ограничивается фиксацией предпочтений; когда появится интеграция (см. бэклог Спринта 9), сюда нужно добавить блок «как описывать пациенту окна записи».
- **Стоматология / неврология / офтальмология.** В вики прямых правил «куда отправить» нет. Если пациент пришёл с такой жалобой, бот сейчас деградирует на «обратитесь к профильному специалисту» — это OK, но в идеале — короткий справочник «к кому идти, если не к нам».
# Что НЕ должно попадать в датасет ветки `new_booking`
Эти материалы есть в выгрузке вики, но в этот файл вошли в виде агрегатов или не вошли вовсе:
- Внутренние добавочные номера сотрудников и врачей (`kontakty-kliniki.md`) — служебная информация для администраторов; в реплики ассистента пациенту не выводится.
- Логины и пароли (`akkaunty.md`) — не должны попадать ни в один датасет.
- Полные скрипты записи операторов клиники (страницы `skript-zapisi-...`). Они — не источник для ассистента: ТЗ оптимизации явно меняет логику первого ответа («гипотеза + специалист + услуга + цена + CTA» вместо «представься-узнай-имя-уточни-повод-...»). Если ассистент будет копировать эти скрипты, он откатится к 6 шагам и медленной воронке.
- Цены на операции, наркоз, послеоперационное сопровождение, ДМС-логика — это контент ветки `price_question`. В `new_booking` упоминаем только ориентир по приёму и базовой профильной диагностике.
- История клиники, юридические реквизиты, реквизиты для оплаты — контент ветки `general_info`.
- Пакет документов ДМС, 3-сторонние договоры, регламенты Полимеда — операционная логика администраторов.
# Источники и приоритет
При расхождении между инструкциями операторов из вики и нашим ТЗ оптимизации (`docs/OPTIMIZATION_CONVERSION_v1.md`) — приоритет у ТЗ. Конкретно:
- Структура воронки: 4 шага из ТЗ, не 6 из вики/скриптов.
- Содержание `qualify`: 5-пунктовый шаблон из ТЗ, а не «представься-узнай-имя-уточни-повод» из скриптов.
- Сбор имени: на `book` (по ТЗ), а не на `intro` (как в скриптах).
- Содержание соответствующих ЛОР-причин и связок «жалоба → специалист» — из вики (медицинские факты — единственный источник правды).
Прежние «временные» сводные документы для этой ветки больше не источник. После подключения подписки на живую вики они должны быть полностью отвязаны от индекса ветки `new_booking`.