chore(data): чистка датасетов под чанкер v2 + кейсы регрессии 4 веток
- data/datasets/*.md: вынесены служебные блоки (мета, источники, что доделать) в отдельные docs/wiki_meta_<branch>.md по конвенции ТЗ 8.5 — парсер индексирует только то, что физически лежит в data/datasets/ - data/datasets/doctors.md: новый датасет (список врачей по специальностям) - eval/branch_cases_<intent_code>.jsonl: новые наборы для price_question, medical_question, escalate_human, reschedule (база для Спринта 8.6) - eval/branch_cases_general_info.jsonl: точечная правка кейсов Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,60 @@
|
||||
---
|
||||
purpose: Рабочие пометки редактора по содержимому датасета ветки записи. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/new_booking.md (вынесены 2026-05-03 — служебные H1-секции попадали в индекс наравне с шагами воронки и засоряли retrieved).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники и история файла new_booking.md
|
||||
|
||||
## Источники выгрузки (Yandex Wiki)
|
||||
|
||||
- homepage/sluzhba-administratorov/obshhaja-informacija/struktura-kliniki/*
|
||||
- homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/lor-otorinolarintolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/allergolog-immunolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/pulmonolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/otonevrolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/surdrlog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/foniatr/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/klinika-doktora-pirogova/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md
|
||||
|
||||
## Внутренние источники
|
||||
|
||||
- `docs/OPTIMIZATION_CONVERSION_v1.md` — ТЗ по оптимизации воронки. Воронка после оптимизации: `intro → qualify → book → close` (4 шага, вариант 2 блока C).
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-03**: вынесены YAML-frontmatter и три служебных H1-блока («Что нужно сверить и дополнить», «Что НЕ должно попадать в датасет ветки», «Источники и приоритет»). Они попадали в индекс наравне с шагами воронки и могли вытеснять реальный контент.
|
||||
|
||||
# Что нужно сверить и дополнить (рабочие пометки)
|
||||
|
||||
- **Цена приёма Ворончихиной Н. В.** В разделе «Особенности записи к отоневрологу» — 4100/2750 руб. В скриптах записи (старый сводный документ) фигурировало 4300 руб. Сверить с актуальным прайсом перед запуском ветки в продакшен.
|
||||
- **Цена приёма Ивановой А. А.** Аналогично — 3000 руб. в особенностях vs 3200 руб. в скриптах. Расхождение источников.
|
||||
- **Цена приёма аллерголога Чепиковой Е. Н.** В таблице первичных времён указан её слот, но Чепикова в декрете — пометка о её недоступности должна транслироваться пациенту.
|
||||
- **Возрастные границы для детей у каждого врача.** Сейчас известны только некоторые: Семерикова Н. А. — с 0 лет, Макарова Л. Г. — с 7 лет, Анфилатов А. В. — с 2 лет, Абыденков А. В. — с 2 лет, Ворончихина Н. В. — с 4 лет, ЛОР-телемед в Пирогове — с 3–4 лет. Для остальных врачей нужна явная пометка в вики.
|
||||
- **Покрытие жалоб.** ТЗ оптимизации в блоке B упоминает 5 контрольных кейсов: храп + уши, боль в горле, тугоухость, насморк > месяца, звон в ушах. Все они здесь покрыты. На втором заходе стоит добавить: головокружение у пожилых, кровотечения из носа, голос (для фониатра — отдельно), кашель у ребёнка (для пульмонолога/аллерголога), боль и припухлость лимфоузлов, хроническая боль в ушах у ныряльщиков.
|
||||
- **Расписание для подбора времени.** Пока реальный календарь не подключён, шаг `book` ограничивается фиксацией предпочтений; когда появится интеграция (см. бэклог Спринта 9), сюда нужно добавить блок «как описывать пациенту окна записи».
|
||||
- **Стоматология / неврология / офтальмология.** В вики прямых правил «куда отправить» нет. Если пациент пришёл с такой жалобой, бот сейчас деградирует на «обратитесь к профильному специалисту» — это OK, но в идеале — короткий справочник «к кому идти, если не к нам».
|
||||
|
||||
# Что НЕ должно попадать в датасет ветки `new_booking`
|
||||
|
||||
Эти материалы есть в выгрузке вики, но в этот файл вошли в виде агрегатов или не вошли вовсе:
|
||||
|
||||
- Внутренние добавочные номера сотрудников и врачей (`kontakty-kliniki.md`) — служебная информация для администраторов; в реплики ассистента пациенту не выводится.
|
||||
- Логины и пароли (`akkaunty.md`) — не должны попадать ни в один датасет.
|
||||
- Полные скрипты записи операторов клиники (страницы `skript-zapisi-...`). Они — не источник для ассистента: ТЗ оптимизации явно меняет логику первого ответа («гипотеза + специалист + услуга + цена + CTA» вместо «представься-узнай-имя-уточни-повод-...»). Если ассистент будет копировать эти скрипты, он откатится к 6 шагам и медленной воронке.
|
||||
- Цены на операции, наркоз, послеоперационное сопровождение, ДМС-логика — это контент ветки `price_question`. В `new_booking` упоминаем только ориентир по приёму и базовой профильной диагностике.
|
||||
- История клиники, юридические реквизиты, реквизиты для оплаты — контент ветки `general_info`.
|
||||
- Пакет документов ДМС, 3-сторонние договоры, регламенты Полимеда — операционная логика администраторов.
|
||||
|
||||
# Источники и приоритет
|
||||
|
||||
При расхождении между инструкциями операторов из вики и нашим ТЗ оптимизации (`docs/OPTIMIZATION_CONVERSION_v1.md`) — приоритет у ТЗ. Конкретно:
|
||||
|
||||
- Структура воронки: 4 шага из ТЗ, не 6 из вики/скриптов.
|
||||
- Содержание `qualify`: 5-пунктовый шаблон из ТЗ, а не «представься-узнай-имя-уточни-повод» из скриптов.
|
||||
- Сбор имени: на `book` (по ТЗ), а не на `intro` (как в скриптах).
|
||||
- Содержание соответствующих ЛОР-причин и связок «жалоба → специалист» — из вики (медицинские факты — единственный источник правды).
|
||||
|
||||
Прежние «временные» сводные документы для этой ветки больше не источник. После подключения подписки на живую вики они должны быть полностью отвязаны от индекса ветки `new_booking`.
|
||||
Reference in New Issue
Block a user