Files
RAG_helper/docs/wiki_meta_new_booking.md
T
AR 15 M4 dc9538027c chore(data): чистка датасетов под чанкер v2 + кейсы регрессии 4 веток
- data/datasets/*.md: вынесены служебные блоки (мета, источники, что доделать)
  в отдельные docs/wiki_meta_<branch>.md по конвенции ТЗ 8.5 — парсер
  индексирует только то, что физически лежит в data/datasets/
- data/datasets/doctors.md: новый датасет (список врачей по специальностям)
- eval/branch_cases_<intent_code>.jsonl: новые наборы для price_question,
  medical_question, escalate_human, reschedule (база для Спринта 8.6)
- eval/branch_cases_general_info.jsonl: точечная правка кейсов

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-04 10:04:07 +05:00

8.4 KiB
Raw Blame History

purpose, moved_from, audience
purpose moved_from audience
Рабочие пометки редактора по содержимому датасета ветки записи. НЕ для индексации в РАГ. data/datasets/new_booking.md (вынесены 2026-05-03 — служебные H1-секции попадали в индекс наравне с шагами воронки и засоряли retrieved). Аксей (разработка), Наталья (наполнение вики).

Источники и история файла new_booking.md

Источники выгрузки (Yandex Wiki)

  • homepage/sluzhba-administratorov/obshhaja-informacija/struktura-kliniki/*
  • homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/lor-otorinolarintolog/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/allergolog-immunolog/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/pulmonolog/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/otonevrolog/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/surdrlog/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/foniatr/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/klinika-doktora-pirogova/*
  • homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md

Внутренние источники

  • docs/OPTIMIZATION_CONVERSION_v1.md — ТЗ по оптимизации воронки. Воронка после оптимизации: intro → qualify → book → close (4 шага, вариант 2 блока C).

История изменений

  • 2026-05-03: вынесены YAML-frontmatter и три служебных H1-блока («Что нужно сверить и дополнить», «Что НЕ должно попадать в датасет ветки», «Источники и приоритет»). Они попадали в индекс наравне с шагами воронки и могли вытеснять реальный контент.

Что нужно сверить и дополнить (рабочие пометки)

  • Цена приёма Ворончихиной Н. В. В разделе «Особенности записи к отоневрологу» — 4100/2750 руб. В скриптах записи (старый сводный документ) фигурировало 4300 руб. Сверить с актуальным прайсом перед запуском ветки в продакшен.
  • Цена приёма Ивановой А. А. Аналогично — 3000 руб. в особенностях vs 3200 руб. в скриптах. Расхождение источников.
  • Цена приёма аллерголога Чепиковой Е. Н. В таблице первичных времён указан её слот, но Чепикова в декрете — пометка о её недоступности должна транслироваться пациенту.
  • Возрастные границы для детей у каждого врача. Сейчас известны только некоторые: Семерикова Н. А. — с 0 лет, Макарова Л. Г. — с 7 лет, Анфилатов А. В. — с 2 лет, Абыденков А. В. — с 2 лет, Ворончихина Н. В. — с 4 лет, ЛОР-телемед в Пирогове — с 3–4 лет. Для остальных врачей нужна явная пометка в вики.
  • Покрытие жалоб. ТЗ оптимизации в блоке B упоминает 5 контрольных кейсов: храп + уши, боль в горле, тугоухость, насморк > месяца, звон в ушах. Все они здесь покрыты. На втором заходе стоит добавить: головокружение у пожилых, кровотечения из носа, голос (для фониатра — отдельно), кашель у ребёнка (для пульмонолога/аллерголога), боль и припухлость лимфоузлов, хроническая боль в ушах у ныряльщиков.
  • Расписание для подбора времени. Пока реальный календарь не подключён, шаг book ограничивается фиксацией предпочтений; когда появится интеграция (см. бэклог Спринта 9), сюда нужно добавить блок «как описывать пациенту окна записи».
  • Стоматология / неврология / офтальмология. В вики прямых правил «куда отправить» нет. Если пациент пришёл с такой жалобой, бот сейчас деградирует на «обратитесь к профильному специалисту» — это OK, но в идеале — короткий справочник «к кому идти, если не к нам».

Что НЕ должно попадать в датасет ветки new_booking

Эти материалы есть в выгрузке вики, но в этот файл вошли в виде агрегатов или не вошли вовсе:

  • Внутренние добавочные номера сотрудников и врачей (kontakty-kliniki.md) — служебная информация для администраторов; в реплики ассистента пациенту не выводится.
  • Логины и пароли (akkaunty.md) — не должны попадать ни в один датасет.
  • Полные скрипты записи операторов клиники (страницы skript-zapisi-...). Они — не источник для ассистента: ТЗ оптимизации явно меняет логику первого ответа («гипотеза + специалист + услуга + цена + CTA» вместо «представься-узнай-имя-уточни-повод-...»). Если ассистент будет копировать эти скрипты, он откатится к 6 шагам и медленной воронке.
  • Цены на операции, наркоз, послеоперационное сопровождение, ДМС-логика — это контент ветки price_question. В new_booking упоминаем только ориентир по приёму и базовой профильной диагностике.
  • История клиники, юридические реквизиты, реквизиты для оплаты — контент ветки general_info.
  • Пакет документов ДМС, 3-сторонние договоры, регламенты Полимеда — операционная логика администраторов.

Источники и приоритет

При расхождении между инструкциями операторов из вики и нашим ТЗ оптимизации (docs/OPTIMIZATION_CONVERSION_v1.md) — приоритет у ТЗ. Конкретно:

  • Структура воронки: 4 шага из ТЗ, не 6 из вики/скриптов.
  • Содержание qualify: 5-пунктовый шаблон из ТЗ, а не «представься-узнай-имя-уточни-повод» из скриптов.
  • Сбор имени: на book (по ТЗ), а не на intro (как в скриптах).
  • Содержание соответствующих ЛОР-причин и связок «жалоба → специалист» — из вики (медицинские факты — единственный источник правды).

Прежние «временные» сводные документы для этой ветки больше не источник. После подключения подписки на живую вики они должны быть полностью отвязаны от индекса ветки new_booking.