chore(data): чистка датасетов под чанкер v2 + кейсы регрессии 4 веток
- data/datasets/*.md: вынесены служебные блоки (мета, источники, что доделать) в отдельные docs/wiki_meta_<branch>.md по конвенции ТЗ 8.5 — парсер индексирует только то, что физически лежит в data/datasets/ - data/datasets/doctors.md: новый датасет (список врачей по специальностям) - eval/branch_cases_<intent_code>.jsonl: новые наборы для price_question, medical_question, escalate_human, reschedule (база для Спринта 8.6) - eval/branch_cases_general_info.jsonl: точечная правка кейсов Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -1,25 +1,3 @@
|
||||
---
|
||||
intent: medical_question
|
||||
title: Медицинские вопросы (датасет для ветки medical_question)
|
||||
purpose: |
|
||||
Источник для РАГа в ветке medical_question. Контент — это конверсионная навигация: как отличить запрос на медконсультацию от обычной жалобы (которая идёт в new_booking), как ответить содержательно (с гипотезами по причинам жалобы — как в new_booking.qualify), не сорваться в назначение лечения, и довести пациента до записи или эскалации.
|
||||
sources_wiki:
|
||||
- homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/jekstrennyjj-priem-bez-zapisi.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/priem-malomobilnyx-pacientov.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/chasto-sprashivaemye-procedury-kotorye-v-klinike-n.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md
|
||||
note: |
|
||||
Файл собран только из официальной выгрузки Yandex Wiki клиники.
|
||||
Прежние «временные» сводные документы (skripty-vozrazhenija-chavo-obshhijj-spravochnik.md,
|
||||
vrachi-kliniki-polnaja-informacija.md) для этой ветки не источник.
|
||||
Связки «жалоба → возможные ЛОР-причины → специалист → услуга» в датасете НЕ дублируются —
|
||||
они в new_booking.md, здесь они используются по ссылке.
|
||||
Конверсионная логика: бот в этой ветке даёт гипотезы по жалобе («может быть связано с …»),
|
||||
как в new_booking.qualify — это разрешено и нужно для конверсии. Запрет — на лекарства,
|
||||
дозировки, схемы лечения, прогноз и советы по самолечению (см. раздел «Чего бот НЕ делает»).
|
||||
---
|
||||
|
||||
# Медицинские вопросы
|
||||
|
||||
## Идея ветки
|
||||
@@ -104,9 +82,9 @@ note: |
|
||||
|
||||
В таких случаях бот:
|
||||
|
||||
1. Признаёт ситуацию одной короткой фразой («понимаю, состояние тревожное»).
|
||||
2. Сразу `[INTENT_CHANGE: escalate_human]` с `reason=acute_pain`.
|
||||
3. Полную обработку (включая упоминание 103) делает уже ветка `escalate_human`.
|
||||
- **Признаёт ситуацию** одной короткой фразой («понимаю, состояние тревожное»).
|
||||
- **Сразу `[INTENT_CHANGE: escalate_human]`** с `reason=acute_pain`.
|
||||
- **Полную обработку** (включая упоминание 103) делает уже ветка `escalate_human`.
|
||||
|
||||
Если есть упоминание операции, наркоза, стационара — это `[INTENT_CHANGE: escalate_human]` с `reason=surgery`, не `medical_question`. Хирургические темы всегда выходят сразу к оператору.
|
||||
|
||||
@@ -231,32 +209,3 @@ note: |
|
||||
- Не сравнивает свои услуги с другими клиниками («у нас лучше / у них хуже»).
|
||||
- Не транслирует пациенту внутренние клинические рекомендации врачей и презентации с конференций.
|
||||
|
||||
## Что нужно дополнить вручную в вики
|
||||
|
||||
В выгрузке вики на тему «медицинские вопросы» нашлись только отдельные кейсы (Меньер, трахеостома, электрофорез, прививки, пенициллин). Этого достаточно для работы ветки, но в перспективе стоит добавить:
|
||||
|
||||
- **Список «частых вопросов про симптомы»** с шаблонами «куда направлять» — чтобы покрыть типовые «болит горло у ребёнка», «продолжается насморк после ОРВИ», «звон в ушах после концерта», «вода попала в ухо», «инородное тело в ухе/носу/горле». Сейчас часть таких сценариев обрабатывается через `new_booking`, но имеет смысл явно прописать триаж.
|
||||
- **Чёткие критерии острого состояния от лица клиники.** Сейчас бот опирается на общие медицинские понятия. Если у клиники есть свой внутренний регламент «когда сразу скорая, когда экстренно к нам без записи» — пропишите. Это повлияет на формулировку при handoff в `escalate_human`.
|
||||
- **Маршруты «не наша тема»** — стоматолог, невролог, офтальмолог, дерматолог-узкий профиль. Сейчас известен только стоматолог через Центр Медиум. Если есть устоявшиеся партнёры — назовите явно, чтобы бот не отправлял пациента «в никуда».
|
||||
- **Тема психологической помощи / тревоги вокруг состояния.** Иногда пациент пишет «мне страшно», «не могу спать от тревоги, что у меня». Прямого ответа в вики нет; в эскалации reason `acute_pain` это не подходит, `explicit_request` — натянуто. Стоит явно сформулировать политику.
|
||||
|
||||
## Что НЕ должно попадать в датасет ветки `medical_question`
|
||||
|
||||
- Конкретные диагнозы и их клинические признаки — в РАГ для ассистента это создаёт соблазн «угадать диагноз».
|
||||
- Списки препаратов — даже под формулировкой «врач может назначить». Любое название препарата в ответе бота — потенциальная рекомендация.
|
||||
- Внутренние клинические рекомендации врачей и презентации с конференций (раздел `vrachi/klinicheskie-rekomendacii/...` и `prezentacii-s-konferencijj/...`) — это материалы для врачей, не для пациента.
|
||||
- Внутренние добавочные номера, пароли, доступы.
|
||||
- Полные операторские скрипты записи — они для `new_booking`.
|
||||
- Цены — они для `price_question`. Здесь, в отличие от `new_booking`, цена в ответе вообще не нужна: пациент задаёт медицинский вопрос, а не вопрос про деньги.
|
||||
|
||||
## Источники и приоритет
|
||||
|
||||
При расхождении источников приоритет такой:
|
||||
|
||||
1. **Безопасность пациента** — выше всего. При малейшем сомнении в остроте состояния — `escalate_human` с `reason=acute_pain`, без гипотез и обсуждения.
|
||||
2. **ТЗ оптимизации** (`docs/OPTIMIZATION_CONVERSION_v1.md`) — конверсионная логика. Гипотезы по жалобе разрешены и нужны (как у бота-конкурента), это не противоречит безопасности при правильной формулировке («может быть связано с»).
|
||||
3. **Связки «жалоба → возможные причины → специалист → услуга» из `new_booking.md`** — единственный источник медицинского триажа. Здесь они используются по ссылке, не дублируются.
|
||||
4. **Вики клиники** — фактическая база (что лечат, что не делают, куда направлять).
|
||||
5. **Скрипты операторов** — НЕ источник. Бот не симулирует «настойчивые» формулировки операторов («у нас лучше», «настоять на записи») — пациент пришёл с медицинским вопросом, и нажим тут портит конверсию сильнее, чем помогает.
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки не источник. После подключения подписки на живую вики они должны быть отвязаны от индекса ветки `medical_question`.
|
||||
|
||||
Reference in New Issue
Block a user