chore(data): чистка датасетов под чанкер v2 + кейсы регрессии 4 веток
- data/datasets/*.md: вынесены служебные блоки (мета, источники, что доделать) в отдельные docs/wiki_meta_<branch>.md по конвенции ТЗ 8.5 — парсер индексирует только то, что физически лежит в data/datasets/ - data/datasets/doctors.md: новый датасет (список врачей по специальностям) - eval/branch_cases_<intent_code>.jsonl: новые наборы для price_question, medical_question, escalate_human, reschedule (база для Спринта 8.6) - eval/branch_cases_general_info.jsonl: точечная правка кейсов Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,58 @@
|
||||
---
|
||||
purpose: Метаданные источников и редакторские пометки по `data/datasets/escalate_human.md`. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/escalate_human.md (frontmatter вынесен 2026-05-03 — попадал в индекс как пустой-section чанк).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники файла escalate_human.md
|
||||
|
||||
## Источники выгрузки (Yandex Wiki)
|
||||
|
||||
- homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/jekstrennyjj-priem-bez-zapisi.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/xamstvo-so-storony-klienta.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/priem-malomobilnyx-pacientov.md
|
||||
- homepage/udalennyjj-kontakt-centr/rabota-s-zhalobami/konfliktologija.md
|
||||
- homepage/sluzhba-administratorov/poleznye-materialy-administratora/knopka-vyzova-brigady-operativnogo-reagirovanija.md
|
||||
- homepage/udalennyjj-kontakt-centr/obshhaja-informacija/kontakty-kliniki.md (только основные номера)
|
||||
|
||||
## Что не источник
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки **не являются источником**.
|
||||
|
||||
## Открытые пометки
|
||||
|
||||
В вики не нашлось явного норматива «через сколько минут оператор отвечает в чате» — нужно добавить.
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-03**: вынесен YAML-frontmatter (попадал в индекс как пустой-section чанк).
|
||||
- **2026-05-03 (доделка)**: вынесены три служебных H2-блока («Что нужно дополнить», «Что НЕ должно попадать», «Источники и приоритет»). Они индексировались наравне с пациентским контентом.
|
||||
|
||||
# Что нужно дополнить вручную в вики
|
||||
|
||||
- **SLA на ответ оператора в чате.** Сейчас в датасете формулировки «в ближайшее время» / «в течение дня». Если у клиники есть конкретный целевой норматив (15 минут? час? рабочие часы?), стоит зафиксировать — иначе в острых случаях пациент может ожидать «минут 5», а ждать 40, и это испортит впечатление сильнее, чем сама эскалация.
|
||||
- **Окна работы канала.** Если чат у пациента включён круглосуточно, а оператор-человек подключается только в часы работы клиники — это нужно явно проговорить. Сейчас бот не упоминает время суток. На входящее сообщение в 03:00 нужно либо отвечать «оператор подключится утром, в острой ситуации звоните 103», либо иметь дежурного.
|
||||
- **Эскалация в выходные / праздники.** Тот же вопрос: дежурит ли кто-то в чате в выходные дни клиники Пирогова (там короткий рабочий день).
|
||||
- **Что говорить про время ответа при `surgery`.** Чисто хирургические запросы обрабатывает ассистент хирурга (отдельный контактный канал в клинике). Стоит зафиксировать, в какое время этот канал доступен.
|
||||
- **Поведение при `angry`.** Сейчас бот сразу эскалирует. В ряде случаев бывает полезно дать одно «остужающее» сообщение, как в скрипте оператора. Решение принять — на стороне политики клиники.
|
||||
- **Поведение при упоминании суицида или членовредительства.** Это не покрыто ни вики, ни базовым промптом ветки. Должна быть отдельная политика — здесь бот точно не должен «справляться сам».
|
||||
|
||||
# Что НЕ должно попадать в датасет ветки `escalate_human`
|
||||
|
||||
- Внутренние добавочные сотрудников и врачей.
|
||||
- Личные мобильные руководителей / заведующих (Семкина, Гилязова, Терво и т. д. — есть в `konfliktologija.md`, но это контакты для эскалации **со стороны оператора**, не для пациента).
|
||||
- Кодовые фразы для вызова ГБР, регламент вызова полиции — это исключительно работа сотрудника на месте.
|
||||
- Алгоритмы оператора по работе с конфликтом / хамством в полном виде — у бота сильно урезанная ответственность.
|
||||
- Цены — они для `price_question`.
|
||||
- Адреса/часы/контакты в подробном виде — для `general_info`. Здесь только основные номера и 103/112.
|
||||
|
||||
# Источники и приоритет
|
||||
|
||||
В этой ветке приоритет всегда у безопасности пациента:
|
||||
|
||||
- Если есть малейшее подозрение на острое состояние — `acute_pain`, не `medical_question`.
|
||||
- Если упоминается операция в любом контексте — `surgery`.
|
||||
- При раздражении — лучше эскалировать раньше, чем позже.
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки не источник. После подключения подписки на живую вики они должны быть отвязаны от индекса ветки `escalate_human`.
|
||||
@@ -0,0 +1,81 @@
|
||||
---
|
||||
purpose: Рабочие пометки редактора по содержимому датасета общей ветки. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/general_info.md (раздел вынесен 2026-05-03 после фейла регрессии — мета-секции попадали в retrieved топ-5 и вытесняли реальный контент).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники и история файла general_info.md
|
||||
|
||||
Раньше эта информация лежала в YAML-frontmatter самого `general_info.md`. Парсер её не отрезал, и она попадала в индекс как два пустых-section мусорных чанка. Перенесена сюда 2026-05-03.
|
||||
|
||||
## Источники выгрузки
|
||||
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/sluzhba-administratorov/obshhaja-informacija/kak-dobratsja-do-kliniki.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/sluzhba-administratorov/obshhaja-informacija/istorija-kliniki.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/sluzhba-administratorov/rekvizity-kliniki.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/obshhaja-informacija/kontakty-kliniki.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/obshhaja-informacija/preimushhestva-nashejj-kliniki.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/klinika-doktora-pirogova/obshhaja-informacija-klinika-doktora-pirogova.md
|
||||
- Ya_wiki_kugn/vrachi-kliniki-svodnyj-spisok.md
|
||||
- Ya_wiki_kugn/skripty-vozrazhenija-chavo-obshhijj-spravochnik.md
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-02** (Н. Кузнецова): режим работы всех филиалов, ТГ-бот, мобильное приложение, актуальный e-mail, закрытие филиала в Краснокамске (окончательно, не временно).
|
||||
- **2026-05-03** (правка после фейла регрессии): вынесен мета-блок «Анализ материалов вики» сюда; раздел «Направления приёма» расширен FAQ-формулировками для процедур (тимпанометрия, эндоскопия, спирография и т.д.); список «способов получения справки 3-НДФЛ» переведён с нумерованного на маркированный, чтобы парсер не делал из «1. Лично», «3. Клиника отправляет…» отдельные секции.
|
||||
|
||||
# Анализ материалов вики и предложения по дополнению
|
||||
|
||||
Раздел носит технический характер — это рабочие пометки для последующего наполнения. В РАГ-ответы пациенту он не должен попадать. Хранится отдельно от `data/datasets/`, чтобы не индексироваться.
|
||||
|
||||
## Что уверенно покрыто из выгрузки
|
||||
|
||||
- Адреса двух действующих филиалов (Цеткин и Газеты Звезда). Краснокамск (Пирогова) закрыт — упоминается одной строкой как закрытый, без активных контактов.
|
||||
- Телефонные линии для пациентов.
|
||||
- Транспорт и пеший маршрут до Цеткин и Газеты Звезда.
|
||||
- Парковка в Перми.
|
||||
- **Режим работы всех филиалов** (добавлено вручную 2026-05-02 со слов оператора).
|
||||
- Список врачей по специальностям (из сводного файла `vrachi-kliniki-svodnyj-spisok.md`).
|
||||
- **Способы записи** — телефон, Telegram-бот, мобильное приложение «Ухо Горло Нос» (RuStore).
|
||||
- **Справка для налогового вычета** — процедура заказа, состав заявки, сроки, способы получения.
|
||||
- История клиники, имени Оленевой.
|
||||
- Юридические реквизиты.
|
||||
- Список процедур, которые в клинике не проводятся.
|
||||
- **Диагностика и процедуры на приёме** (добавлено 2026-05-03 в ответ на фейлы регрессии): эндоскопия ЛОР-органов, тимпанометрия, спирография, промывание носа, удаление серных пробок, ЛОР-операции — оформлены как FAQ-абзацы внутри раздела «Направления приёма».
|
||||
|
||||
## Что в выгрузке отсутствует или скудно — стоит дополнить вручную в вики
|
||||
|
||||
- **Wi-Fi.** Системный промпт ветки явно ожидает ответ на вопрос «есть ли Wi-Fi». В вики этого нет.
|
||||
- **Доступная среда / маломобильные пациенты.** В выгрузке есть алгоритм действий администратора при обращении маломобильных, но нет короткой пациент-ориентированной заметки: есть ли пандус, лифт, как лучше подъехать.
|
||||
- **Детский приём.** Понятно, что детей принимают, но нет короткой страницы «детский ЛОР»: с какого возраста, кто из врачей принимает детей, что взять с собой кроме базовых документов.
|
||||
- **Подготовка к приёму по специальностям.** Для аллерголога, отоневролога, сурдолога есть нюансы (отмена антигистаминных перед аллерго-тестом и т. п.). Сейчас всё разбросано по скриптам записи — стоит свести в одну страницу «Подготовка к приёму».
|
||||
- **Ориентиры и фото входа.** Для Цеткин и Газеты Звезда нет фотографий входа и подробных ориентиров. Для патчат-сценария «не могу найти вход» это полезно.
|
||||
- **Платежи и ДМС в общем виде.** Какие способы оплаты принимаются (карта, наличные, СБП), кратко про ДМС-партнёров. Детально это уйдёт в ветку `price_question`, но в общей справке нужна одна-две фразы.
|
||||
- **Время приёма по умолчанию.** Сколько обычно длится первичный приём ЛОРа, аллерголога. Пациенты часто спрашивают «во сколько успею».
|
||||
- **Отмена и перенос.** Короткое правило «как отменить запись» (полноценно — в ветке `reschedule`, но ссылка-минимум полезна и в общей).
|
||||
- **Прочие документы по итогам приёма.** Заключение, выписка, больничный — что выдают и в какой форме (справка ФНС теперь покрыта отдельным разделом).
|
||||
- **Праздничные дни.** Режим работы 1 января, 8 марта, 9 мая и т. д. — пациенты регулярно спрашивают, в датасете явно не указано.
|
||||
- **КТ височных костей** — фейл в регрессии 2026-05-02. Сейчас не понятно: делаем ли, и если нет — куда направляем.
|
||||
- **Кожные аллергопробы** (на животных, бытовые аллергены) — фейл в регрессии. Нужно явное «да/нет» и список доступных аллергенов либо границы.
|
||||
- **Услуга по настройке слухового аппарата** — фейл в регрессии. Сурдоакустик в направлениях есть, но прямого ответа «настраиваем уже купленный аппарат» / «только подбираем новый» в датасете нет.
|
||||
- **Поиск назначений врача в приложении** — пациент спросил «есть ли приложение, где можно посмотреть назначение врача». В описании приложения сейчас нет пункта про назначения; либо подтвердить, что это запланировано, либо отрицать явно.
|
||||
- **График врачей** (например, «график у Терво С. О.»). В общем датасете список врачей есть, графиков работы по конкретному специалисту — нет. Нужно решить: либо добавлять, либо явно роутить такие вопросы на оператора.
|
||||
|
||||
## Что НЕ должно попадать в датасет общей ветки (но есть в вики)
|
||||
|
||||
При следующих итерациях нужно явно отфильтровать при автообновлении:
|
||||
|
||||
- Внутренние добавочные номера сотрудников и врачей (из `kontakty-kliniki.md`) — это служебная информация для администраторов, пациенту озвучивать нельзя.
|
||||
- Логины и пароли почтовых ящиков и сервисов (из `akkaunty.md`) — это явная утечка, такие страницы вообще не должны попадать в РАГ.
|
||||
- Цены, скидки, ДМС — отдельная ветка `price_question`, в общей не должны звучать.
|
||||
- Скрипты записи и работы с возражениями — это контент для веток `new_booking` и `escalate_human`.
|
||||
|
||||
## Предложение по структуре подписки
|
||||
|
||||
Когда мультиагент будет подписан на живую вики, имеет смысл хранить датасеты не одним файлом, а блоком файлов под каждую ветку, например: `data/datasets/general_info/*.md`. Тогда:
|
||||
|
||||
- Каждый файл = одна страница вики (адрес, режим, врачи, преимущества и т. д.).
|
||||
- При обновлении страницы в вики обновляется ровно один файл, индекс пересобирается локально.
|
||||
- Чувствительные страницы (пароли, добавочные) можно явно занести в чёрный список фильтра подписки.
|
||||
|
||||
Текущий единый файл — временный формат для тестирования первой версии РАГа в ветке `general_info`.
|
||||
@@ -0,0 +1,58 @@
|
||||
---
|
||||
purpose: Метаданные источников и редакторские пометки по `data/datasets/medical_question.md`. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/medical_question.md (frontmatter вынесен 2026-05-03 — попадал в индекс как пустой-section чанк).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники файла medical_question.md
|
||||
|
||||
## Источники выгрузки (Yandex Wiki)
|
||||
|
||||
- homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/jekstrennyjj-priem-bez-zapisi.md
|
||||
- homepage/udalennyjj-kontakt-centr/rechevye-moduli-dlja-slozhnyx-situacijj/priem-malomobilnyx-pacientov.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/chasto-sprashivaemye-procedury-kotorye-v-klinike-n.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md
|
||||
|
||||
## Что не источник
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки **не источник**. Связки «жалоба → возможные ЛОР-причины → специалист → услуга» в датасете НЕ дублируются — они в `new_booking.md`, здесь они используются по ссылке.
|
||||
|
||||
## Конверсионная логика (важный концептуальный пункт)
|
||||
|
||||
Бот в этой ветке даёт гипотезы по жалобе («может быть связано с …»), как в `new_booking.qualify` — это разрешено и нужно для конверсии. Запрет — на лекарства, дозировки, схемы лечения, прогноз и советы по самолечению (см. в самом датасете раздел «Чего бот НЕ делает в этой ветке»).
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-03**: вынесен YAML-frontmatter, развёрнут нумерованный список «1. Признаёт ситуацию … / 2. Сразу INTENT_CHANGE … / 3. Полную обработку …» в маркированный (парсер цеплял пункты как заголовки секций).
|
||||
- **2026-05-03 (доделка)**: вынесены три служебных H2-блока («Что нужно дополнить», «Что НЕ должно попадать», «Источники и приоритет»). Они индексировались наравне с пациентским контентом и могли попадать в retrieved топ-5 на маршрутных и Тип B кейсах.
|
||||
|
||||
# Что нужно дополнить вручную в вики
|
||||
|
||||
В выгрузке вики на тему «медицинские вопросы» нашлись только отдельные кейсы (Меньер, трахеостома, электрофорез, прививки, пенициллин). Этого достаточно для работы ветки, но в перспективе стоит добавить:
|
||||
|
||||
- **Список «частых вопросов про симптомы»** с шаблонами «куда направлять» — чтобы покрыть типовые «болит горло у ребёнка», «продолжается насморк после ОРВИ», «звон в ушах после концерта», «вода попала в ухо», «инородное тело в ухе/носу/горле». Сейчас часть таких сценариев обрабатывается через `new_booking`, но имеет смысл явно прописать триаж.
|
||||
- **Чёткие критерии острого состояния от лица клиники.** Сейчас бот опирается на общие медицинские понятия. Если у клиники есть свой внутренний регламент «когда сразу скорая, когда экстренно к нам без записи» — пропишите. Это повлияет на формулировку при handoff в `escalate_human`.
|
||||
- **Маршруты «не наша тема»** — стоматолог, невролог, офтальмолог, дерматолог-узкий профиль. Сейчас известен только стоматолог через Центр Медиум. Если есть устоявшиеся партнёры — назовите явно, чтобы бот не отправлял пациента «в никуда».
|
||||
- **Тема психологической помощи / тревоги вокруг состояния.** Иногда пациент пишет «мне страшно», «не могу спать от тревоги, что у меня». Прямого ответа в вики нет; в эскалации reason `acute_pain` это не подходит, `explicit_request` — натянуто. Стоит явно сформулировать политику.
|
||||
|
||||
# Что НЕ должно попадать в датасет ветки `medical_question`
|
||||
|
||||
- Конкретные диагнозы и их клинические признаки — в РАГ для ассистента это создаёт соблазн «угадать диагноз».
|
||||
- Списки препаратов — даже под формулировкой «врач может назначить». Любое название препарата в ответе бота — потенциальная рекомендация.
|
||||
- Внутренние клинические рекомендации врачей и презентации с конференций (раздел `vrachi/klinicheskie-rekomendacii/...` и `prezentacii-s-konferencijj/...`) — это материалы для врачей, не для пациента.
|
||||
- Внутренние добавочные номера, пароли, доступы.
|
||||
- Полные операторские скрипты записи — они для `new_booking`.
|
||||
- Цены — они для `price_question`. Здесь, в отличие от `new_booking`, цена в ответе вообще не нужна: пациент задаёт медицинский вопрос, а не вопрос про деньги.
|
||||
|
||||
# Источники и приоритет
|
||||
|
||||
При расхождении источников приоритет такой:
|
||||
|
||||
1. **Безопасность пациента** — выше всего. При малейшем сомнении в остроте состояния — `escalate_human` с `reason=acute_pain`, без гипотез и обсуждения.
|
||||
2. **ТЗ оптимизации** (`docs/OPTIMIZATION_CONVERSION_v1.md`) — конверсионная логика. Гипотезы по жалобе разрешены и нужны (как у бота-конкурента), это не противоречит безопасности при правильной формулировке («может быть связано с»).
|
||||
3. **Связки «жалоба → возможные причины → специалист → услуга» из `new_booking.md`** — единственный источник медицинского триажа. Здесь они используются по ссылке, не дублируются.
|
||||
4. **Вики клиники** — фактическая база (что лечат, что не делают, куда направлять).
|
||||
5. **Скрипты операторов** — НЕ источник. Бот не симулирует «настойчивые» формулировки операторов («у нас лучше», «настоять на записи») — пациент пришёл с медицинским вопросом, и нажим тут портит конверсию сильнее, чем помогает.
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки не источник. После подключения подписки на живую вики они должны быть отвязаны от индекса ветки `medical_question`.
|
||||
@@ -0,0 +1,60 @@
|
||||
---
|
||||
purpose: Рабочие пометки редактора по содержимому датасета ветки записи. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/new_booking.md (вынесены 2026-05-03 — служебные H1-секции попадали в индекс наравне с шагами воронки и засоряли retrieved).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники и история файла new_booking.md
|
||||
|
||||
## Источники выгрузки (Yandex Wiki)
|
||||
|
||||
- homepage/sluzhba-administratorov/obshhaja-informacija/struktura-kliniki/*
|
||||
- homepage/udalennyjj-kontakt-centr/medicinskie-voprosy.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/lor-otorinolarintolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/allergolog-immunolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/pulmonolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/otonevrolog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/surdrlog/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-vracham/foniatr/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/klinika-doktora-pirogova/*
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md
|
||||
|
||||
## Внутренние источники
|
||||
|
||||
- `docs/OPTIMIZATION_CONVERSION_v1.md` — ТЗ по оптимизации воронки. Воронка после оптимизации: `intro → qualify → book → close` (4 шага, вариант 2 блока C).
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-03**: вынесены YAML-frontmatter и три служебных H1-блока («Что нужно сверить и дополнить», «Что НЕ должно попадать в датасет ветки», «Источники и приоритет»). Они попадали в индекс наравне с шагами воронки и могли вытеснять реальный контент.
|
||||
|
||||
# Что нужно сверить и дополнить (рабочие пометки)
|
||||
|
||||
- **Цена приёма Ворончихиной Н. В.** В разделе «Особенности записи к отоневрологу» — 4100/2750 руб. В скриптах записи (старый сводный документ) фигурировало 4300 руб. Сверить с актуальным прайсом перед запуском ветки в продакшен.
|
||||
- **Цена приёма Ивановой А. А.** Аналогично — 3000 руб. в особенностях vs 3200 руб. в скриптах. Расхождение источников.
|
||||
- **Цена приёма аллерголога Чепиковой Е. Н.** В таблице первичных времён указан её слот, но Чепикова в декрете — пометка о её недоступности должна транслироваться пациенту.
|
||||
- **Возрастные границы для детей у каждого врача.** Сейчас известны только некоторые: Семерикова Н. А. — с 0 лет, Макарова Л. Г. — с 7 лет, Анфилатов А. В. — с 2 лет, Абыденков А. В. — с 2 лет, Ворончихина Н. В. — с 4 лет, ЛОР-телемед в Пирогове — с 3–4 лет. Для остальных врачей нужна явная пометка в вики.
|
||||
- **Покрытие жалоб.** ТЗ оптимизации в блоке B упоминает 5 контрольных кейсов: храп + уши, боль в горле, тугоухость, насморк > месяца, звон в ушах. Все они здесь покрыты. На втором заходе стоит добавить: головокружение у пожилых, кровотечения из носа, голос (для фониатра — отдельно), кашель у ребёнка (для пульмонолога/аллерголога), боль и припухлость лимфоузлов, хроническая боль в ушах у ныряльщиков.
|
||||
- **Расписание для подбора времени.** Пока реальный календарь не подключён, шаг `book` ограничивается фиксацией предпочтений; когда появится интеграция (см. бэклог Спринта 9), сюда нужно добавить блок «как описывать пациенту окна записи».
|
||||
- **Стоматология / неврология / офтальмология.** В вики прямых правил «куда отправить» нет. Если пациент пришёл с такой жалобой, бот сейчас деградирует на «обратитесь к профильному специалисту» — это OK, но в идеале — короткий справочник «к кому идти, если не к нам».
|
||||
|
||||
# Что НЕ должно попадать в датасет ветки `new_booking`
|
||||
|
||||
Эти материалы есть в выгрузке вики, но в этот файл вошли в виде агрегатов или не вошли вовсе:
|
||||
|
||||
- Внутренние добавочные номера сотрудников и врачей (`kontakty-kliniki.md`) — служебная информация для администраторов; в реплики ассистента пациенту не выводится.
|
||||
- Логины и пароли (`akkaunty.md`) — не должны попадать ни в один датасет.
|
||||
- Полные скрипты записи операторов клиники (страницы `skript-zapisi-...`). Они — не источник для ассистента: ТЗ оптимизации явно меняет логику первого ответа («гипотеза + специалист + услуга + цена + CTA» вместо «представься-узнай-имя-уточни-повод-...»). Если ассистент будет копировать эти скрипты, он откатится к 6 шагам и медленной воронке.
|
||||
- Цены на операции, наркоз, послеоперационное сопровождение, ДМС-логика — это контент ветки `price_question`. В `new_booking` упоминаем только ориентир по приёму и базовой профильной диагностике.
|
||||
- История клиники, юридические реквизиты, реквизиты для оплаты — контент ветки `general_info`.
|
||||
- Пакет документов ДМС, 3-сторонние договоры, регламенты Полимеда — операционная логика администраторов.
|
||||
|
||||
# Источники и приоритет
|
||||
|
||||
При расхождении между инструкциями операторов из вики и нашим ТЗ оптимизации (`docs/OPTIMIZATION_CONVERSION_v1.md`) — приоритет у ТЗ. Конкретно:
|
||||
|
||||
- Структура воронки: 4 шага из ТЗ, не 6 из вики/скриптов.
|
||||
- Содержание `qualify`: 5-пунктовый шаблон из ТЗ, а не «представься-узнай-имя-уточни-повод» из скриптов.
|
||||
- Сбор имени: на `book` (по ТЗ), а не на `intro` (как в скриптах).
|
||||
- Содержание соответствующих ЛОР-причин и связок «жалоба → специалист» — из вики (медицинские факты — единственный источник правды).
|
||||
|
||||
Прежние «временные» сводные документы для этой ветки больше не источник. После подключения подписки на живую вики они должны быть полностью отвязаны от индекса ветки `new_booking`.
|
||||
@@ -0,0 +1,66 @@
|
||||
---
|
||||
purpose: Рабочие пометки редактора по содержимому датасета ценовой ветки. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/price_question.md (раздел вынесен 2026-05-03 — мета-секции попадали в индекс наравне с прайсом и засоряли retrieved топ-5).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники и история файла price_question.md
|
||||
|
||||
Раньше эта информация лежала в YAML-frontmatter самого `price_question.md`. Парсер её не отрезал, и она попадала в индекс как чанк с пустым `section`. Перенесена сюда 2026-05-03.
|
||||
|
||||
## Источники выгрузки
|
||||
|
||||
- Ya_wiki_kugn/skripty-vozrazhenija-chavo-obshhijj-spravochnik.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/sluzhba-administratorov/pacienty-po-dms/_index.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/sluzhba-administratorov/pacienty-po-dms/straxovye-kompanii-e3e86a.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/sluzhba-administratorov/pacienty-po-dms/pacienty-po-3x-storonnemu-dogovoru.md
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/*
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/diagnostika/*
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/kt-issledovanija/*
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/klinika-doktora-pirogova/* (исторический источник; филиал закрыт в 2026 году, прайс убран из активной части датасета)
|
||||
- Ya_wiki_kugn/out/yandex-wiki-catalog/homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/zapis-k-otonevrologu/blokada/*
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-02** (Н. Кузнецова): закрытие филиала Пирогова в Краснокамске; прайс этого филиала убран из активной части.
|
||||
- **2026-05-03**: вынесен мета-блок «Анализ материалов и пометки для дополнения» сюда; вынесен YAML-frontmatter (он попадал в индекс как пустой-section чанк).
|
||||
|
||||
# Анализ материалов и пометки для дополнения
|
||||
|
||||
## Что покрыто из выгрузки уверенно
|
||||
|
||||
- Цены на приёмы у ЛОР, аллерголога, пульмонолога, отоневролога, сурдолога, телемед-приёмов.
|
||||
- Скидка 50% по направлению, цена приёма «со скидкой».
|
||||
- Полный набор стоимостей операций ЛОР-профиля.
|
||||
- Анестезия, пребывание в палате, послеоперационное сопровождение.
|
||||
- Прайс на КТ ЛОР-органов и «Дент», ОПТГ, ТРГ, доп. услуги КТ-центра.
|
||||
- Стандартные диагностики (аудиометрия, тимпанометрия, спирография и т. д.).
|
||||
- Лечебные процедуры (промывания, блокады, инъекции).
|
||||
- Слуховые аппараты и расходники.
|
||||
- Способы оплаты (наличные, терминал), список ДМС-партнёров.
|
||||
- Логика 3-стороннего договора.
|
||||
|
||||
## Что нужно дополнить вручную в вики
|
||||
|
||||
- **Прайс на анализы (МедЛабЭкспресс).** В выгрузке нет конкретных сумм по позициям — есть только цены на сам забор. Стоит прикрепить актуальный прайс.
|
||||
- **Справка ФНС / налоговый вычет.** Раздел в вики есть, но в выгрузке отсутствует. Нужен короткий блок: за какой период оформляется, сколько по времени готовится, нужна ли оплата за услугу.
|
||||
- **СБП.** Уточнить, принимается ли оплата через Систему быстрых платежей или только нал/карта по терминалу.
|
||||
- **Скидки.** В выгрузке только «50% по направлению на лечебную процедуру». Если есть скидки пенсионерам, многодетным, сотрудникам, постоянным пациентам — отдельно прописать; иначе при вопросе ассистент будет каждый раз говорить «уточню у оператора».
|
||||
- **Услуги, бывшие только в Пирогова.** После закрытия филиала из активного датасета убраны: цены семейного врача, телемед-приёма ЛОР/аллерголога, дерматолога, косметолога, УЗИ, ЭКГ, профосмотра, инъекций в процедурном кабинете, промывания серных пробок (550 ₽). Если эти услуги планируется оказывать в пермских филиалах — нужно явно прописать новые прайсы; иначе бот честно отвечает «филиал закрыт» и эскалирует.
|
||||
- **Расхождение по наркозу для аденотомии.** В разделе «Структура звонка по аденотомии» (скрипты записи) указана стоимость наркоза 16500 руб., а на странице самой аденотомии — 21500 руб. Возможно, это устаревшая цена в одном из источников. Нужно сверить с актуальным прайсом и поправить в вики, иначе ассистент будет давать разные ответы в зависимости от того, какой кусок выгрузки попадёт в контекст.
|
||||
- **Цена аллерголога-иммунолога повторного приёма (очный).** В выгрузке указана стоимость только первичного очного приёма (2400 руб.). Для пульмонолога и ЛОРа повторный тоже отдельно не зафиксирован.
|
||||
- **Эндоскопия как самостоятельная диагностика.** На странице эндоскопии есть две цены — 900 руб. и 12100 руб., вторая выглядит как опечатка или комплексный код. В этом файле я взял 900 руб. как основное; стоит сверить с прайсом.
|
||||
|
||||
## Что НЕ должно попадать в датасет ветки price_question (но есть в вики)
|
||||
|
||||
- Внутренние пароли и доступы (`akkaunty.md`) — в РАГ не попадают вообще.
|
||||
- Внутренние добавочные номера сотрудников (`kontakty-kliniki.md`) — это для администраторов, пациенту не озвучиваются.
|
||||
- Скрипты разговоров и работы с возражениями целиком — это контент для веток `new_booking` и обучения операторов; в `price_question` уходят только конечные суммы.
|
||||
- Логика «Полимед», движение карт ДМС, работа с архивом — операционные детали для администраторов.
|
||||
- Адреса/режим/телефоны без привязки к ценам — это уже в датасете ветки `general_info`.
|
||||
|
||||
## Структура для будущей подписки
|
||||
|
||||
Когда мультиагент будет подписан на живую вики, цены логично хранить в виде набора файлов: `price_question/priemy.md`, `price_question/diagnostika.md`, `price_question/operacii.md`, `price_question/dms.md`. Тогда обновление одной страницы прайса не будет триггерить переиндексирование всего датасета. Также имеет смысл выделить отдельный файл-«источник правды» по прайсу клиники (например, экспорт из 1С/CRM) и при пересборке индекса автоматически разрешать конфликты в пользу этого файла, а не описаний из вики.
|
||||
|
||||
Текущий единый файл — временный формат для тестирования первой версии РАГа в ветке `price_question`.
|
||||
@@ -0,0 +1,61 @@
|
||||
---
|
||||
purpose: Метаданные источников и редакторские пометки по `data/datasets/reschedule.md`. НЕ для индексации в РАГ.
|
||||
moved_from: data/datasets/reschedule.md (frontmatter вынесен 2026-05-03 — попадал в индекс как пустой-section чанк).
|
||||
audience: Аксей (разработка), Наталья (наполнение вики).
|
||||
---
|
||||
|
||||
# Источники файла reschedule.md
|
||||
|
||||
## Источники выгрузки (Yandex Wiki)
|
||||
|
||||
- homepage/udalennyjj-kontakt-centr/shablony-otvetov-na-soobshhenija-pacientov.md
|
||||
- homepage/sluzhba-administratorov/polimed/perepiska-s-pacientami-v-whatsapp-wa-cherez-polime/perepiska-po-zapisi-na-segodnja-zelenyjj-kvadratik.md
|
||||
- homepage/sluzhba-administratorov/polimed/rabota-s-listom-ozhidanija.md
|
||||
- homepage/sluzhba-administratorov/poleznye-materialy-administratora/kommunikacii/rabota-s-koll-centrom.md
|
||||
- homepage/udalennyjj-kontakt-centr/organizacionnye-voprosy/operacionnye-vmeshatelstva/organizacionnye-voprosy.md
|
||||
|
||||
## Что не источник
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки **не являются источником**.
|
||||
|
||||
## Открытые пометки
|
||||
|
||||
- В вики не нашлись явные правила «за сколько часов до приёма можно перенести/отменить».
|
||||
- Нет упоминаний штрафов или неустойки за неявку.
|
||||
|
||||
Оба вопроса нужно дополнить в вики.
|
||||
|
||||
## История изменений
|
||||
|
||||
- **2026-05-03**: вынесен YAML-frontmatter, развёрнут нумерованный список «Базовое поведение бота» в маркированный (парсер цеплял пункты `1. Извинение… / 2. Уточнение… / 3. Уточнение — отмена… / 4. Если перенос… / 5. Финал…` как заголовки секций).
|
||||
- **2026-05-03 (доделка)**: вынесены три служебных H2-блока («Что нужно дополнить», «Что НЕ должно попадать», «Источники и приоритет») сюда же — они индексировались наравне с пациентским контентом.
|
||||
|
||||
# Что нужно дополнить вручную в вики
|
||||
|
||||
В выгрузке вики не нашлись и должны быть явно прописаны:
|
||||
|
||||
- **Граница «за сколько часов до приёма можно перенести / отменить без последствий».** Сейчас бот отвечает обтекаемо. Если в клинике де-факто есть правило (например, «за 24 часа») — его нужно прописать в вики и в этот датасет.
|
||||
- **Штрафы / удержание депозита за неявку.** Явных правил нет. Если для отдельных случаев (операции, дорогие диагностики) есть условия удержания части предоплаты при поздней отмене — описать.
|
||||
- **Возврат предоплаты за операцию при отмене.** Сценарий «пациент внёс предоплату или организация перевела по 3-стороннему договору, а операция отменилась» — в вики есть только описание прихода денег, нет описания возврата.
|
||||
- **Регламент «сколько раз пациент может перенести подряд».** В реальности бывают пациенты, которые переносят 3+ раза. Если есть внутренний регламент (например, «третий перенос подряд = в лист ожидания»), пропишите.
|
||||
- **Опоздание.** Есть ли допустимый порог («15 минут — держим запись, больше — переносим»)? В вики не нашёл.
|
||||
- **Отмена приёма, оплаченного по подарочному сертификату.** Сертификаты есть, но что с ними при переносе/отмене — не описано.
|
||||
- **Перенос приёма за ребёнка с другого законного представителя.** Стандартная история «приёмы ребёнка переносит мама, но в день приёма пришёл папа, а сейчас пишет бабушка». Нужны правила, кто и как может вносить изменения.
|
||||
|
||||
# Что НЕ должно попадать в датасет ветки `reschedule` (но есть в вики)
|
||||
|
||||
- Внутренние операционные подробности Полимеда (как именно администратор удаляет запись «минусом», как создаётся лист ожидания, как ставится статус «придёт»). Это для администраторов, не для пациентов.
|
||||
- Внутренние добавочные номера сотрудников и врачей.
|
||||
- Логины и пароли.
|
||||
- Полные операторские скрипты записи (`skript-zapisi-...`) — структура «6 этапов» не для бота, у бота — лаконичный диалог.
|
||||
- Цены (попадают в `price_question`).
|
||||
- Адреса, режим работы, контакты в подробном виде (попадают в `general_info`).
|
||||
|
||||
# Источники и приоритет
|
||||
|
||||
При расхождении инструкций операторов из вики и логики бота — приоритет у бота:
|
||||
|
||||
- Бот не должен симулировать поведение человека-администратора (звонок пациенту, удаление в Полимеде, открытие чата). Бот действует асинхронно: пациент пишет в чат, бот собирает данные и обещает связь.
|
||||
- Если в скрипте оператора написано «оператор перезванивает по телефону для переноса» — бот эту фразу адаптирует в «администратор свяжется с вами в течение дня и подтвердит новое время».
|
||||
|
||||
Прежние сводные документы (`skripty-vozrazhenija-chavo-obshhijj-spravochnik.md`, `vrachi-kliniki-polnaja-informacija.md`) для этой ветки не источник. После подключения подписки на живую вики они должны быть полностью отвязаны от индекса ветки `reschedule`.
|
||||
Reference in New Issue
Block a user