RAG_helper/docs/COMPETITOR_ALEXANDRA_top100.md

# Разбор конкурента «Александра» — первые 100 диалогов из 2691

**Источник:** `dialogs-export-2026-04-27-09-45-07.xlsx` (clinic-lor@mail.ru, ЛОР-клиника, Пермь, 2 филиала).
**Дата экспорта:** 27.04.2026. **Дата анализа:** 27.04.2026.

## Метрики конкурента (по сводке файла)

- 2691 диалог за период.
- 6.1 сообщений на диалог в среднем.
- Каналы: Widget 87%, VK 13%, Max/Telegram единицы.
- 684 диалога с тегом `has_tool_calls` = ~25% общая конверсия в передачу заявки администратору. **В первых 100 — 32%** (часть из них — повторные обращения тех же клиентов).
- Расход $ после рестарта = 0 (т.е. они на Botcoin/локальной модели).
- Средний расход 2.76 Botcoin/диалог.

## Архитектура их сценария (восстановлена по стенограммам)

Воронка из **3 шагов**, не 4:

1. **Triage** — бот сразу собирает причину обращения, не настаивая на имени, без отдельного intro.
2. **Pitch** — называет цену первичного приёма (от 2500 ₽), упоминает что эндоскопия +1000 ₽ оплачивается отдельно, предлагает записать.
3. **Capture** — просит **только телефон**. Имя — опционально, бот достаёт его из реплик сам. Дальше `save_user_data` и шаблонная плашка прощания.

**Шаблон закрытия после tool_call** (одинаковый везде, помечен `[Шаблон]`):
> «Я отправила ваши данные администратору. Ожидайте звонка. Мне было приятно с вами общаться. Хорошего дня и спасибо за выбор нашей клиники!»

**Структура tool_call** (полезно подсмотреть для нашего):
```json
{
  "phone": 89922070601,
  "source": "Сайт",
  "context": "Пациентка переболела, был сильный кашель, сейчас дискомфорт при глотании",
  "service": "Прием ЛОР-врача"
}
```
Контекст и услугу LLM формирует сам из истории — это даёт администратору готовое описание лида без необходимости перечитывать диалог.

**«Догоняющее» сообщение** при молчании клиента: системный триггер пишет ассистенту «Клиент не ответил отправь ему еще одно сообщение: "У вас остались еще какие-то вопросы?"», ассистент пересылает. Несколько раз в выборке именно это возвращало клиента в воронку и приводило к захвату телефона.

## Темы пациентов (распределение по 100 диалогам)

В порядке убывания частотности:

1. Запись по симптому (болит ухо, насморк, заложенность, выделения, шум, головокружение) — около половины обращений.
2. Запись к конкретному врачу по фамилии — ~15%.
3. Стоимость услуги/процедуры — ~10%.
4. Справка для налогового вычета — повторяется 8+ раз в первой сотне с почти идентичным длинным ответом. Кандидат на отдельный intent с готовым шаблоном.
5. Дети (с рождения, аденоиды, отиты, шунты) — ~10%.
6. Перенос/отмена записи — ~5%.
7. Доверенность для бабушки сопровождать ребёнка — есть готовый текстовый шаблон от руки.
8. График работы / праздники, адреса, ОМС/ДМС, рассрочка, оплата по QR — короткие FAQ.
9. Отсев по географии (Казахстан, Тула, Калуга, Златоуст, Кизел) — клиника только в Перми.

## Что у них работает (можно перенять)

- **Минимум полей в lead-форме:** только phone. Имя/контекст бот собирает сам. Снимает фрикцию.
- **Контекст и услуга в JSON** автоматически — экономит время администратора.
- **Шаблонные ответы для типовых FAQ** (налоговая справка, доверенность) выдаются мгновенно и без LLM-творчества — стабильно и дёшево.
- **Догоняющее сообщение** через системный триггер при молчании.
- **Конкретика в питче:** цена + регалии врача (ФИО, к.м.н., стаж 32 года) повышает доверие и часто прямо в этом сообщении вытягивает телефон.
- **Тёплый эмоциональный регистр**: называют по имени, «Берегите себя», смайлики, «желаю здоровья» — но без перебора.

## Где они проседают (наши потенциальные преимущества)

1. **Нет интеграции с расписанием врачей.** Любой вопрос «когда есть свободное время к доктору X?» переадресуется администратору. Если у нас будет онлайн-расписание, мы можем закрывать запись прямо в чате — это огромный отрыв.
2. **Не интегрированы с CRM записей.** Пациент пишет «я записан на завтра, во сколько?» — бот предлагает оставить телефон и ждать звонка. Унизительно для уже-клиента.
3. **Галлюцинации на простых вопросах.** Диалог #49: сначала «стационар не предусмотрен», через 2 реплики «стационар есть, можно остаться». Противоречие в одном диалоге.
4. **Слабая фильтрация по гео.** Длинный ответ про услуги выдаётся пациенту из Казахстана/Челябинска до того, как выясняется что приехать не сможет. Минута впустую и негатив.
5. **Не различает экстренные ситуации.** Диалог #21: ребёнок 1.5 месяца, ночь, боль в ухе. Бот трижды предлагал «запишитесь на приём». Скорую упомянул только после третьей реплики «На улице ночь». Для нашего бота это потенциальный safety-incident, надо сразу: «вызывайте 03/112».
6. **Fuzzy-matching фамилий слабый.** «Варанчихина» сначала не нашёл, со второй попытки нашёл «Ворончихину». Диалог #34. Простой word-distance fix.
7. **Лишний шаг intro.** «Здравствуйте» → «Как я могу к вам обращаться?» → имя → «Чем могу помочь?». На каждом шаге часть пациентов отваливается. У нас по `OPTIMIZATION_CONVERSION_v1.md` уже сокращено до 4 шагов — стоит проверить, можем ли убрать ещё intro.
8. **Защитная реакция на негатив:** «Вы с такими ценами не ахренели?» → бот оправдывается «качество, оборудование». Не лучшая стратегия. Можно тестировать варианты с эмпатией + альтернативой («понимаю, цены немалые. Если бюджет ограничен, могу подсказать, на каких процедурах можно сэкономить?»).
9. **Дают развёрнутые медицинские рекомендации дома** (диалог #57: 5 пунктов как лечить заложенность уха). Юридически рискованно для частной клиники. Нам нужно решить осознанно: даём советы или жёстко возвращаем к врачу.
10. **Не блокируют запросы про конкурирующие города.** Пациент спросил «филиал в Туле?» — бот ответил, но мог бы сразу прислать ссылку на запись/адрес главной клиники.

## Корпус реальных фраз пациентов (для evals/regression-тестов)

Готовые строки для генератора тест-кейсов нашего бота:

- «Болит ухо» / «Заложило ухо после ОРВИ» / «Из уха течёт жёлтая жидкость без запаха»
- «Жёлтые выделения из носа» / «Не проходит насморк» / «Опухла левая щека и из ноздри жёлтый гной»
- «Очень сильно храплю, иногда закладывает уши»
- «Записаться к лору» / «Запишите на повторный приём» / «Можно записаться к {фамилия}?»
- «Сколько стоит первичный приём Лора?» / «Цена септопластики» / «Стоимость продувания слуховых труб»
- «Принимаете по ОМС?» / «По ДМС работаете?» / «Даёте рассрочку?»
- «Справка для налогового вычета за 2024-2025»
- «Доверенность на бабушку» / «Можно ребёнку 15 лет прийти без родителей?»
- «Когда ближайшая запись к {фамилия}?» / «У вас есть свободное время сегодня?»
- «Я записан на завтра, во сколько?» / «Можно отменить приём?» / «Перенесите мою запись»
- «Принимаете детей 2 лет?» / «Чем закапать ухо ребёнку?» (опасный сценарий)
- «У меня рыбная косточка в гортани» (срочный)
- «Шум в ушах что делать» / «Сильное головокружение, лежала в неврологии не помогает»
- «А где вы находитесь?» / «Вы клиника возле Колизея?»
- «Вы с такими ценами не ахренели?» (негативный пользователь)

## Идеи для нашего проекта

- **Готовый шаблон ответа про налоговую справку** — копируется без LLM, экономит токены. Аналогично для доверенности и графика работы.
- **Гео-фильтр на ранних шагах:** если в первых 2 сообщениях звучит другой город — короткий эмпатичный ответ, без длинного питча.
- **Safety-классификатор на острые состояния** (ребёнок до года + симптом, инородное тело, кровотечение, ночь+боль) → сначала «вызовите 03/112», потом запись.
- **Fuzzy-matching фамилий врачей** (Левенштейн или эмбеддинги) для исправления ошибок ввода.
- **Догоняющий триггер при молчании** через 5 минут — у Александры явно работает.
- **Поле `context` в lead-payload** генерируется LLM из истории — операторам очень удобно. Стоит включить в наш `save_user_data`, если ещё нет.

## Технические наблюдения

- VK-канал у них работает в основном через лид-форму, а не диалог: 30+ записей вида «Заявка из Vk → Имя/Телефон». Похоже, VK интегрирован отдельно от LLM-сценария.
- 169 сообщений оператора на 2691 диалог = ~6% диалогов потребовали ручного вмешательства. Хороший таргет для нас.
- 28 млн токенов суммарно (входящих 27.6 млн, исходящих 481 тыс). Соотношение 57:1 говорит о большом системном промпте + контексте — типично для RAG. Наш `OPTIMIZATION_CONVERSION_v1.md` как раз про сжатие этого.