Files
RAG_helper/routers/chat.py
T
AR 15 M4 932b488bcb feat(sprint6a): блоки A2, B, C — exit_conditions, handoff_count, suspended/resume
Блок A2: вынос условий выхода из основного промпта в отдельное поле
agent_configs.exit_conditions_text. compose_full_system_prompt склеивает
system_prompt + rules_text + exit_conditions_text перед отправкой в модель.
Одноразовая миграция данных при старте: пытаемся выделить блок «Условия
выхода» из хвоста существующих system_prompt-ов и перенести в новое поле
(поддерживаются три формы заголовка: «## Условия выхода», «**Условия
выхода**», просто «Условия выхода:»). В UI «Настройки» — третья textarea
с подсказкой ⓘ на отдельной кнопке.

Блок B: защита от петель маршрутизации (v2 §4.3). В thread_state добавлена
колонка handoff_count, инкрементируется на каждом hard-handoff: либо когда
роутер переключает не-sm-ветку (state reset), либо когда sm-ветка сама
выдаёт [INTENT_CHANGE: …] (bouncing). При превышении HANDOFF_CAP=3 диалог
автоматически уводится в escalate_human с шаблонным ответом «Уточню детали
с администратором клиники, свяжемся с вами в течение ближайшего часа», LLM
не вызывается, handoff_count сбрасывается. В Песочнице видны счётчик
«переключений ветки в диалоге» и красная плашка при срабатывании защиты.
Также пофикшен баг: для не-sm-веток snapshot.current_intent_code теперь
финализируется на served_code, иначе на следующей реплике prev_intent_code
терялся и handoff_count не считался.

Блок C: suspended_intent / resumable_step_code / resumable_slots_json в
thread_state (v2 §4.4). При hard-handoff из sm-ветки через [INTENT_CHANGE]
текущий сценарий запоминается (если suspended ещё не занят). Когда роутер
на следующих репликах возвращает intent = suspended_intent — RESUME:
восстанавливаем current_intent_code, current_step_code, slots; suspended_*
очищается, handoff_count=0. Возврат имеет приоритет над sticky-логикой.
В Песочнице — синяя плашка «📌 отложен сценарий X (шаг Y)» во время detour'а
и зелёная «↩️ возврат к отложенному сценарию» в момент resume. Routing-loop
guard и роутер-driven handoff не теряют suspended (только при authoritative
сценариях вроде эскалации он сбрасывается).

Прогон вручную: detour из new_booking/qualify в price_question и обратно
восстанавливает name=Алексей, reason=болит ухо на исходном шаге.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-25 12:46:10 +05:00

79 lines
3.1 KiB
Python

import logging
from fastapi import APIRouter, Depends, HTTPException
from sqlalchemy.ext.asyncio import AsyncSession
from db.session import get_session
from models.requests import ChatRequest
from models.responses import (
BounceInfo,
ChatResponse,
SourceInfo,
ThreadStateInfo,
ValidationEventInfo,
)
from services import chat_service
from services.llm_client import LLMUnavailableError
logger = logging.getLogger(__name__)
router = APIRouter(prefix="/chat", tags=["chat"])
@router.post("", response_model=ChatResponse)
async def chat(req: ChatRequest, session: AsyncSession = Depends(get_session)):
from main import llm_client, router_client, vectorstore_service
if vectorstore_service is None or llm_client is None or router_client is None:
raise HTTPException(status_code=503, detail="Service not ready")
try:
result = await chat_service.send_message(
session=session,
vectorstore=vectorstore_service,
llm=llm_client,
router=router_client,
text=req.text,
thread_id=req.thread_id,
top_k=req.top_k,
temperature=req.temperature,
max_tokens=req.max_tokens,
)
except LookupError as e:
await session.rollback()
raise HTTPException(status_code=404, detail=str(e))
except LLMUnavailableError as e:
# Внешний LLM недоступен даже после ретрая — откатываем, чтобы не оставлять
# «тред-призрак» с одной пользовательской репликой и без ответа ассистента.
await session.rollback()
logger.warning("LLM unavailable: %s", e)
raise HTTPException(
status_code=503,
detail="Внешняя модель временно недоступна. Попробуйте ещё раз через минуту.",
)
except Exception as e:
await session.rollback()
logger.exception("Chat failed")
raise HTTPException(status_code=500, detail=f"Chat error [{type(e).__name__}]: {e}")
return ChatResponse(
thread_id=result["thread_id"],
thread_name=result["thread_name"],
message_id=result["message_id"],
intent_code=result["intent_code"],
intent_name=result["intent_name"],
router_intent_code=result.get("router_intent_code", ""),
config_version=result["config_version"],
router_version=result.get("router_version"),
answer=result["answer"],
sources=[SourceInfo(**s) for s in result["sources"]],
model_used=result["model_used"],
assembled_prompt=result["assembled_prompt"],
thread_state=ThreadStateInfo(**result["thread_state"]),
bounces=[BounceInfo(**b) for b in result.get("bounces", [])],
validation_events=[ValidationEventInfo(**v) for v in result.get("validation_events", [])],
parse_error=result.get("parse_error"),
routing_loop_triggered=result.get("routing_loop_triggered", False),
resumed_from_suspended=result.get("resumed_from_suspended", False),
)