feat(sprint4): фундамент графа — intents + роутер + переключение веток

Первый шаг графовой архитектуры из GRAPH_ARCHITECTURE.md. Заменили
«один активный промпт на всё» на «свой промпт на каждую ветку +
роутер выбирает ветку на каждой реплике».

Данные:
- Новая таблица intents (code, name, description, is_enabled,
  order_index). Коды с префиксом `_` — системные (не responder).
- В agent_configs добавлен intent_id (nullable, FK SET NULL); убрана
  глобальная уникальность version, вместо неё UniqueConstraint
  (intent_id, version) — у каждой ветки свой счётчик версий.
- В messages добавлен intent_id (nullable, FK) — фиксируем, какую
  ветку выбрал роутер для каждой реплики.
- Миграция cd0a88ef9080 в batch-режиме (SQLite не умеет ALTER для
  constraints напрямую).

Сид:
- Стартовые 7 веток: new_booking, reschedule, price_question,
  medical_question, general_info, escalate_human + `_router` как
  системная ветка для промпта классификатора.
- Для каждой ветки — свой v1-промпт из prompts/intents/{code}.md.
- migrate_legacy_config_to_general_info: старый v1 из Спринта 3
  (без intent_id) переносится на general_info с сохранением версии.
- ensure_seed_intents досиживает недостающие коды, существующие не
  трогает — безопасно при добавлении новых веток.

Оркестрация и роутер:
- services/router_client.RouterClient — отдельный класс от LLMClient
  (под будущую смену модели на более дешёвую). Метод classify(session,
  history, text) возвращает {code, version}. Промпт классификатора
  подтягивается из активного конфига ветки `_router`, fallback —
  prompts/intents/_router.md. При сомнении/ошибке возвращает
  general_info.
- services/chat_service.send_message теперь идёт через router.classify
  → берёт активный конфиг выбранной ветки → llm.chat. В сообщения
  пишется intent_id, в треде фиксируется начальный agent_config_id.
  В ответе — intent_code, intent_name, config_version, router_version.

API:
- GET /intents, GET /intents/{code}, PATCH /intents/{code} —
  список веток со счётчиком версий, получение и переключение
  is_enabled.
- /configs теперь требует intent_code как Query-параметр
  (GET /configs, GET /configs/active) — выборка версий в рамках
  ветки. POST /configs принимает intent_id.
- get_thread_detail JOIN-ит Intent — каждая реплика возвращает
  intent_code + intent_name.

UI:
- settings.html переработан в 3-колоночный макет: слева список веток
  с подгруппой «Системные» для `_router` (пометка «система» вместо
  свитча), в центре редактор промпта/правил активной версии выбранной
  ветки, справа список версий с активировать/удалить/загрузить.
  Каждая ветка редактируется независимо — своя история версий,
  своя активная.
- sandbox.html: у каждой реплики бейдж с intent_code, в отладке новый
  блок «Решение роутера» (подсвеченный зелёным) с названием ветки,
  версией её активного конфига и версией промпта роутера. Старый
  «активная: v1» индикатор убран — он больше не имеет смысла (активная
  у каждой ветки своя).

E2E проверено: разные реплики уходят в корректные ветки, каждая
отвечает по своему узкому промпту, промпт роутера редактируется в UI
как v2/v3 и откатывается — классификация сразу использует новую
версию.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
AR 15 M4
2026-04-23 21:20:23 +05:00
parent 2e2f2321c3
commit b24e985f82
25 changed files with 1135 additions and 261 deletions
+6 -1
View File
@@ -22,7 +22,12 @@ class ThreadRenameRequest(BaseModel):
class AgentConfigCreateRequest(BaseModel):
intent_id: int = Field(..., description="ID ветки (intent), к которой относится конфиг")
system_prompt: str = Field(..., min_length=1)
rules_text: str = Field("", description="Правила в свободной markdown-форме")
name: str | None = Field(None, max_length=200)
activate: bool = Field(False, description="Сразу сделать новую версию активной")
activate: bool = Field(False, description="Сразу сделать новую версию активной в рамках ветки")
class IntentToggleRequest(BaseModel):
is_enabled: bool
+25
View File
@@ -86,6 +86,8 @@ class MessageInfo(BaseModel):
created_at: str
sources: list[SourceInfo] = Field(default_factory=list)
assembled_prompt: str = ""
intent_code: str = ""
intent_name: str = ""
class ThreadInfo(BaseModel):
@@ -114,6 +116,10 @@ class ChatResponse(BaseModel):
thread_id: int
thread_name: str
message_id: int
intent_code: str = ""
intent_name: str = ""
config_version: int = 0
router_version: int | None = None
answer: str
sources: list[SourceInfo]
model_used: str
@@ -127,6 +133,9 @@ class ThreadDeleteResponse(BaseModel):
class AgentConfigInfo(BaseModel):
id: int
intent_id: int | None = None
intent_code: str = ""
intent_name: str = ""
version: int
name: str | None = None
system_prompt: str
@@ -142,3 +151,19 @@ class AgentConfigListResponse(BaseModel):
class AgentConfigDeleteResponse(BaseModel):
ok: bool = True
class IntentInfo(BaseModel):
id: int
code: str
name: str
description: str = ""
is_enabled: bool
order_index: int
active_config_id: int | None = None
active_config_version: int | None = None
class IntentListResponse(BaseModel):
intents: list[IntentInfo]
total: int