RAG_helper

Author	SHA1	Message	Date
AR 15 M4	7ec2ba3c8f	feat(sprint3): редактор системного промпта и правил с версионированием Операторы получают веб-редактор: правят системный промпт и правила, сохраняют как новую версию, активируют, откатываются. Активная версия используется в «Песочнице» на каждый /chat. Принципы, согласованные заранее: - Сохранённые версии не редактируются — только создание новой. Честный откат: v1 всегда та же, что была при создании. - Правила на этом этапе — свободный markdown (textarea). Переход на структурированные правила (pattern → instruction) — в бэклог. - Файл prompts/system_prompt.md становится сид-источником: при первом старте, если таблица agent_configs пустая, из него создаётся v1 и активируется. Дальше правда идёт из БД, файл не трогаем. - rules_text конкатенируется с system_prompt в один system-message через compose_full_system_prompt: "{prompt}\n\nДополнительные правила:\n{rules}". - Активную версию удалить нельзя — сначала активируют другую. Модель и миграция: - db/models/AgentConfig: id, version (unique/indexed), name (nullable), system_prompt, rules_text, is_active (indexed), created_at. Без updated_at — версии неизменяемы. - Миграция b4450e33664d_add_agent_configs_table. Сервисы и роутеры: - services/config_service: ensure_seed (seed v1 из файла), list/get/get_active/create (version=max+1, при activate атомарно сбрасывает is_active у остальных и ставит новой), activate_config (та же схема), delete_config (возвращает причину отказа: not_found / active), compose_full_system_prompt. - services/chat_service.send_message: берёт active_cfg, собирает system_prompt через compose_full_system_prompt, пишет thread.agent_config_id при создании треда (колонка была nullable ещё со Спринта 2 — пригодилась именно здесь). - routers/configs: GET /configs, GET /configs/active, GET /configs/{id}, POST /configs (activate-флаг), POST /configs/{id}/activate, DELETE /configs/{id} (404 / 400 если активная). - Pydantic: AgentConfigCreateRequest, AgentConfigInfo, ListResponse, DeleteResponse. - main.py: ensure_seed в lifespan после инициализации БД/Chroma/LLM. UI: - static/settings.html — трёхблочная страница: имя версии, textarea промпта, textarea правил, «Сохранить как новую» + галка «Сразу активировать», «Загрузить активную в редактор». Справа — список версий с бейджем «активная», действиями «Активировать» / «Удалить» (disabled у активной) / «Загрузить в редактор». При первом заходе активная версия автоматом подгружается в редактор. - В nav на index.html и sandbox.html добавлена ссылка «Настройки». - В шапке «Песочницы» — зелёный кликабельный бейдж «активная: vN · имя» (ведёт на /settings.html), обновляется раз в 15 с. E2E проверено: создана v2 с правилом «ВСЕГДА начинай со слов СПАСИБО ЗА ВОПРОС», активирована; следующий /chat вернул ответ, начинающийся ровно с этой фразы; assembled_prompt содержит блок «Дополнительные правила». После отката на v1 тест-v2 удалена. SPRINTS.md: Спринт 3 помечен закрытым. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 19:59:06 +05:00
AR 15 M4	6348d9a206	docs: актуализация README, закрытие Спринта 2.5 README переписан под текущее состояние — был TBD со времён init: - Статус: Спринты 1–2 и доработки (2.5) закрыты, что именно уже работает (RAG, многошаговый диалог, переиндексация, две страницы). - Запуск: команды для установки, старта, ручного наката миграций и создания новых. Автомиграции на старте отмечены. - Использование: табличка API-эндпоинтов (/documents, /query, /chat, /threads, /reindex), описание двух веб-страниц и правки системного промпта через prompts/system_prompt.md. - Структура: актуальное дерево директорий с назначением каждого модуля (db/, prompts/, routers/, services/, static/). SPRINTS.md: Спринт 2.5 помечен закрытым — все пять задач пройдены (логи, системный промпт в файле, markdown-рендер, чистка чанков + reindex, README). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 11:21:10 +05:00
AR 15 M4	e534a74460	feat(sprint2.5): чистка чанков и переиндексация Чанкер тащил в базу markdown-мусор: навигационные блоки «Вернуться на:» со списками ссылок, инлайн-ссылки [текст](url) в теле, служебные пометки _Источник: .../file.md_, лишние пустые строки. Всё это ело контекст LLM и засоряло правую панель отладки. - services/text_cleanup: clean_markdown_text — удаляет навигационные строки, строки-только-ссылки (обычно это меню), служебные _Источник:_, раскрывает инлайн-ссылки [x](url) → x, сжимает 3+ переносов до 2. - services/document_processor: process_document теперь возвращает (id, raw_text, sections, chunks); чистку применяем к заголовкам и телам секций; чанки короче 20 символов выбрасываем с пересчётом индексов. Вспомогательная rechunk_raw_text — для переиндексации. Чтобы переиндексировать без повторной загрузки файла, нужен исходный текст. Вводим отдельный слой: - новая таблица SQLite documents (id, name, file_type, raw_text, created_at, updated_at) + миграция Alembic 7ee7296ccd6d. - db/models/Document + регистрация в db.models.__init__. - services/document_service: save/get/list/delete для raw_text. - routers/documents.upload: сохраняет raw_text в SQLite перед индексацией в Chroma; delete убирает и из SQLite, и из Chroma. - Новые эндпоинты POST /documents/{id}/reindex и POST /documents/reindex-all — берут raw_text из SQLite, пропускают через rechunk_raw_text, заменяют чанки в Chroma. Существующие 4 документа были перезалиты вручную (решение: не делать одноразовый backfill, проще залить заново). Старая Chroma очищена, новые чанки прошли через чистку — мусор ушёл. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 11:15:08 +05:00
AR 15 M4	4e45b8b181	feat(sprint2.5): логи, вынесение системного промпта, markdown-рендер Три подряд доработки по плану Спринта 2.5. 1) Логи. Проблема: uvicorn ставит handlers на root-logger до того, как отработает наш lifespan, поэтому logging.basicConfig там был no-op, и logger.exception ничего не писал. Переносим basicConfig на уровень импорта main.py с force=True — наш StreamHandler перебивает uvicorn-овский root, остальные логгеры (uvicorn.access, uvicorn.error, alembic, chromadb) остаются со своими форматами. В lifespan basicConfig больше не зовётся. 2) Системный промпт вынесен из services/llm_client.py в prompts/system_prompt.md. LLMClient читает файл при импорте модуля через _load_system_prompt(); если файла нет — пустая строка + warning. Это задел под Спринт 3, где промпт будет редактируемым и версионируемым — физически положить его как файл дешевле, чем держать в исходниках. 3) Markdown в ответах ассистента. Подключены marked и DOMPurify с CDN в sandbox.html. Рендер через renderMd(text): marked.parse + DOMPurify.sanitize — защищает от <script> на случай, если LLM вернёт сырой HTML. Реплики пациента остаются plain text (esc). Добавлены стили для p/ul/ol/code/pre/a/h1-h3/blockquote внутри .msg.assistant, чтобы всё выглядело уместно в пузыре. Обёртка msg-body введена, чтобы разделить контент и msg-meta. План в SPRINTS.md уточнён по переиндексации — будет отдельный endpoint. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:53:01 +05:00
AR 15 M4	835c0b3cc3	docs: план Спринта 2.5 — доработки после пилота По итогам Спринтов 1–2 накопился технический долг и несколько косяков, которые видно при живой работе в «Песочнице». Выделяем промежуточный спринт-доработок перед заходом на Спринт 3: - Качество RAG: чанкер тащит в базу markdown-ссылки, блоки навигации вроде «Вернуться на:», дубликаты меню — из-за этого в LLM уходит мусор вместо полезного контекста. - UI: ответ ассистента рендерится plain text с сырыми ** и дефисами списков — в чате это читать тяжело. - Системный промпт зашит в services/llm_client.py — перед Спринтом 3 (редактор промпта) его логично вынести в отдельный файл. - Логи: logger.exception сейчас съедается конфигом uvicorn, traceback при 500-х не виден — диагностика вслепую. - README не обновлялся с init-коммита, не отражает ни Спринта 1, ни 2. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:43:41 +05:00
AR 15 M4	22ac40450f	feat(sprint2): страница «Песочница» + навигация между страницами Завершающий кусок Спринта 2 — UI для ведения диалогов. static/sandbox.html: - Трёхколоночная раскладка во всю высоту экрана. - Слева: список сохранённых диалогов (имя, дата последнего обновления, счётчик сообщений, превью первой реплики), кнопка «+ новый»; на каждой карточке — «переименовать» (prompt) и «удалить» (confirm). - Центр: чат в привычной стилистике (пузыри, user справа, assistant слева), Enter — отправить, Shift+Enter — перенос строки. Заголовок сверху показывает имя активного треда. - Справа: отладка ответа — найденные фрагменты со score в процентах + собранный промпт в моноширинном блоке на светлом фоне. - При отправке первой реплики тред создаётся автоматически, API возвращает thread_id и thread_name — дальше реплики уходят в тот же тред. static/index.html: в шапке добавлены ссылки «Отладка» / «Песочница», подсветка активной страницы; тот же стиль nav-ссылок продублирован в sandbox.html. routers/chat: detail сообщения ошибки теперь включает тип исключения (удобнее при диагностике), trace пишется через logger.exception. SPRINTS.md: Спринт 2 помечен как закрытый. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:37:57 +05:00
AR 15 M4	3c2657ab99	feat(sprint2): диалог с памятью треда — POST /chat + CRUD тредов Второй кусок Спринта 2: агент теперь помнит контекст. RAG-retrieval делается по последней реплике пациента, в LLM уходит системный промпт + последние 20 сообщений треда + новая реплика + найденные фрагменты. Backend: - services/chat_service: send_message — создаёт тред при необходимости (auto-имя из первой реплики + UTC-дата), сохраняет user-реплику до вызова LLM (чтобы не потерять при сбое), делает retrieval, грузит историю треда (desc/limit 20 → reversed для хронологии), зовёт llm.chat, сохраняет ответ ассистента вместе с sources_json и assembled_prompt, обновляет thread.updated_at. Плюс list_threads с JOIN-выборкой превью первой реплики и счётчика сообщений, get_thread_detail через selectinload, rename_thread, delete_thread (CASCADE на FK делает уборку сообщений автоматически, но explicit delete оставлен для подсчёта удалённых). - services/llm_client.chat: принимает history=[{role, content}, ...], собирает messages = [system, ...history, user-с-RAG]; assembled_prompt дампит всю цепочку в виде [SYSTEM]/[USER]/[ASSISTANT]-блоков для отображения в Debug UI. - routers/chat: POST /chat, обрабатывает LookupError → 404. - routers/threads: GET /threads, GET /threads/{id}, PATCH /threads/{id} (переименовать), DELETE /threads/{id}. - models: ChatRequest, ThreadRenameRequest; ChatResponse, ThreadInfo, ThreadListResponse, ThreadDetailResponse, MessageInfo, ThreadDeleteResponse. Запуск: - В lifespan main.py: автоматический alembic upgrade head через asyncio.to_thread (сам alembic делает asyncio.run внутри, его нельзя звать из уже работающего event loop). LLMClient инициализируется один раз при старте — вместо создания на каждый запрос. E2E проверено: новый тред → агент отвечает и просит представиться; вторая реплика в том же треде — агент помнит контекст; PATCH переименовывает; DELETE удаляет тред с каскадом на сообщения. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:11:59 +05:00
AR 15 M4	75048bb88e	feat(sprint2): инфраструктура БД — SQLAlchemy 2.0 async + Alembic Первый кусок Спринта 2: подключаем SQLite через SQLAlchemy 2.0 (async, ORM-стиль) и Alembic для миграций. Схема выбрана под будущий рост — в threads сразу заведены nullable user_id и agent_config_id, чтобы Спринты 3+ не тащили миграции задним числом. - requirements.txt: sqlalchemy[asyncio]==2.0.36, aiosqlite==0.20.0, alembic==1.14.0. - config: database_url + sqlite_path (./data/sqlite/app.db). - db/base.py: DeclarativeBase; db/session.py: async engine, async_sessionmaker, get_session — FastAPI-dependency. - db/models/Thread: id, name, user_id?, agent_config_id?, created_at, updated_at; relationship messages с cascade all, delete-orphan. - db/models/Message: id, thread_id FK CASCADE, role, text, sources_json, assembled_prompt, created_at. - Alembic инициализирован через async-шаблон, env.py доработан: sys.path, url из settings, target_metadata = Base.metadata. - Начальная миграция e7199587be4b применена, таблицы threads/messages с индексами на FK и nullable-колонки созданы в data/sqlite/app.db. - .gitignore: исключаем data/sqlite/ (БД — артефакт, не исходник). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 10:05:10 +05:00
AR 15 M4	4a5695ed9c	feat(sprint1): показ эмбеддингов чанков на странице отладки Расширяем просмотр документа, чтобы оператор видел не только текстовые чанки, но и как они лежат в ChromaDB в виде векторов — по паттерну из work-pcs-dr-cdss. Backend: - services/vectorstore.get_document_chunks теперь запрашивает include=["embeddings"] и отдаёт вектор как list[float]. Chroma возвращает numpy-массивы, поэтому проверка наличия embeddings сделана через len(), без or-шортката. - models.ChunkDetail: поля embedding: list[float] + embedding_dim: int. - routers/documents прокидывает вектор и размерность в ответ. Frontend (static/index.html): - В карточку чанка добавлен блок .chunk-card-actions с кнопкой «вектор (N dim)»; раскрывается в .embedding-box с полным списком координат (округление до 6 знаков, моноширинный шрифт, скролл). - Функция toggleChunkText переписана через .closest + querySelector, чтобы не ломаться от новой обёртки кнопок. - Добавлена toggleEmb(embId). Проверено на загруженных документах — возвращается по 1024 координаты (E5-large), совпадает с ожиданиями embedding-модели. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 09:59:24 +05:00
AR 15 M4	ccc3dde978	docs: план Спринта 2 — диалог с памятью + отдельная страница «Песочница» Уточнения к плану Спринта 2 по итогам обсуждения: - Вторая отладочная страница /sandbox вместо расширения текущей (старый Debug UI остаётся нетронутым). - Все диалоги сохраняются навсегда, видны в левой колонке; можно открыть старый тред, переименовать, удалить. Имя треда — автоматом по первой реплике, с возможностью поменять. - Стек хранилища: SQLite + SQLAlchemy 2.0 async + Alembic. Выбор под будущий рост (мульти-пользователи, мульти-промпты, несколько спец-RAG). - В таблицу threads сразу заводим nullable-колонки user_id и agent_config_id — чтобы Спринты 3+ не тащили миграции задним числом. - Набор эндпоинтов расширен: GET/PATCH/DELETE /threads, GET /threads/{id}. В бэклог: хранение исходных файлов для переиндексации без повторной загрузки. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-23 09:50:42 +05:00
AR 15 M4	a7f78d71b2	feat: Спринт 1 — RAG-ядро, загрузка wiki и Debug UI FastAPI + ChromaDB + E5-large + DeepSeek по паттерну work-pcs-dr-cdss, адаптированному под пациентский контекст: - services: embeddings (E5-large с префиксами), vectorstore (коллекция operators_wiki), document_processor (PDF/DOCX/TXT/MD + чанкер с FAQ- паттерном под wiki), llm_client (системный промпт ассистента клиники), rag_pipeline (одиночный вопрос → retrieval → ответ). - routers: /health, /documents (upload, list, chunks, delete), /query. - static/index.html: шапка со статусом, блок базы знаний с раскрытием чанков по клику, блок тест-вопроса с 3-колоночным ответом (чанки со score / собранный промпт / ответ LLM). - Порт 8003 (8001 занят CDSS, 8002 — voicenote). E2E проверен: загрузка wiki_test.md → 2 чанка, вопрос «как записать ребёнка к лору?» → top score 84.8%, корректный ответ DeepSeek. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-22 14:57:34 +05:00
AR 15 M4	d1e7749605	docs: init — README и SPRINTS для инструмента настройки пациентского чат-агента Скоуп MVP: RAG-ядро + веб-инструмент настройки (загрузка wiki, песочница, промпт/правила с версиями, сценарии, экспорт конфига). Интеграцию с каналами (приложение, МАКС) делает другой разработчик. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-22 13:58:53 +05:00

12 Commits