| `model_path` | str | - | Путь к файлу модели GGUF |
| `corpus_path` | str | "rag_corpus.json" | Путь к JSON-файлу с корпусом |
| `db_path` | str | "./chroma_db" | Путь к базе данных ChromaDB |
| `embedding_model_name` | str | "cointegrated/rubert-tiny2" | Модель для эмбеддингов |
| `top_k` | int | 3 | Количество извлекаемых примеров |
| `n_ctx` | int | 4096 | Размер контекста |
| `n_gpu_layers` | int | -1 | Количество слоев на GPU (-1 = все) |
| `use_gpu_for_embeddings` | bool | True | Использовать GPU для эмбеддингов |
## 📊 Примеры работы
| Вход | Выход |
|------|-------|
| `"Кашель сухой, температура 38"` | `"Пациент предъявляет жалобы на сухой кашель, повышение температуры тела до 38 градусов."` |
| `"А.д. 140, заложенность ушей"` | `"Пациент жалуется на повышение артериального давления до 140 мм рт.ст., заложенность ушей и частичное снижение слуха."` |
| `"ушные палочки 5 лет, снижение слуха 2 года"` | `"Пациент отмечает использование ушных палочек в течение 5 лет и постепенное снижение слуха на протяжении последних 2 лет."` |
## 🛠 Технические детали
### Архитектура системы
1. **Векторный поиск**: ChromaDB с русскоязычными эмбеддингами
2. **Языковая модель**: YandexGPT-5-Lite-8B с оптимизацией для GPU