# Medical RAG System with YandexGPT Система для автоматического преобразования кратких медицинских записей в развернутые формулировки жалоб пациентов с использованием RAG (Retrieval-Augmented Generation) и модели YandexGPT. ## 🚀 Особенности - **RAG-архитектура**: Поиск релевантных медицинских примеров из базы знаний - **Гибкое использование GPU**: Автоматическое определение и использование GPU для ускорения работы - **Управление токенами**: Интеллектуальное ограничение длины контекста - **Русскоязычная оптимизация**: Специально настроена для работы с медицинскими текстами на русском языке - **Хранение состояния**: Сохранение векторной базы данных между сессиями ## 📋 Требования ### Аппаратные требования - **Минимально**: CPU с 8+ GB RAM - **Рекомендуется**: GPU с 8+ GB VRAM (NVIDIA) - **Память**: 10+ GB свободного места ### Программные требования - Python 3.8+ - PyTorch (с поддержкой CUDA при наличии GPU) - Библиотеки: `chromadb`, `llama-cpp-python`, `sentence-transformers`, `tiktoken` ### Модель [YandexGPT-5-Lite-8B-instruct-Q4_K_M](https://huggingface.co/yandex/YandexGPT-5-Lite-8B-instruct-GGUF/resolve/main/YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf?download=true)