add external service

2026-03-18 00:27:49 +05:00
parent 9fc60e8d19
commit bf507b5363
2 changed files with 2 additions and 393 deletions
@@ -1,393 +0,0 @@
-"""
-API endpoints для управления аудиофайлами (регистрация и пакетная обработка)
-Используется Calls_WEB_Client_main для оркестрации процесса распознавания
-"""
-from fastapi import APIRouter, HTTPException, Depends, BackgroundTasks
-from sqlalchemy.orm import Session
-from pydantic import BaseModel
-from typing import Optional, List
-import os
-import logging
-from datetime import datetime
-
-from apiApp.database import get_db
-from apiApp.database.Audio import Audio
-from apiApp.config import AUDIOFILES_PATH
-
-logger = logging.getLogger(__name__)
-audio_management_router = APIRouter()
-
-
-class AudioRegisterRequest(BaseModel):
-    """Запрос на регистрацию аудиофайла"""
-    filename: str
-    file_path: str  # Полный путь к файлу в общей папке audiofiles
-
-
-class AudioProcessAllRequest(BaseModel):
-    """Запрос на пакетное распознавание"""
-    limit: int = 100
-
-
-class AudioRegisterResponse(BaseModel):
-    """Ответ на регистрацию аудиофайла"""
-    id: str
-    filename: str
-    file_size: int
-    created_at: datetime
-
-
-@audio_management_router.post("/audio/register", response_model=AudioRegisterResponse, status_code=201)
-async def register_audio_file(
-    request: AudioRegisterRequest,
-    db: Session = Depends(get_db)
-):
-    """
-    Регистрация аудиофайла в БД (без копирования файла)
-
-    Создаёт запись в таблице Audio для файла, который уже находится
-    в общей папке audiofiles. НЕ копирует файл, только создаёт запись в БД.
-
-    Args:
-        request: {filename: "in-xxx.wav", file_path: "/app/audiofiles/in-xxx.wav"}
-
-    Returns:
-        201 Created + информация о созданной записи
-        400 Bad Request если файл уже зарегистрирован
-        404 Not Found если файл не существует на диске
-    """
-    try:
-        filename = request.filename
-        file_path = request.file_path
-
-        logger.info(f"📝 Регистрация файла: {filename}")
-
-        # Проверяем, что файл уже существует в общей папке
-        if not os.path.exists(file_path):
-            logger.error(f"❌ Файл не найден: {file_path}")
-            raise HTTPException(
-                status_code=404,
-                detail=f'Файл не найден на диске: {file_path}'
-            )
-
-        # Проверяем, что файл не был уже зарегистрирован
-        existing_audio = db.query(Audio).filter(Audio.filename == filename).first()
-        if existing_audio:
-            logger.warning(f"⚠️ Файл уже зарегистрирован: {filename}")
-            raise HTTPException(
-                status_code=400,
-                detail=f'Файл {filename} уже зарегистрирован в БД'
-            )
-
-        # Получаем размер файла
-        file_size = os.path.getsize(file_path)
-
-        # Создаём запись в БД
-        audio = Audio()
-        audio.filename = filename
-        audio.file_size = file_size
-        audio.index_date = datetime.utcnow()
-
-        db.add(audio)
-        db.commit()
-        db.refresh(audio)
-
-        logger.info(f"✅ Файл зарегистрирован: {filename} (audio_id={audio.id})")
-
-        return AudioRegisterResponse(
-            id=str(audio.id),
-            filename=audio.filename,
-            file_size=audio.file_size,
-            created_at=audio.index_date
-        )
-
-    except HTTPException:
-        raise
-    except Exception as e:
-        db.rollback()
-        logger.error(f"❌ Ошибка при регистрации файла: {e}")
-        raise HTTPException(
-            status_code=500,
-            detail=f'Ошибка при регистрации: {str(e)}'
-        )
-
-
-def process_audio_file(audio_id: str, db: Session):
-    """
-    Фоновая обработка одного аудиофайла
-
-    Отправляет запрос в GigaAM API для распознавания
-    """
-    try:
-        audio = db.query(Audio).filter(Audio.id == audio_id).first()
-        if not audio:
-            logger.error(f"❌ Audio {audio_id} не найден")
-            return
-
-        logger.info(f"🎵 Запуск распознавания для {audio.filename}")
-
-        # Формируем запрос в GigaAM API
-        from apiApp.config import GIGAAM_API_URL
-        api_url = f"{GIGAAM_API_URL}/api/call/process"
-
-        payload = {
-            "filename": audio.filename
-        }
-
-        # Отправляем запрос в GigaAM API
-        import requests
-        response = requests.post(api_url, json=payload, timeout=10)
-
-        if response.status_code == 200 or response.status_code == 202:
-            logger.info(f"✅ Запущено распознавание для {audio.filename}")
-        else:
-            logger.error(f"❌ Ошибка запуска распознавания для {audio.filename}: {response.status_code} - {response.text}")
-
-    except Exception as e:
-        logger.error(f"❌ Ошибка при обработке {audio_id}: {e}")
-
-
-@audio_management_router.post("/audio/process-all")
-async def process_all_pending_audio(
-    request: AudioProcessAllRequest,
-    background_tasks: BackgroundTasks,
-    db: Session = Depends(get_db)
-):
-    """
-    Запуск распознавания для всех Audio без AiConclusion
-
-    Находит все записи Audio, у которых нет AiConclusion, и запускает
-    распознавание для них (до указанного лимита).
-
-    Args:
-        request: {limit: 100} - максимум файлов для обработки
-
-    Returns:
-        200 OK + {
-            "started_count": 15,
-            "pending_files": ["file1.wav", "file2.wav", ...],
-            "total_pending": 50
-        }
-    """
-    try:
-        limit = request.limit
-
-        logger.info(f"🚀 Поиск Audio без AiConclusion (limit={limit})")
-
-        # Находим все Audio без AiConclusion
-        pending_audio = db.query(Audio).filter(
-            Audio.AiConclusion == None
-        ).order_by(Audio.index_date.asc()).limit(limit).all()
-
-        total_pending = db.query(Audio).filter(Audio.AiConclusion == None).count()
-
-        if not pending_audio:
-            logger.info("ℹ️ Нет файлов для распознавания")
-            return {
-                "started_count": 0,
-                "pending_files": [],
-                "total_pending": 0,
-                "message": "Нет файлов без AiConclusion"
-            }
-
-        logger.info(f"📋 Найдено файлов для обработки: {len(pending_audio)} из {total_pending}")
-
-        # Добавляем задачи в фон
-        started_count = 0
-        pending_files = []
-
-        for audio in pending_audio:
-            # Проверяем, что файл существует
-            file_path = os.path.join(AUDIOFILES_PATH, audio.filename)
-            if not os.path.exists(file_path):
-                logger.warning(f"⚠️ Файл не найден на диске: {audio.filename}")
-                continue
-
-            # Добавляем в фон (асинхронно)
-            # В FastAPI используем BackgroundTasks
-            # Но нужно создавать новую сессию для каждого таска
-            pending_files.append(audio.filename)
-            started_count += 1
-
-            # Запускаем обработку в фоне
-            # Используем lambda для захвата audio_id
-            background_tasks.add_task(
-                process_single_audio,
-                str(audio.id)
-            )
-
-        logger.info(f"✅ Запущено распознавание для {started_count} файлов")
-
-        return {
-            "started_count": started_count,
-            "pending_files": pending_files,
-            "total_pending": total_pending
-        }
-
-    except Exception as e:
-        logger.error(f"❌ Ошибка при запуске пакетного распознавания: {e}")
-        raise HTTPException(
-            status_code=500,
-            detail=f'Ошибка: {str(e)}'
-        )
-
-
-def process_single_audio(audio_id: str):
-    """
-    Обработка одного аудиофайла в фоне
-
-    Создаёт новую DB сессию для обработки
-    """
-    from apiApp.database import SessionLocal
-
-    db = SessionLocal()
-    try:
-        process_audio_file(audio_id, db)
-    finally:
-        db.close()
-
-
-@audio_management_router.get("/audio/pending")
-async def get_pending_audio(
-    db: Session = Depends(get_db),
-    limit: int = 100
-):
-    """
-    Получить список Audio без AiConclusion
-
-    Query Parameters:
-        limit: Максимум файлов (default: 100)
-
-    Returns:
-        Список файлов, ожидающих распознавания
-    """
-    try:
-        pending_audio = db.query(Audio).filter(
-            Audio.AiConclusion == None
-        ).order_by(Audio.index_date.asc()).limit(limit).all()
-
-        files_info = []
-        for audio in pending_audio:
-            file_path = os.path.join(AUDIOFILES_PATH, audio.filename)
-            exists = os.path.exists(file_path)
-
-            files_info.append({
-                "audio_id": str(audio.id),
-                "filename": audio.filename,
-                "file_size": audio.file_size,
-                "created_at": audio.index_date.isoformat() if audio.index_date else None,
-                "exists_on_disk": exists
-            })
-
-        total_pending = db.query(Audio).filter(Audio.AiConclusion == None).count()
-
-        return {
-            "total_pending": total_pending,
-            "count": len(files_info),
-            "files": files_info
-        }
-
-    except Exception as e:
-        logger.error(f"❌ Ошибка при получении списка: {e}")
-        raise HTTPException(
-            status_code=500,
-            detail=str(e)
-        )
-
-
-@audio_management_router.get("/audio/stats")
-async def get_audio_stats(db: Session = Depends(get_db)):
-    """
-    Получить статистику по аудиофайлам
-
-    Returns:
-        Статистика по Audio записям
-    """
-    try:
-        total_audio = db.query(Audio).count()
-        with_conclusion = db.query(Audio).filter(Audio.AiConclusion != None).count()
-        without_conclusion = db.query(Audio).filter(Audio.AiConclusion == None).count()
-
-        # Проверяем существование файлов на диске
-        all_audio = db.query(Audio).all()
-        existing_count = 0
-        for audio in all_audio:
-            file_path = os.path.join(AUDIOFILES_PATH, audio.filename)
-            if os.path.exists(file_path):
-                existing_count += 1
-
-        return {
-            "total_audio": total_audio,
-            "with_conclusion": with_conclusion,
-            "without_conclusion": without_conclusion,
-            "existing_on_disk": existing_count,
-            "missing_on_disk": total_audio - existing_count
-        }
-
-    except Exception as e:
-        logger.error(f"❌ Ошибка при получении статистики: {e}")
-        raise HTTPException(
-            status_code=500,
-            detail=str(e)
-        )
-
-
-def auto_restore_on_startup(db: Session, limit: int = 100):
-    """
-    Автоматическое восстановление распознавания при старте FileAudioAPI
-
-    Проверяет, есть ли файлы без AiConclusion, и запускает их распознавание
-
-    Args:
-        db: Сессия БД
-        limit: Максимум файлов для восстановления
-    """
-    try:
-        from sqlalchemy import or_
-
-        # Проверяем, есть ли файлы без AiConclusion
-        pending_audio = db.query(Audio).filter(
-            or_(
-                Audio.AiConclusion == None,
-                Audio.AiConclusion == ''
-            )
-        ).limit(limit).all()
-
-        if not pending_audio:
-            logger.info("ℹ️ Auto-restore: нет файлов для распознавания")
-            return
-
-        logger.info(f"🔄 Auto-restore: найдено {len(pending_audio)} файлов без AiConclusion")
-
-        # Запускаем распознавание
-        started_count = 0
-        for audio in pending_audio:
-            file_path = os.path.join(AUDIOFILES_PATH, audio.filename)
-
-            if not os.path.exists(file_path):
-                logger.warning(f"⚠️ Файл не найден: {audio.filename}")
-                continue
-
-            # Отправляем в GigaAM API
-            from apiApp.config import GIGAAM_API_URL
-            api_url = f"{GIGAAM_API_URL}/api/call/process"
-
-            payload = {"filename": audio.filename}
-
-            try:
-                import requests
-                response = requests.post(api_url, json=payload, timeout=5)
-
-                if response.status_code in [200, 202]:
-                    logger.info(f"✅ Запущено распознавание: {audio.filename}")
-                    started_count += 1
-                else:
-                    logger.warning(f"⚠️ Ошибка запуска {audio.filename}: {response.status_code}")
-
-            except Exception as e:
-                logger.error(f"❌ Ошибка при запуске {audio.filename}: {e}")
-
-        logger.info(f"🎉 Auto-restore завершено: запущено {started_count} файлов")
-
-    except Exception as e:
-        logger.error(f"❌ Ошибка при auto-restore: {e}")
@@ -11,6 +11,7 @@ from apiApp.routers import audio_router, recognition_router
 from apiApp.routers.ai_conclusion_router import ai_conclusion_router
 from apiApp.routers.audio_files_router import audio_files_router
 from apiApp.routers.audio_management_router import audio_management_router
+from apiApp.routers.external_audio import external_audio_router

 print("✅ audio_management_router imported successfully")

@@ -63,6 +64,7 @@ app.include_router(audio_router, prefix=API_V1_PREFIX, tags=["audio"])
 app.include_router(recognition_router, prefix=API_V1_PREFIX, tags=["recognition"])
 app.include_router(ai_conclusion_router, prefix=API_V1_PREFIX, tags=["ai_conclusion"])
 app.include_router(audio_files_router, prefix=API_V1_PREFIX, tags=["audio_files"])
+app.include_router(external_audio_router, prefix=API_V1_PREFIX, tags=["external_audio"])
 # audio_management_router с префиксом /audio для логической структуры
 print("📝 Registering audio_management_router...")
 app.include_router(audio_management_router, prefix="/api", tags=["audio_management"])