Problemas Comunes
El Motor Falla al Iniciar con Error de Memoria
Soluciones:-
Verifica tu memoria GPU real
-
Prueba el siguiente preset inferior
-
Elimina capacidades opcionales para reducir el uso de memoria
- Verifica otras aplicaciones usando memoria GPU
- Reinicia la máquina
Rendimiento Pobre o Respuestas Lentas
Soluciones:- Asegúrate de estar usando el preset correcto para tu hardware
- Considera disminuir a un preset de nivel inferior
- Comunícate con los ingenieros de Zylon para entender qué está pasando
Pod en Estado Fallido o CrashLoopBackOff
Si los pods de Triton o inferencia están atascados en un estado fallido:Problemas Avanzados
Problemas específicos de configuraciones de modelos personalizados y configuraciones multi-modelo.Fallos de Inicio
El Servidor de Inferencia Triton Falla al Iniciar
Soluciones:-
Verifica los logs de Triton para identificar qué modelo específico está causando el fallo
-
Verifica la asignación de memoria para el modelo problemático - ajusta
gpuMemoryUtilizationsi es necesario -
Si has reducido demasiado la asignación de memoria, reduce el parámetro
contextWindowpara ese modelo -
Usa
nvidia-smipara verificar el uso y disponibilidad real de memoria GPU
Versión de Modelo No Soportada
Síntoma: Triton falla al cargar un modelo aunque la familia del modelo esté soportada. Causa: VLLM (el backend de inferencia) puede no soportar la versión específica de tu modelo aún. Por ejemplo:- Mistral Small 3 (2501) está soportado
- Mistral Small 3 (2509) podría no estar soportado aún
- Verifica la versión del modelo soportada en la documentación
- Prueba una versión anterior de la misma familia de modelo si está disponible
- Verifica las notas de lanzamiento de Zylon para versiones de modelos soportadas
- Contacta a los ingenieros de Zylon para confirmar la compatibilidad del modelo
Errores de Memoria
El Motor Falla al Iniciar con Error “Out of Memory”
Soluciones:-
Verifica que el total de
gpuMemoryUtilizationno exceda 0.95 -
Reduce la asignación para uno o más modelos basado en los logs de fallo
-
Verifica la memoria GPU real con
nvidia-smidurante el inicio