Solución de Problemas

Problemas Comunes

El Motor Falla al Iniciar con Error de Memoria

Soluciones:

Verifica tu memoria GPU real
```
nvidia-smi
```

Prueba el siguiente preset inferior

# Si estás usando baseline-32g, prueba baseline-24g en su lugar
ai:
  preset: "baseline-24g"

Elimina capacidades opcionales para reducir el uso de memoria

# Elimina capacidades
ai:
  preset: "baseline-24g"  # En lugar de "baseline-24g,capabilities.multilingual"

Verifica otras aplicaciones usando memoria GPU
Reinicia la máquina

Rendimiento Pobre o Respuestas Lentas

Soluciones:

Asegúrate de estar usando el preset correcto para tu hardware
Considera disminuir a un preset de nivel inferior
Comunícate con los ingenieros de Zylon para entender qué está pasando

Pod en Estado Fallido o CrashLoopBackOff

Si los pods de Triton o inferencia están atascados en un estado fallido:

# Reinicia el despliegue
kubectl rollout restart deploy/zylon-triton -n zylon

Esto fuerza a Kubernetes a recrear los pods con un estado fresco.

Problemas Avanzados

Problemas específicos de configuraciones de modelos personalizados y configuraciones multi-modelo.

Fallos de Inicio

El Servidor de Inferencia Triton Falla al Iniciar

Soluciones:

Verifica los logs de Triton para identificar qué modelo específico está causando el fallo
```
kubectl logs deploy/zylon-triton -n zylon --tail=200
```
Verifica la asignación de memoria para el modelo problemático - ajusta gpuMemoryUtilization si es necesario
Si has reducido demasiado la asignación de memoria, reduce el parámetro contextWindow para ese modelo
Usa nvidia-smi para verificar el uso y disponibilidad real de memoria GPU
```
nvidia-smi
```

Versión de Modelo No Soportada

Síntoma: Triton falla al cargar un modelo aunque la familia del modelo esté soportada. Causa: VLLM (el backend de inferencia) puede no soportar la versión específica de tu modelo aún. Por ejemplo:

Mistral Small 3 (2501) está soportado
Mistral Small 3 (2509) podría no estar soportado aún

Soluciones:

Verifica la versión del modelo soportada en la documentación
Prueba una versión anterior de la misma familia de modelo si está disponible
Verifica las notas de lanzamiento de Zylon para versiones de modelos soportadas
Contacta a los ingenieros de Zylon para confirmar la compatibilidad del modelo

Errores de Memoria

El Motor Falla al Iniciar con Error “Out of Memory”

Soluciones:

Verifica que el total de gpuMemoryUtilization no exceda 0.95

# Calcula el total en todos los modelos
ai:
  config:
    models:
      - id: llm
        gpuMemoryUtilization: 0.60
      - id: llmvision
        gpuMemoryUtilization: 0.25
      - id: embed
        gpuMemoryUtilization: 0.10
# Total: 0.95 ✓

Reduce la asignación para uno o más modelos basado en los logs de fallo
```
kubectl logs deploy/zylon-triton -n zylon
```
Verifica la memoria GPU real con nvidia-smi durante el inicio
```
watch -n 1 nvidia-smi
```

Primeros pasos

Instalación

Configuración

Mantenimiento y Operaciones

Solución de Problemas

Solución de Problemas

Problemas Comunes

El Motor Falla al Iniciar con Error de Memoria

Rendimiento Pobre o Respuestas Lentas

Pod en Estado Fallido o CrashLoopBackOff

Problemas Avanzados

Fallos de Inicio

El Servidor de Inferencia Triton Falla al Iniciar

Versión de Modelo No Soportada

Errores de Memoria

El Motor Falla al Iniciar con Error “Out of Memory”

Primeros pasos

Instalación

Configuración

Mantenimiento y Operaciones

Solución de Problemas

​Problemas Comunes

​El Motor Falla al Iniciar con Error de Memoria

​Rendimiento Pobre o Respuestas Lentas

​Pod en Estado Fallido o CrashLoopBackOff

​Problemas Avanzados

​Fallos de Inicio

​El Servidor de Inferencia Triton Falla al Iniciar

​Versión de Modelo No Soportada

​Errores de Memoria

​El Motor Falla al Iniciar con Error “Out of Memory”

Problemas Comunes

El Motor Falla al Iniciar con Error de Memoria

Rendimiento Pobre o Respuestas Lentas

Pod en Estado Fallido o CrashLoopBackOff

Problemas Avanzados

Fallos de Inicio

El Servidor de Inferencia Triton Falla al Iniciar

Versión de Modelo No Soportada

Errores de Memoria

El Motor Falla al Iniciar con Error “Out of Memory”