Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.zylon.ai/llms.txt

Use this file to discover all available pages before exploring further.

Establece el preset de IA en tu archivo de configuración de Zylon usando la propiedad ai.preset. La configuración por defecto usa una configuración de 24GB.

Presets Base

Los presets base proporcionan configuraciones estándar optimizadas para cargas de trabajo de IA de propósito general.
PresetMemoria GPU RequeridaEjemplos de Hardware CompatibleModelos
baseline-32g32GBRTX 5090cyankiwi/qwen3.5-9b-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
baseline-48g48GBRTX A6000, A40, L40, L40stxn545/qwen3.5-35b-a3b-nvfp4, mixedbread-ai/mxbai-embed-large-v1
baseline-96g96GBA100 80GB, H100, A6000 (dual)cyankiwi/qwen3.5-27b-awq-4bit, mixedbread-ai/mxbai-embed-large-v1

Ejemplo de Configuración

ai:
  preset: "baseline-48g"  # Para un sistema con L40s (48GB)
Elige el preset que coincida con la capacidad de memoria de tu GPU. Siempre selecciona un preset que coincida o sea menor que tu VRAM disponible.

Presets Alternativos

Zylon proporciona presets alternativos que ofrecen configuraciones especializadas intercambiando ciertas capacidades por otras. Estos son opcionales y solo deben usarse cuando tienes requisitos específicos que difieren de los presets estándar.

Alternativa Optimizada para Throughput

Este preset utiliza un modelo más pequeño y ligero que genera tokens significativamente más rápido. Aunque puede no igualar al modelo estándar en calidad y profundidad de razonamiento, pero a cambio ofrece respuestas notablemente más rápidas. Cuándo usar:
  • Principalmente manejas consultas sencillas o directas
  • Tienes un alto número de usuarios concurrentes y necesitas tiempos de respuesta rápidos
  • La velocidad de generación importa más que la máxima calidad de respuesta
PresetMemoria GPU RequeridaModelos
baseline-throughput-96g96GB (A100 80GB, H100, A6000 dual)txn545/qwen3.5-35b-a3b-nvfp4, mixedbread-ai/mxbai-embed-large-v1

Alternativa de Modelo Grande

Este preset utiliza un modelo más grande y capaz, con mayor conocimiento intrínseco. La contrapartida es una ventana de contexto más reducida. Cuándo usar:
  • Necesitas mayor rendimiento en tareas complejas o especializadas
  • El conocimiento intrínseco del modelo es prioritario
  • Puedes trabajar con una ventana de contexto más pequeña
PresetMemoria GPU RequeridaModelos
baseline-large-96g96GB (A100 80GB, H100, A6000 dual)cyankiwi/Qwen3.5-122B-A10B—4bit, mixedbread-ai/mxbai-embed-large-v1

Ejemplo de Configuración

ai:
  preset: "alternatives.baseline-throughput-96g"
Cada preset alternativo implica una compensación. Considera tu caso de uso específico — volumen de usuarios, complejidad de las consultas y necesidades de contexto — antes de cambiar del preset estándar.

Presets Experimentales

Los presets experimentales están en desarrollo activo y pueden no ser estables. Usa solo en entornos de prueba.
Los presets experimentales proporcionan acceso a modelos y configuraciones de vanguardia que están siendo evaluados para futuras versiones. Estos presets pueden tener características de rendimiento o estabilidad diferentes comparados con los presets base.
PresetMemoria GPU RequeridaFamilia de ModeloEstadoModelos
experimental.mistral-24g24GBMistralBetamistralai/mistral-small-24b-instruct-2501-awq, mixedbread-ai/mxbai-embed-large-v1
experimental.mistral-48g48GBMistralBetamistralai/mistral-small-24b-instruct-2501-awq, mixedbread-ai/mxbai-embed-large-v1
experimental.gpt-oss-24g24GBGPT-OSSBetaopenai/gpt-oss-20b, mixedbread-ai/mxbai-embed-large-v1
experimental.gpt-oss-48g48GBGPT-OSSBetaopenai/gpt-oss-20b, mixedbread-ai/mxbai-embed-large-v1
experimental.gpt-oss-96g96GBGPT-OSSBetaopenai/gpt-oss-120b, mixedbread-ai/mxbai-embed-large-v1
experimental.gemma-24g24GBGemma 3Alphagoogle/gemma-3n-e4b-it, mixedbread-ai/mxbai-embed-large-v1
mistral-3-instruct-24g24GBMistralAlphacyankiwi/ministral-3-14b-instruct-2512-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
mistral-3-instruct-48g48GBMistralAlphacyankiwi/ministral-3-14b-instruct-2512-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
mistral-3-reasoning-24g24GBMistralAlphacyankiwi/ministral-3-14b-reasoning-2512-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
mistral-3-reasoning-48g48GBMistralAlphacyankiwi/ministral-3-14b-reasoning-2512-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
nemotron-3-nano-48g48GBNemotronAlphastelterlab/nvidia-nemotron-3-nano-30b-a3b-awq, mixedbread-ai/mxbai-embed-large-v1
glm-47-flash-32g32GBGLMAlphacyankiwi/glm-4.7-flash-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
glm-47-flash-48g48GBGLMAlphacyankiwi/glm-4.7-flash-awq-4bit, mixedbread-ai/mxbai-embed-large-v1
Ejemplo de Configuración:
ai:
  preset: "experimental.gpt-oss-24g"

Notas Importantes Sobre Presets Experimentales

  • Los presets experimentales pueden ser eliminados o cambiados significativamente entre versiones
  • El rendimiento y la estabilidad no están garantizados
  • No recomendados para entornos de producción
  • Pueden requerir parámetros de configuración adicionales
  • El soporte puede ser limitado

Presets Deprecados

Los presets deprecados se mantienen solo para compatibilidad hacia atrás y no recibirán actualizaciones.
Para clientes que requieren configuraciones más antiguas, los presets deprecados están disponibles pero no se recomiendan para nuevas instalaciones.
PresetMemoria GPUDescripción
deprecated.24g.2025071024GBConfiguración Pre-Qwen 3
deprecated.24g.2026032724GBConfiguración Pre-Qwen 3.5
deprecated.32g.2025071032GBConfiguración Pre-Qwen 3
deprecated.32g.2026032732GBConfiguración Pre-Qwen 3.5
deprecated.48g.2025071048GBConfiguración Pre-Qwen 3
deprecated.48g.2026032748GBConfiguración Pre-Qwen 3.5
deprecated.48g.20260327-context48GBConfiguración optimizada para contexto Pre-Qwen 3.5
deprecated.48g.20260327-vision48GBConfiguración optimizada para visión Pre-Qwen 3.5
deprecated.96g.2025071096GBConfiguración Pre-Qwen 3
deprecated.96g.2026032796GBConfiguración Pre-Qwen 3.5
deprecated.96g.20260327-context96GBConfiguración optimizada para contexto Pre-Qwen 3.5
deprecated.96g.20260327-vision96GBConfiguración optimizada para visión Pre-Qwen 3.5
deprecated.96g.qwen3-32b-96g96GBConfiguración Qwen 3 32B Pre-Qwen 3.5
Ejemplo de Configuración:
ai:
  preset: "deprecated.24g.20260327"

Migración desde Presets Deprecados

Si estás usando un preset deprecado, recomendamos encarecidamente migrar a presets base o alternativos actuales:
  1. Revisa los presets base para encontrar una configuración equivalente
  2. Prueba el nuevo preset en un entorno de staging
  3. Actualiza tu configuración de producción
  4. Monitorea el rendimiento y ajusta si es necesario
La migración proporciona acceso a modelos mejorados, mejor rendimiento y soporte continuo.