Saltar al contenido principal
Zylon solo tiene un requisito estricto con respecto al hardware: debe tener acceso a una GPU con capacidades NVIDIA CUDA. Dependiendo del hardware, algunos modelos de IA pueden estar restringidos, por lo que para asegurar la compatibilidad apunta a las versiones de CUDA más nuevas compatibles (12.6+). Nuestras especificaciones recomendadas para la mejor experiencia son:

¿Qué GPU debo comprar?

Encontrar la GPU adecuada para tu sistema puede ser un proceso complicado. Por ejemplo, dos GPUs con la misma vRAM pueden no tener el mismo rendimiento:
  • L4 (servidor) promedios: mínimo de 15 tk/s, pico en 89 tk/s
  • RTX 4090 (escritorio) promedios: mínimo 6.9 tk/s, pico 45tk/s
Por otro lado, dependiendo de la GPU que elijas, se habilitarán otras características que pueden afectar la calidad de la IA, si alguna de ellas es relevante para tus casos de uso, tenlo en cuenta para tu decisión:
Nvidia L40sAzure A10RTX 5090A100 / H100
Requiere Estación de Trabajo
LLM
Reranker*
Multi-modelo (imágenes)*
*Actualmente en desarrollo/en pruebas — sujeto a cambios en el futuro. Para entornos bare metal on-premise (el escenario habitual para clientes de Zylon), un factor importante sería tu capacidad para refrigerar adecuadamente la GPU instalada en tu máquina. Si no quieres ocuparte de ello o careces de experiencia, opta por una opción de hardware de escritorio. Pero ten en cuenta que en caso de que quieras ejecutar modelos más grandes o proporcionar servicio a varios cientos de usuarios, es posible que necesites instalar un rack con un par en paralelo o verse obligado a cambiar a modelos de hardware de servidor. Otro factor importante sería la inversión, especialmente con respecto a la GPU. Los rangos de precios del 5 de mayo de 2025 para los modelos mencionados son:
Modelo de GPUvRAM (GB)Precio (USD)
NVIDIA L40 48GB/L40s487,9007,900 – 9000
NVIDIA H100 (PCIe)8025,00025,000 – 30,000
NVIDIA H100 (SXM)8035,00035,000 – 40,000
NVIDIA H100 (NVL)9640,00040,000 - 45,000
NVIDIA A100 (PCIe)408,0008,000 - 10,000
NVIDIA A100 (PCIe)8018,00018,000 - 20,000
NVIDIA A100 (SXM)4010,00010,000 - 12,000
NVIDIA A100 (SXM)8020,00020,000 - 25,000
NVIDIA H20014130,00030,000 - 32,000
NVIDIA GeForce RTX 5090323,0003,000 - 3,500
En cualquier caso, como respuesta directa a la pregunta de qué GPU debes comprar, ten en cuenta que hasta el día de hoy tenemos varios clientes ejecutando Zylon en RTX 5090s dando soporte a más de 200 usuarios en sus organizaciones con un gran rendimiento.

Hardware de referencia para organización de tamaño medio

Si necesitas adquirir tu equipo con capacidad de IA desde cero, a partir del 29 de julio de 2025, por favor considera la siguiente recomendación de hardware: image.png Esta configuración incluye una RTX GeForce NVIDIA 5090 (GPU de 32 GB), una CPU potente (16 núcleos), 128 GB de RAM y suficiente capacidad de almacenamiento para operar Zylon con margen para crecer. También proporciona una solución de refrigeración robusta para asegurar un rendimiento óptimo bajo cargas de trabajo pesadas, así como una placa base grande para acomodar dos GPUs en algún momento si es necesario en el futuro. Ten en cuenta que esto es solo una recomendación, así que siéntete libre de adaptarla a tus preferencias mientras mantienes capacidades similares para un rendimiento ideal. Hemos usado Amazon como proveedor considerando que puedes ensamblar todas las partes tú mismo, pero cualquier proveedor con el que normalmente trabajes debería poder obtener un hardware similar y ensamblarlo para ti.

Hardware de referencia para organización de gran tamaño

En estos escenarios, no proporcionamos una configuración de hardware de referencia hasta que entendamos los requisitos no solo con respecto al número de usuarios, sino también qué tipo de operaciones internas se ejecutarán en paralelo aprovechando la API de la plataforma. Si estás en esta situación, es probable que ya estemos discutiendo sobre esto.