Saltar al contenido principal

Cómo funciona

Cuando añades la herramienta de extracción web a tu solicitud de API, Zylon sigue estos pasos:
  1. Identifica URLs: Zylon analiza el contenido de tu mensaje e identifica cualquier URL de la que quieras extraer información.
  2. Extrae contenido web: Obtiene y procesa el contenido de la página web especificada, convirtiéndolo a un formato legible.
  3. Analiza y responde: Analiza el contenido extraído y proporciona una respuesta exhaustiva basada en tu consulta.

Notas importantes

  • Para usar esta herramienta, debes especificar el tipo web_extract_v1.
  • No se requiere ingesta de documentos - simplemente incluye la URL directamente en el contenido de tu mensaje.
  • La herramienta detecta y extrae automáticamente contenido de URLs mencionadas en tus mensajes.
  • No se necesita tool_context para esta herramienta.

Ejemplo de uso

En este ejemplo práctico, extraemos y resumimos contenido de un sitio web simplemente incluyendo la URL en nuestro mensaje.
1

Realizar extracción web

Envía una solicitud con tu mensaje que contenga la URL que quieres analizar. La herramienta detectará y extraerá automáticamente contenido de la URL.
curl --location 'https://<your-host>/api/gpt/v1/messages' \
--header 'Authorization: Bearer <your-token>' \
--header 'x-org: default' \
--header 'Content-Type: application/json' \
--data '{
  "messages": [
    {
      "role": "user",
      "content": "Summary this page: https://example.com/"
    }
  ],
  "tools": [
    {
      "name": "web_extract",
      "type": "web_extract_v1"
    }
  ],
  "tool_choice": { "type": "auto" }
}'
2

Respuesta

El sistema responde con el contenido web extraído y proporciona tu análisis o resumen solicitado:
 {
   "id": "msg_47a25cb8b6e94b01ae817cdfab7ef39d",
   "type": "message",
   "role": "assistant",
   "content": [
       {
           "type": "tool_use",
           "start_timestamp": "2025-09-24T14:10:23.716299Z",
           "stop_timestamp": "2025-09-24T14:10:24.771260Z",
           "id": "toolu_01997c0fa3637ea6a2bdf5935cb9483b",
           "name": "web_extract",
           "input": {
               "url": "https://example.com/"
           }
       },
       {
           "type": "tool_result",
           "start_timestamp": "2025-09-24T14:10:26.336418Z",
           "stop_timestamp": "2025-09-24T14:10:26.338059Z",
           "tool_use_id": "toolu_01997c0fa3637ea6a2bdf5935cb9483b",
           "content": [
               {
                   "type": "text",
                   "text": "# Example Domain\nThis domain is for use in illustrative examples in documents. You may use this domain in literature without prior coordination or asking for permission.\n[More information...](https://www.iana.org/domains/example)"
               }
           ],
           "is_error": false
       },
       {
           "type": "text",
           "start_timestamp": "2025-09-24T14:10:26.595942Z",
           "stop_timestamp": "2025-09-24T14:10:29.634226Z",
           "text": "The website at [https://example.com/](https://example.com/) is an example domain intended for use in illustrative examples in documents. It can be used in literature without needing prior coordination or permission. For more information, you can visit the provided link."
       }
   ],
   "model": "private-gpt",
   "stop_reason": "end_turn",
   "stop_sequence": null,
   "usage": {
       "input_tokens": 503,
       "output_tokens": 47
   }
}