Saltar al contenido principal
La generación de imágenes permite que un agente cree imágenes nuevas a partir de un prompt de texto o edite imágenes que el usuario haya subido. El agente elige entre generar y editar en función de lo solicitado y del contexto disponible.

Habilitar la generación de imágenes

La generación de imágenes se habilita mediante el modal Add Tools en Agent Builder (no en la sección Capabilities). Haz clic en Add Tools en la parte inferior del panel de Agent Builder y, a continuación, añade una de las herramientas de modelo de imagen; por ejemplo, OpenAI Image Tools, DALL-E-3 o Stable Diffusion. El agente selecciona la más adecuada según la solicitud, o puedes restringirla en las instrucciones.

Generación

Cuando el usuario solicita una imagen, el agente llama a la herramienta de generación con un prompt y devuelve la imagen resultante insertada en línea. El agente conserva una referencia a la imagen en su contexto para poder describirla o reutilizarla dentro de la misma conversación.

Edición

Si el usuario sube una imagen y solicita una modificación —cambiar un color, añadir un objeto o ampliar una composición—, el agente invoca la variante de edición de la herramienta. El resultado sustituye la zona correspondiente o amplía la imagen original, según se haya solicitado.

Notas

  • Las imágenes generadas no se envían automáticamente a un análisis de Vision independiente. Si necesitas que el agente interprete una imagen, usa Vision con una imagen cargada por el usuario.
  • Se aplican las políticas de contenido del proveedor. Los prompts que infrinjan la política del proveedor devuelven un error en lugar de una imagen.
Última modificación el 10 de junio de 2026