Descubre los agentes de inteligencia artificial y su funcionamiento en la nueva era digital

La inteligencia artificial avanza rápidamente hacia agentes que realizan acciones complejas más allá de los chatbots. Conoce su funcionamiento y tipos.

La inteligencia artificial está cambiando a pasos agigantados, y ya no solo se trata de chatbots que responden preguntas. Desde la llegada de ChatGPT a finales de 2022, la atención se ha desviado hacia los agentes de IA impulsados por acciones. A diferencia de los chatbots que procesan información y responden en lenguaje natural, estos agentes son capaces de ejecutar tareas complejas de manera autónoma. Vamos a explorar en profundidad qué son los agentes de IA, cómo funcionan y cuáles son sus diferentes tipos. Veamos primero una tabla resumen con todas esta información y luego pasamos a lo gordo:

AspectoDescripción
Diferencia con chatbotsA diferencia de chatbots (p. ej. ChatGPT, Gemini), que se limitan a procesar y responder información en su entorno, los agentes de IA pueden invocar herramientas, memorizar datos a corto/largo plazo y realizar múltiples pasos para completar tareas.
Tecnologías claveBasados en grandes modelos de lenguaje (LLMs) fine-tuneados para acción, aprendizaje por refuerzo y modelos de lenguaje visual; integran herramientas externas (APIs, funciones, GUIs).
Tipos de agentes1. Reflexivos simples: lógica condicional sin memoria.
2. Reflexivos basados en modelo: memoria interna y reglas fijas.
3. Basados en objetivos: planifican para alcanzar metas específicas.
4. Basados en utilidad: optimizan una función de recompensa.
5. Aprendices: mejoran con la experiencia.
Ejemplos destacadosOperator (OpenAI): navega y opera GUIs en la web para comprar, reservar y completar formularios (requiere supervisión humana).
Deep Research (OpenAI/Gemini): genera informes detallados con citas.
Computer Use (Anthropic): controla un ordenador vía visión de pantalla.
Manus (China).

¿Qué son los Agentes de IA?

El término ‘agente de IA’ se refiere a un sistema de software que utiliza inteligencia artificial para planificar, razonar, tomar decisiones y llevar a cabo acciones múltiples con el fin de alcanzar objetivos de forma autónoma. A diferencia de los chatbots, que procesan información en un entorno cerrado, los agentes de IA interactúan con sistemas externos para completar sus tareas.

Al igual que los chatbots, los agentes de IA funcionan con modelos de lenguaje grandes (LLMs), pero están ajustados para ser impulsados por acciones. En el mundo actual de la IA, muchas empresas emplean el aprendizaje por refuerzo y razonamiento avanzado sobre modelos de lenguaje visual para desarrollar estos agentes. Además, integran herramientas externas como APIs, funciones y bases de datos para llevar a cabo una variedad de tareas.

En esencia, los agentes de IA son más que un modelo; son un sistema de IA que permite la interacción con herramientas, memoria a corto y largo plazo, y la conexión con sistemas de terceros para realizar tareas específicas. Un ejemplo destacado es el agente Operator de OpenAI, diseñado para interactuar con interfaces gráficas en la web.

Este agente puede navegar por internet, realizar pedidos de comestibles, rellenar formularios y reservar vuelos, entre muchas otras acciones. Aunque utiliza la capacidad de visión de GPT-4 para analizar pantallas y determinar dónde hacer clic, no es completamente autónomo y a veces requiere supervisión humana para completar tareas.

Tipos de Agentes de IA

Según Stuart Russell y Peter Norvig en su libro ‘Artificial Intelligence: A Modern Approach’, los agentes de IA se clasifican en cinco tipos: agentes de reflejo simples, agentes de reflejo basados en modelos, agentes basados en objetivos, agentes basados en utilidad y agentes de aprendizaje.

Los agentes de reflejo simples operan con lógica condicional y son la forma más básica. No aprenden ni mantienen memoria de patrones. Por otro lado, los agentes de reflejo basados en modelos tienen memoria y construyen un entendimiento básico del mundo a partir de sus acciones. Por ejemplo, un robot aspirador ajusta su comportamiento para evitar obstáculos a medida que los detecta.

Los agentes basados en objetivos no están limitados por reglas y deben alcanzar metas específicas, planeando y razonando para encontrar la mejor manera de cumplirlas. Un buen ejemplo sería una IA que juega al ajedrez, considerando todas las posibles jugadas para lograr una victoria.

Los agentes basados en utilidad maximizan la “satisfacción” o “felicidad” mediante una función de recompensa. Finalmente, los agentes de aprendizaje tienen capacidades similares a otros agentes, pero pueden adquirir nuevos conocimientos de un entorno desconocido y mejorar con el tiempo.

Ejemplos de Agentes de IA

Un pionero en este campo es el agente Operator de OpenAI, que puede realizar tareas en la web a través de un navegador en la nube. Puede pedir comida, encontrar hoteles y comprar entradas para conciertos. Actualmente, está en una vista previa de investigación y solo está disponible para suscriptores de ChatGPT Pro, que cuesta $200 al mes.

Además de Operator, OpenAI ha lanzado el agente Deep Research, que profundiza en cualquier tema y genera informes completos, incluyendo citas para verificar la información. También se encuentra el agente de Deep Research de Gemini, que ofrece servicios similares de forma gratuita.

Por otro lado, Anthropic ha introducido el agente Computer Use, que puede operar un ordenador analizando visualmente la pantalla. Aunque es un poco lento, cumple su función. El estándar MCP de Anthropic está siendo adoptado por empresas como Google y Microsoft para conectar agentes de IA con modelos de IA.

Recientemente, el agente Manus de China se volvió viral, capaz de navegar por la web, ejecutar código y interactuar con un ordenador en la nube. A pesar de su impresionante demostración, funciona con el modelo Claude 3.5 de Anthropic.

Por último, Google está desarrollando Project Mariner, un agente que realizará tareas en el navegador Chrome, similar a Operator, actualmente en pruebas con usuarios seleccionados.

Aunque estamos en los primeros días de la era de los agentes de IA, es evidente que el futuro se dirige hacia aplicaciones impulsadas por acciones. Aún no hemos alcanzado un nivel en el que los modelos de IA pueden realizar tareas críticas de forma completamente autónoma, y las empresas de IA están incorporando supervisión humana como parte del proceso.

DESCUBRE MÁS SOBRE EL TEMA

Deja el primer comentario