Los agentes ocuparon un lugar destacado en la conferencia anual I/O de Google en mayo, cuando la empresa presentó su nuevo agente de IA llamado Astra, que permite a los usuarios interactuar con él mediante audio y video. El nuevo modelo GPT-4o de OpenAI también se ha denominado agente de IA.

Y no lo es justo Aunque también hay mucho de eso, las empresas tecnológicas están invirtiendo grandes sumas de dinero en la creación de agentes de IA, y sus esfuerzos de investigación podrían marcar el comienzo del tipo de IA útil con el que hemos estado soñando durante décadas. Muchos expertos, incluido Sam Altman, dicen que son la próxima gran novedad.

Pero ¿qué son? ¿Y cómo podemos utilizarlos?

¿Cómo se definen?

La investigación sobre agentes de IA aún es muy temprana y no existe una definición definitiva para ellos. Sin embargo, se trata de modelos y algoritmos de IA que pueden tomar decisiones de forma autónoma en un mundo dinámico, afirma Jim Enthusiast, científico investigador sénior de NVIDIA que lidera la iniciativa de agentes de IA de la empresa.

La gran visión de los agentes de IA es un sistema que pueda ejecutar una amplia gama de tareas, de forma muy related a como lo hace un asistente humano. En el futuro, podría ayudarte a reservar tus vacaciones, pero también recordará si prefieres hoteles elegantes, por lo que solo te sugerirá hoteles de cuatro estrellas o más y luego reservará el que elijas de la gama de opciones que te ofrece. Luego también sugerirá vuelos que se adapten mejor a tu calendario y planificará el itinerario de tu viaje en función de tus preferencias. Podría hacer una lista de cosas para empacar en función de ese system y del pronóstico del tiempo. Incluso podría enviar tu itinerario a cualquier amigo que sepa que viva en tu destino e invitarlo. En el lugar de trabajo, podría analizar tu lista de tareas pendientes y ejecutar tareas a partir de ella, como enviar invitaciones al calendario, notas o correos electrónicos.

Una de las suggestions para los agentes es que sean multimodales, es decir, que puedan procesar lenguaje, audio y movie. Por ejemplo, en la demostración de Astra de Google, los usuarios podían apuntar las cámaras de sus teléfonos inteligentes hacia cosas y hacerle preguntas al agente. El agente podía responder a entradas de texto, audio y online video.

Estos agentes también podrían facilitar los procesos para las empresas y las organizaciones públicas, dice David Barber, director del Centro de Inteligencia Artificial del University Faculty de Londres. Por ejemplo, un agente de IA podría funcionar como un robot de servicio al cliente más sofisticado. La generación actual de asistentes basados ​​en modelos de lenguaje solo puede generar la siguiente palabra possible en una oración. Pero un agente de IA tendría la capacidad de actuar de forma autónoma ante comandos de lenguaje all-natural y procesar tareas de servicio al cliente sin supervisión. Por ejemplo, el agente podrá analizar los correos electrónicos de quejas de los clientes y luego saber que necesita verificar el número de referencia del cliente, acceder a bases de datos como los sistemas de gestión de relaciones con los clientes y de entrega para ver si la queja es legítima y procesarla de acuerdo con las políticas de la empresa, dice Barber.

En términos generales, hay dos categorías diferentes de agentes: agentes de software y agentes encarnados, dice Admirer.