Tabla de contenidos
Una visión de alto nivel de un implementador de IA de bajo nivel
Con la llegada de los agentes de IA se avecinan cambios. A continuación explicaré qué son y por qué llegan ahora. También hablo de cómo se desarrollarán. Por último, hago 12 grandes predicciones sobre el impacto de los agentes de IA en las empresas y los consumidores en 2024, con el objetivo de ayudar a la gente a adelantarse a lo que se perfila como otro viaje salvaje.
El amanecer de los agentes de IA
El año 2023 ha sido el año de la IA generativa (GenAI) y de los grandes modelos de lenguaje (LLM) para generar contenidos de formas nunca vistas. De hecho, se ha producido una explosión en el mercado de nuevos modelos y nuevas aplicaciones. Sin embargo, los LLM son sólo el preámbulo de la revolución GenAI que ha comenzado.
Los LLM son impresionantes a la hora de generar texto, imágenes y salidas de código que los humanos pueden utilizar en su trabajo (o simplemente para divertirse). Pero ¿y si pudiéramos ir un paso más allá y utilizar los LLM no sólo para generar como paso final, sino como el pegamento para realizar un trabajo más complejo? Por ejemplo, ¿qué pasaría si pudiéramos hacer que los LLM realizaran trabajos que requieren pasos secuenciales, herramientas especializadas, información actualizada y habilidades especiales? Aquí es donde nacen los agentes de IA.
Un agente de IA es un programa que puede emparejar modelos LLM con diversos datos y herramientas para completar tareas y realizar el trabajo. Los agentes van más allá de la generación de contenidos para tomar decisiones y emprender acciones. Un agente de IA sencillo es capaz de interpretar instrucciones de alto nivel, elaborar un plan y, a continuación, ejecutar los pasos necesarios para alcanzar un objetivo. Con cada paso, un agente de IA puede ser capaz de evaluar su progreso y ajustar su estrategia. Lo más importante es que estos agentes tienen acceso a un conjunto de herramientas y datos que pueden utilizar.
Los agentes de IA tendrán los medios para completar acciones. Imaginemos un agente de correo electrónico capaz no sólo de generar texto, sino también de conversar automáticamente con un destinatario para alcanzar un objetivo. O imaginemos un agente programador capaz de conversar con varias partes para obtener información sobre disponibilidad e intereses y, a continuación, programar (o reprogramar) un evento en función de la información recibida. La combinación de la toma de decisiones inteligente con las acciones del mundo real en forma de agentes de IA producirá resultados potentes y valiosos.
Ya están aquí, pero hay que ensamblarlos un poco
En cierto modo, el popular chatbot de OpenAI, ChatGPT, es un agente de IA con el objetivo de proporcionar una conversación valiosa, y la acción de responder a entradas rápidas, mientras se utiliza la memoria reciente como contexto. Recientemente, las herramientas de chat como ChatGPT también se han emparejado con herramientas como la búsqueda web y las conexiones a bases de datos, para aumentar las consultas con información actualizada.
Lo cierto es que los componentes básicos de los futuros agentes de IA ya están aquí. En primer lugar, gracias a 2023, ahora tenemos una variedad de LLM excepcionales, y herramientas de codificación para trabajar con ellos (langchain, Hugging Face, etc.). En segundo lugar, ya existen muchos programas de software y funciones que están conectados al mundo real y funcionan en él. En tercer lugar, hay datos valiosos por todas partes. Lo único que nos falta es experiencia a la hora de unir estas piezas (LLM, herramientas y datos), pero eso se desarrollará rápidamente. A medida que las empresas comprendan el valor y vean el impacto a su alrededor, la sensación de necesidad de implantar la tecnología de agentes de IA crecerá rápidamente.
Aunque las piezas ya están aquí, habrá que pensar mucho en el diseño técnico de los agentes de IA. Los desarrolladores tendrán que decidir a qué herramientas de programación tendrá acceso un agente y cómo interactuará con ellas. También tendrán que decidir qué datos están disponibles y cómo se presentan. Por ejemplo, ¿están en JSON, SQL o una base de datos vectorial? ¿Vienen acompañados de metadatos? ¿Están los datos divididos en trozos de forma inteligente? ¿Cómo se actualizan los datos? Y así sucesivamente.
Incluso después de definir las herramientas y los datos, quedan muchas decisiones técnicas por tomar. ¿Qué mensajes utilizará el agente de IA y a qué LLM podrá llamar? ¿Qué se hará con los resultados? ¿Cómo se evaluará el rendimiento del agente para poder tomar decisiones objetivas de mejora?
Por el lado de la empresa, también se requiere ensamblaje. Los equipos de producto son nuevos en GenAI y los agentes de IA, como todos los demás. Los directivos tendrán que adquirir experiencia en la creación de equipos con los conocimientos adecuados, que serán una mezcla de comprensión del dominio, experiencia de producto, desarrollo de software y habilidades de IA. Es probable que las empresas también necesiten experimentar con pruebas de concepto antes de conseguir su equilibrio en aplicaciones de producción.
Muchas empresas ya tienen la visión. Los líderes están preparando sus movimientos y los desarrolladores están adquiriendo experiencia. Como consultor de IA/ML, lo veo en las conversaciones. Las ideas ya están aquí. Las implementaciones llegarán pronto. Con el tiempo, se desarrollarán herramientas más específicas, junto con la experiencia empresarial. Los usuarios ganarán confianza a medida que interactúen con los agentes de IA, y las ruedas de la mejora iterativa seguirán girando.
El futuro de los agentes de IA en 2024
Cuando empecé a idear este artículo hace unas semanas, Google aún no había anunciado su nuevo modelo multimodal Gemini, capaz de trabajar hábilmente con varios tipos de medios (texto, imágenes, audio, etc.). La historia de lo que Gemini puede hacer no ha hecho más que empezar, y tengo la sensación de que el suelo se mueve bajo mis pies más rápido de lo que puedo escribir sobre ello. La combinación de modelos multimodales como Gemini con datos especializados y herramientas especializadas dará lugar a avances aún mayores para los agentes de IA en los próximos meses.
Preveo que 2024 será otro gran año para la IA, a medida que las empresas innovadoras aprendan a aplicar la tecnología de agentes de IA. Estas son algunas de mis predicciones sobre los agentes de IA para 2024:
- Los agentes de IA realizan trabajos sencillos: Los agentes de inteligencia artificial dejarán rápidamente de ser un juguete novedoso para pasar a realizar tareas sencillas, aburridas y rutinarias. Tareas como la actualización de documentos, la programación y la auditoría se convertirán en tareas para las que los agentes de inteligencia artificial serán más capaces. Estos son los frutos maduros que las empresas utilizarán para sumergirse en el mundo de los agentes de IA. Las victorias en este terreno pueden parecer triviales, pero supondrán un gran paso desde la exagerada palabrería sobre la IA hasta las pruebas concretas que demuestren que las empresas están en el juego.
- Especialización de los agentes de IA: los modelos generativos básicos creados y entrenados por las grandes empresas tecnológicas son generales, y las herramientas a las que acceden (como la búsqueda web) también suelen ser generales. En 2024, espero ver modelos más especializados, así como herramientas y conjuntos de datos especializados destinados al uso de agentes de IA. También espero que surja cierta modularidad, sobre todo en el caso de herramientas complejas y datos patentados. Algunos de ellos pueden ofrecerse a través de API como servicios, o en conjuntos de datos.
- Desarrollo multiagente: No esperes que todos los agentes de IA trabajen solos en silos. El paso natural después de la especialización es que los agentes especializados trabajen juntos para completar tareas más complejas que las que cualquiera podría hacer por sí solo. Además, los marcos multiagente empezarán a aprovechar las jerarquías, en las que algunos agentes se centran en objetivos de alto nivel, mientras que otros se encargan de tareas específicas, y luego rinden cuentas.
- Agentes de IA como consumidores: ¿Qué significa obtener más páginas vistas de los agentes? ¿Habrá páginas web o API optimizadas para el descubrimiento y uso de agentes de IA? Ahora mismo, la web y muchas otras herramientas de software se conciben generalmente a través de la lente del consumo humano, pero esto cambiará a medida que los agentes de IA consuman más contenidos y utilicen más herramientas.
- Más confianza y poder para elegir y hacer: Los agentes de IA pasarán de tomar simples decisiones a tomar decisiones más impactantes. A medida que las empresas experimenten el progreso, aprenderán a confiar en sus agentes de IA. A estos agentes se les podrán asignar presupuestos y dinero para gastar. Tal vez se encarguen de tareas como la compra de acciones o la publicación de anuncios personalizados con ofertas interactivas sensibles al tiempo. Por ejemplo, imagine regatear con un agente publicitario de IA que pueda tomar decisiones.
- Agente publicitario: “Oye Dan, disfruta de un 20% de descuento en nuestro nuevo gadget si lo compras ahora mismo”.
- Yo: “Lo haré si puedes enviarlo en 3 días y además me envías gratis algunas pegatinas de tu producto”.
- Agente publicitario: “¡De acuerdo! Además, enviaré 3 pegatinas de gadgets. El envío costará X€, y lo enviaremos a tu dirección. Confirme para iniciar el pago”.
- AIAaaS (Agentes de IA como servicio): Amazon Web Services lleva algunos años ofreciendo un servicio llamado Mechanical Turk, en el que las empresas pueden contratar ejércitos de trabajadores (humanos) para realizar tareas técnicas rutinarias repetitivas como el etiquetado de datos. Imagínese poder alquilar horas de agentes de IA para hacer cosas similares a demanda y a escala. Estos agentes pueden incluso llegar a ser enseñables, o sintonizables, para que puedan rendir mejor en áreas o tareas elegidas. ¿Está preparado para que un agente de IA revise la presentación de su concurso? ¿O para un preparador de impuestos que trabaje con sus formularios W2 y 1099? ¿O qué tal un asesor financiero a la carta con el que puedas intercambiar ideas y que pueda mover rápidamente tus fondos para que se ajusten a tus objetivos cambiantes?
- Algunos puestos de trabajo se verán presionados: No cabe duda de que los agentes de IA continuarán la tendencia que GenAI ha iniciado, quitando trabajo a algunas personas. Considera el grado en que:
- Tu trabajo se realiza en un ordenador.
- Tu trabajo es rutinario.
- Eres fácilmente intercambiable con otras personas con tus mismas habilidades.
Cuanto mayor sea tu puntuación en estas categorías, mayor será la presión que los agentes de IA ejercerán sobre tu trabajo. Muchos trabajos de cuello blanco están en la lista. Funciones como auditor, redactor técnico y agente de atención al cliente pueden automatizarse hasta cierto punto. Sin embargo, piense que los agentes de IA aumentarán, más que sustituirán, muchos puestos de trabajo en 2024. Por otro lado, considere el trabajo que requiera: - 1. Tareas significativas lejos de un ordenador o interfaz digital
- 2. Muchas tareas variadas
- 3. Conocimientos o habilidades muy específicos que pocas personas poseen
En estos casos, tu trabajo está relativamente más aislado de la automatización de los agentes de IA.
- Surgirán nuevos puestos de trabajo: A medida que las empresas empiecen a utilizar agentes de IA, necesitarán empleados que se ocupen de ellos e interactúen con ellos. ¿El próximo trabajo de moda será el de ingeniero de agentes? ¿Gerente de agentes? ¿Entrenador de agentes? ¿Evaluador de agentes? ¿Auditor de agentes? ¿Quizá AgentOps? Es difícil saber cuáles serán los títulos exactos, pero los agentes de IA necesitarán homólogos humanos que sepan cómo interactuar con ellos, implementarlos, mantenerlos y mejorarlos. Los agentes de IA también requerirán supervisión y vigilancia.
- Bombo y platillo. Si hay algo de lo que puedes estar seguro de que no cambiará en 2024, serán las afirmaciones descabelladas sobre la IA. Los tertulianos y escritores, en su exuberancia por llamar la atención (y que les paguen los anunciantes), seguirán avivando las llamas que nos excitan. Leeremos sobre cómo los agentes de la IA están resolviendo todos nuestros problemas y, al mismo tiempo, provocando el fin de la raza humana. Si suena demasiado bien (o mal) para ser verdad, probablemente lo sea. Por desgracia, esto hará que sea difícil (como ocurrió en 2023) saber dónde está la verdadera sustancia.
- Convocatorias para la gobernanza. También presentes en 2023, las llamadas a la gobernanza continuarán en 2024. El poder de la tecnología de los agentes de IA será cada vez más evidente, y también lo será la necesidad de organizar la forma en que trabajamos con ella. Sin embargo, los gobiernos seguirán luchando por guiar el desarrollo de la IA. Dirigirán un poco a ciegas y serán propensos a la influencia de grupos de presión que buscan superar a su propia competencia. Cualquier entidad que actúe como si tuviera el control de la GenAI es ilusa o ilusa. Como he mencionado antes, los componentes básicos de los agentes de IA ya están disponibles libremente. Muchos funcionarios del gobierno no entienden de tecnología, y muchos líderes tecnológicos no entienden de IA, por lo que en materia de gobernanza podemos estar a varios grados lamentablemente alejados de la cordura. Por desgracia, 2024 probablemente no será el año de la gobernanza eficaz de la IA.
- Mucha competencia. MUCHA. En 2023, los principales proveedores de nube y empresas de IA compitieron ferozmente por la atención en el espacio GenAI. Prepárese para que esto continúe como un reguero de pólvora con más empresas de IA que lancen productos aún mejores en 2024. Es de esperar que las grandes empresas tecnológicas ofrezcan agentes de IA de gran utilidad. También veremos competencia entre las empresas que se benefician como implementadores y consumidores, ya que convierten el trabajo de los agentes de IA en valor empresarial que pueden transmitir a sus clientes.
- Dispositivos impulsados por agentes de IA: Por último, cabe esperar que algunos dispositivos físicos se vuelvan más capaces e interactivos gracias a la tecnología de agentes de IA. Los dispositivos inteligentes se convertirán en inteligentes 2.0. (Por ejemplo, actualmente tengo una aspiradora inteligente que limpia algunas habitaciones de mi casa. Ahora no le hablo porque no es TAN inteligente. Y en realidad tampoco habla conmigo, salvo para informarme de errores. Con la tecnología de agentes de inteligencia artificial, podría decirle a una aspiradora inteligente 2.0: “Oye, aspiradora, ¿puedes limpiar esta habitación en una hora? O “¿puedes empujar todos los juguetes que hay en una pila para ayudarme a limpiar, y luego aspirar alrededor de ellos?”. Sólo estoy pensando. Puede que los primeros dispositivos físicos respaldados por agentes de inteligencia artificial no sean aspiradoras, pero estoy seguro de que llegarán. Estoy deseando verlos, usarlos y comprender sus capacidades y limitaciones.
¿He dicho 12 predicciones? Mientras hacía los últimos retoques y reflexionaba, se me pasaron por la cabeza algunas ideas más. No he podido resistirme a ese impulso imaginativo. Puede que estas próximas ideas no surjan en 2024, pero será interesante ver si aparecen:
- Malware asistido por agentes de IA: Los virus informáticos evolucionan de muchas maneras, por lo que es lógico que veamos uno impulsado por agentes de IA. Además, los agentes de IA están llegando al robo de identidad. Puede que necesitemos mejores formas de detectarlos, ya que serán más convincentes que muchos delincuentes humanos. Para que quede claro, no estoy prediciendo que estos agentes aparezcan por sí solos, sino que los crearán actores humanos.
- Agente IA autodestructor: Tenemos que crear esto, porque suena guay. Pero en serio, puede haber aplicaciones en las que una API bajo demanda no tenga sentido, y sea necesario descargar un agente de IA en un dispositivo local. Una vez completada con éxito una tarea, el agente puede autodestruirse para liberar espacio. Otra aplicación puede ser hacer cumplir un acuerdo de licencia y mantener a los clientes pagando periódicamente.
- Agente de IA auto-mejorable: Hay varias formas de mejorar las respuestas de LLM -prompting de pocos disparos, ajuste fino, RAG, RLHF- pero estas mejoras generalmente tienen un componente de implementación manual. Un agente AI auto-mejorado reconocerá cuando ha aprendido algo nuevo que vale la pena interiorizar; será capaz de ajustar automáticamente su(s) propio(s) modelo(s) LLM para mejorar su rendimiento nativo.
- Científicos de agentes de IA: A diferencia de un agente de IA con un objetivo empresarial, un agente científico de IA puede tener un mandato de aprendizaje, junto con el acceso a herramientas y datos. El agente concebiría hipótesis y las pondría a prueba. Tal vez el agente pueda incluso solicitar acceso a nuevas herramientas. Conectado a un laboratorio real (por ejemplo, de ciencia de materiales o biotecnología), esto podría potenciar la experimentación y la I+D.
¿Y tú? ¿Qué ideas tienes sobre hacia dónde se dirigen los agentes de IA? Me encantaría oírlas en los comentarios.
Conclusión
Las aplicaciones LLM acapararon la atención en 2023. Preveo que los agentes de IA lo harán en 2024. En estos momentos, muchos agentes (y también los LLM) son como juguetes: es divertido jugar con ellos, pero no son necesariamente útiles en el mundo real. Sin embargo, los bloques de construcción ya están aquí y estamos descubriendo cómo ensamblarlos. Las empresas que construyen estos juguetes se graduarán pronto y lanzarán agentes de IA sofisticados y capaces de trabajar en escenarios de la vida real. Nos guste o no, los agentes de IA formarán parte de nuestra experiencia.
Pensar en el futuro con agentes de IA puede provocar emoción y terror al mismo tiempo. El futuro llega muy deprisa y es difícil seguirle el ritmo. El poder que aportan los agentes de IA para realizar tareas y completar trabajos representa una gran oportunidad para muchas personas y empresas. Podremos hacer más, crear más y disfrutar más con menos esfuerzo. Sin embargo, estas nuevas ideas innovadoras perturbarán sin duda los negocios tal y como los conocemos, y todos tendremos que aprender y adaptarnos a la nueva tecnología.
Sobre el autor
Daniel Dowler ha trabajado como consultor en proyectos de los sectores de la sanidad, los servicios financieros, el entretenimiento, el software y el comercio minorista con algunas de las mejores empresas del mundo. Es director de IA/ML en Eviden, donde dirige emocionantes implementaciones técnicas de IA/ML. Disfruta utilizando la mejor tecnología para resolver problemas, conectando los puntos de los datos, las matemáticas y el negocio.
Publicado en Medium