1fUBOwB2XmSGPxed5LmG vw

Tabla de contenidos

En resumen

El aprendizaje en contexto (ICL), implementado mediante RAG, se popularizó por dos razones principales:

  1. Su capacidad para competir con los modelos entrenados en aprendizaje por refuerzo sin entrenamiento adicional…
  2. y para liberar las capacidades latentes y subyacentes de los modelos lingüísticos. En el caso del ICL, se descubrió que los modelos priorizan el contexto en la inferencia por encima de los datos ajustados.

También introdujo un nivel de independencia del modelo, evitando la necesidad de aprendizaje por refuerzo de los modelos.

Este estudio revela otra capacidad latente de los modelos lingüísticos: las herramientas pueden definirse mediante ingeniería de indicadores que actúa como mecanismos internos de interacción. Herramientas cognitivas.

De esta manera, se estructura el proceso de razonamiento del modelo lingüístico, obteniendo capacidades que no se introdujeron mediante el entrenamiento o el ajuste del modelo.

¿Son las herramientas cognitivas tan importantes como el ICL?

Introducción

Hemos estado ampliando los límites de lo que los Modelos de Lenguaje Grande (LLM) pueden lograr, especialmente en tareas de razonamiento y aprendizaje en contexto (ICL).

Un estudio pionero de IBM Research presenta un enfoque innovador para generar razonamiento en LLM mediante herramientas cognitivas.

A diferencia de las herramientas tradicionales dentro de un agente de IA que se conectan a sistemas externos, las herramientas cognitivas están enfocadas internamente y diseñadas para guiar los procesos de pensamiento internos de los LLM.

image 4

Al imitar la arquitectura modular de los agentes de IA, este método mejora significativamente el rendimiento del razonamiento, ofreciendo una nueva perspectiva sobre cómo podemos liberar las capacidades latentes de los modelos de lenguaje.

El concepto de herramientas cognitivas

En los marcos de agentes de IA convencionales, las herramientas sirven como puntos de integración con el mundo externo: búsquedas web, calculadoras, servidores MCP o API.

image 6

Sin embargo, el estudio de IBM reimagina las herramientas como operaciones cognitivas encapsuladas dentro del propio LLM, mediante ingeniería de indicaciones.

Las herramientas se implementan mediante ingeniería de indicaciones, creando una estructura modular, similar a la de un agente, que guía el proceso de razonamiento del modelo.

El estudio identifica cuatro herramientas cognitivas clave:

Comprender la Pregunta
Descompone un problema en sus componentes principales, identificando conceptos clave, variables y teoremas relevantes.

Recordar Relacionado
Recupera problemas análogos y sus soluciones para guiar el razonamiento mediante ejemplos.

Examinar la Respuesta
Verifica el seguimiento del razonamiento actual en busca de errores, errores de cálculo o restricciones pasadas por alto, lo que facilita la autorreflexión.

Retroceso
Identifica pasos defectuosos en el proceso de razonamiento y sugiere enfoques alternativos, similar a la exploración de nuevos caminos en la resolución de problemas.

Cada herramienta funciona como un módulo basado en indicaciones, ejecutado por el mismo LLM en un entorno aislado.

Los resultados se retroalimentan al bucle de razonamiento principal, lo que permite al modelo refinar su enfoque dinámicamente.

Por qué son importantes las herramientas cognitivas

La introducción de herramientas cognitivas aborda una limitación crítica de los métodos tradicionales de estimulación, como las indicaciones planas o los enfoques monolíticos de cadena de pensamiento (CdP).

Al compartimentar los pasos del razonamiento, las herramientas cognitivas reducen la interferencia entre operaciones, lo que permite una resolución de problemas más clara y enfocada.

Una nueva perspectiva sobre el razonamiento en los grandes modelos lingüísticos (LLM)

La investigación de IBM contribuye al debate actual sobre los orígenes del razonamiento en los grandes modelos lingüísticos (LLM).

Los hallazgos del estudio demuestran que los modelos base, al equiparse con herramientas cognitivas, pueden revelar capacidades de razonamiento latentes desarrolladas durante el preentrenamiento.

Esto respalda la idea de que las indicaciones estructuradas y modulares pueden liberar capacidades sin una gran dependencia de técnicas posteriores al entrenamiento, como el aprendizaje por refuerzo.

El uso de indicaciones modulares ofrece una alternativa o complemento más transparente y potencialmente más eficiente a los métodos tradicionales de ajuste fino.

Desde la perspectiva de un agente de IA, este enfoque reduce la brecha entre la llamada a herramientas tradicional, que se basa en API y funciones externas, y la necesidad de un razonamiento interno modular.

Al asociar cada paso del razonamiento con una herramienta cognitiva específica, el método mejora la transparencia y la explicabilidad.

herramientas cognitivas
Los tonos más claros representan el rendimiento base, los valores se refieren al rendimiento de los LLM dotados de herramientas cognitivas y los tonos más oscuros representan la ganancia relativa.

¿Son las herramientas cognitivas tan importantes como el aprendizaje en contexto (ICL)?

Se puede argumentar que el descubrimiento de herramientas cognitivas es tan importante y significativo como el aprendizaje en contexto, especialmente para tareas que requieren razonamiento estructurado y transparencia.

Si bien el ICL revolucionó la IA al permitir una adaptación flexible a las tareas, las herramientas cognitivas impulsan el campo al mejorar la profundidad y la interpretabilidad del razonamiento.

Su capacidad para competir con los modelos entrenados en aprendizaje por repetición (RL) sin entrenamiento adicional subraya su potencial para transformar el desarrollo de la IA.

Sin embargo, la mayor aplicabilidad y el papel fundamental del ICL probablemente lo hacen más significativo.


Sígueme en LinkedIn 

Chief Evangelist @ Kore.ai | Me apasiona explorar la intersección de la IA y el lenguaje. Desde modelos lingüísticos y agentes de IA hasta aplicaciones agenéticas, marcos de desarrollo y herramientas de productividad centradas en los datos, comparto ideas sobre cómo estas tecnologías están dando forma al futuro.

Cobus Greyling

Por Cobus Greyling

Rasa Hero. NLP / NLU, Chatbots, Voz, UI / UX conversacional, Diseñador CX, Desarrollador, Interfaces de usuario ubicuas.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *