Investigadores de ETH Zurich presentan GoT (Graph of Thoughts) un marco de aprendizaje automático que mejora las capacidades de sugestión en modelos de lenguaje grandes (LLMs).

Investigadores de ETH Zurich presentan GoT, un marco de aprendizaje automático que mejora las capacidades de sugestión en LLMs.

La Inteligencia Artificial (IA) ha experimentado un aumento en el uso de Modelos de Lenguaje Extensos (LLMs, por sus siglas en inglés). Un tipo particular de LLM que se basa en el diseño exclusivo del decodificador de la arquitectura Transformer ha adquirido mucha popularidad recientemente. Modelos como GPT, PaLM y LLaMA han ganado una enorme popularidad en los últimos tiempos. La ingeniería de instrucciones es una técnica estratégica que ha sido una forma exitosa y eficiente de utilizar LLMs para abordar diversos problemas con el objetivo principal de incorporar instrucciones específicas para la tarea en el texto de entrada. Si estas instrucciones están escritas correctamente, el LLM puede utilizar su enfoque basado en tokens autorregresivos para crear texto relevante y completar la tarea.

El método de Cadena de Pensamiento (CoT) amplía la ingeniería de instrucciones. En CoT, la instrucción de entrada proporciona pensamientos o pasos intermedios de deliberación además de la descripción de la tarea. Esta adición mejora considerablemente la capacidad del LLM para resolver problemas sin necesidad de actualizaciones del modelo. Comparando las capacidades de los LLMs con paradigmas actuales como Cadena de Pensamiento y Árbol de Pensamientos (ToT, por sus siglas en inglés), se ha introducido recientemente un marco llamado Gráfico de Pensamientos (GoT, por sus siglas en inglés).

GoT representa los datos como un gráfico arbitrario, lo que permite a los LLMs generar y manejar datos de una manera más flexible. Las piezas individuales de información, o pensamientos de LLM, se muestran como vértices en este gráfico, mientras que las conexiones y dependencias entre ellos se muestran como aristas. Esto permite combinar diferentes ideas de LLM para producir resultados más potentes y efectivos. Esto se logra permitiendo que estos pensamientos estén acoplados e interdependientes dentro del gráfico. A diferencia de los paradigmas lineales que limitan el pensamiento, GoT puede registrar redes complejas de pensamientos. Esto abre la puerta a combinar diversas ideas en una respuesta cohesiva, reduciendo las redes de pensamiento intrincadas a sus componentes esenciales y mejorando las ideas a través de bucles de retroalimentación.

La mayor eficacia de GoT en comparación con los métodos existentes en múltiples tareas sirve como una ilustración de su efectividad. GoT supera a ToT en una prueba de clasificación aumentando la calidad de clasificación en un 62%. Al mismo tiempo, reduce los gastos de computación en más del 31%. Estos resultados demuestran la capacidad de GoT para equilibrar la precisión de la tarea con la eficiencia de recursos. Una de las ventajas más notables de GoT es su capacidad de extensibilidad. El marco es lo suficientemente flexible como para liderar esquemas de instrucciones creativas, ya que se adapta fácilmente a nuevas transformaciones de ideas. Esta agilidad es esencial para navegar por el panorama de investigación y aplicación de LLM a medida que cambia.

Este trabajo avanza significativamente en la alineación del razonamiento de LLM con los procesos de pensamiento humanos y los sistemas cerebrales al establecer el marco de GoT. Los pensamientos interactúan, se ramifican y se influencian mutuamente en redes complejas tanto en los procesos de pensamiento humanos como en los cerebrales. Por lo tanto, GoT mejora las habilidades de los LLMs y su capacidad para manejar problemas desafiantes al cerrar la brecha entre las técnicas lineales convencionales y estos procesos mentales sofisticados de tipo red.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

El gemelo malévolo de ChatGPT, 'WormGPT', está entrando silenciosamente en correos electrónicos y saqueando bancos.

SlashNext dice que WormGPT es un ejemplo de la amenaza que representan los modelos de IA generadores de lenguaje.

Inteligencia Artificial

5 Programas de Certificación en IA en línea - Explora e Inscríbete

Toma un curso de certificación de IA reconocido a nivel mundial y obtén un certificado para adquirir habilidades en I...

Inteligencia Artificial

IA en movimiento

Si 2023 fue el año de los LLM (modelos de lenguaje grandes), entonces 2024 será el año de los LMM (modelos multimodal...

Inteligencia Artificial

Dentro de Code Llama La entrada de Meta AI en el espacio de Code LLM

La codificación se ha convertido rápidamente en uno de los escenarios de acción más activos para los grandes modelos ...