paint-brush
La nova tècnica d'incitació afirma que ajuda l'IA a pensar com els humansper@mahakshah
850 lectures
850 lectures

La nova tècnica d'incitació afirma que ajuda l'IA a pensar com els humans

per Mahak Shah4m2025/01/15
Read on Terminal Reader

Massa Llarg; Per llegir

L'impuls de la cadena de pensament està revolucionant la manera com interactuem amb la IA. Desglossa problemes complexos en trossos digeribles, permetent que el model abordi cada component de manera sistemàtica. Aquest enfocament estructurat garanteix la precisió i demostra el procés de raonament, quelcom especialment valuós quan es tracta d'operacions matemàtiques complexes.
featured image - La nova tècnica d'incitació afirma que ajuda l'IA a pensar com els humans
Mahak Shah HackerNoon profile picture


Alguna vegada t'has preguntat com fer que la IA pensi més com un humà? Tot i que els grans models de llenguatge (LLM) excel·lent a l'hora de predir la paraula següent en una seqüència, sovint ensopeguen quan s'enfronten a problemes que requereixen un pensament metòdic. Introduïu la indicació de la cadena de pensament: una tècnica que canvia el joc que està revolucionant la manera com interactuem amb la IA.

Trencant l'incitació de la cadena de pensament


Imagineu-vos ensenyar a un nen a resoldre un trencaclosques complex. En lloc de mostrar-los la imatge final, els guieu a través de cada pas. Això és essencialment el que fa la cadena de pensament (CoT) per als LLM. En proporcionar exemples que mostren el raonament pas a pas, ajudem aquests models a arribar a solucions precises mitjançant la progressió lògica.


Font de la imatge: Wei et al. (2022)


La fórmula màgica: per què funciona


Els mètodes d'indicació tradicionals sovint condueixen a resultats d'encertar o fallar. Tanmateix, l'impuls de CoT desglossa els problemes complexos en trossos digeribles, permetent que el model abordi cada component de manera sistemàtica. Aquest enfocament ha demostrat tan èxit que models d'avantguarda com les últimes ofertes d'OpenAI l'han incorporat a la seva funcionalitat bàsica.


Aplicació del món real: resoldre trencaclosques matemàtics


Submergem-nos en un exemple pràctic. Imagineu que esteu ajudant una IA a resoldre aquesta equació

5x - 4 = 16


A continuació s'explica com les sol·licituds de CoT guien el model:

  1. Primer pas: afegiu-ne 4 als dos costats
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. Segon pas: divideix els dos costats per 5
    • 5x/5 = 20/5

    • x = 4


Aquest enfocament estructurat garanteix la precisió i demostra el procés de raonament, cosa especialment valuosa quan es tracta d'operacions matemàtiques complexes.


Cadena de pensament vs. indicació de pocs trets: entendre la distinció


Aquestes dues tècniques poden semblar similars a primera vista, però tenen un propòsit diferent:


  • Sol·licitud de pocs cops : ofereix exemples que mostren l'entrada i la sortida, com ara una clau de resposta d'opció múltiple.

  • Guia de la cadena de pensament : demostra el procés de raonament complet, com ara mostrar tot el treball en un problema de matemàtiques.


L'indicació de pocs tirs es veuria així:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


La indicació de la cadena de pensament seria així:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

Cadena de pensament de tir zero


Utilitzant la frase senzilla però potent de " Pensem pas a pas", la sol·licitud de CoT de tir zero s'utilitza en circumstàncies en què no teniu casos d'exemple a mà. Per exemple, "Pensem pas a pas: expliqueu la física quàntica".

Quan hauríeu d'utilitzar les indicacions de CoT?


La indicació de CoT brilla quan es tracta de:

  • Aritmètica complicada
  • Raonament lògic de múltiples passos
  • Sentit comú
  • Manipulació simbòlica


Els punts de referència més recents de Claude van mostrar que els mètodes que utilitzen indicacions de CoT de 3 o 5 tirs funcionen bé per a tasques pesades de raonament: GPQA i MMLU.

El futur: cadena de pensament multimodal


L'avenç més recent en el raonament d'IA integra components visuals i textuals en els processos cognitius. Imagineu una IA que diagnostici una reparació de bicicleta, comprengui el manual i proporcioni una guia visual i sonora durant cada etapa del procés. L'enfocament multimodal significa el proper avenç en el suport de la IA.


Font de la imatge: Zhang et al. (2023)

Maximització de l'efectivitat de les indicacions de CoT


Tot i que l'avís de la cadena de pensament és potent, funciona amb certes limitacions. El camí de raonament que realitza el model no es garanteix que sigui lliure de fallades i els resultats varia marginalment.


Aquí teniu alguns consells per obtenir millors resultats:

  • Prova a fons amb diferents enfocaments.
  • Considereu la possibilitat de combinar les indicacions de CoT amb altres estratègies d'indicacions.
  • Utilitzeu models més grans amb més de 100.000 milions de paràmetres, si és possible.

Conclusió


Tenint en compte com ha avançat la IA, és evident que l'impuls de la cadena de pensament (CoT) és una tècnica eficaç per aprofitar habilitats de raonament més avançades. És important tenir en compte que l'ús d'impulsos de CoT per al desenvolupament d'aplicacions o per aconseguir resultats més òptims en compromisos amb IA augmenta molt les possibilitats d'aconseguir l'èxit.


La intenció no és només assolir la resposta precisa, sinó també comprendre el procediment que s'ha dut a terme per fer-ho, i aquesta és la bellesa de l'impuls de la cadena de pensament.

Notes a peu de pàgina

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q. i Zhou, D. (2022). La cadena de pensament provoca el raonament en grans models de llenguatge.
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y. i Iwasawa, Y. (2022). Els grans models de llenguatge són raonadors de punt zero.
  3. Zhang, Zhuosheng, et al. "El raonament multimodal de la cadena de pensament en els models lingüístics". arXiv preimpressió arXiv:2302.00923 (2023).