210 lectures

Com l'agent de raonament de Sentient està superant la competència: a l'interior

per Ishan Pandey9m2025/04/02
Read on Terminal Reader

Massa Llarg; Per llegir

Himanshu Tyagi de Sentient revela com blockchain i IA s'uneixen en una revolució propietat de la comunitat, alimentant Sentient Chat i Dobby.
featured image - Com l'agent de raonament de Sentient està superant la competència: a l'interior
Ishan Pandey HackerNoon profile picture
0-item
1-item
2-item


Sentient ha traçat un camí únic, combinant la tecnologia blockchain amb la IA de codi obert per crear un ecosistema propietat de la comunitat. Amb més d'1 milió d'inscripcions a la llista d'espera per a Sentient Chat en només 24 hores i un rècord de 650.000 NFT per al seu model d'IA descentralitzat, Dobby, Sentient està redefinint el futur de la IA.


Al capdavant d'aquesta revolució hi ha Himanshu Tyagi, cofundador de Sentient i professor de l'Institut Indi de Ciència, l'experiència del qual en IA i blockchain impulsa innovacions com l'agent de raonament i un chatbot que rivalitza amb Perplexity. Ens asseiem amb Himanshu per explorar els reptes tècnics, les solucions innovadores i la visió ambiciosa darrere de l'ascens de Sentient.

Ishan Pandey: Sentient Chat ha esclatat a l'escena amb més d'1 milió de registres a la llista d'espera en menys de 24 hores. Quins reptes tècnics us heu enfrontat a l'hora de crear una plataforma d'IA descentralitzada i amigable per al consumidor?

Himanshu Tyagi: La descentralització és fonamental per a la nostra missió, que s'estén molt més enllà del simple Sentient Chat. Creiem que el futur de la IA ha de ser obert i impulsat per la comunitat, ja que la descentralització potencia la participació activa de la comunitat de manera única. Aquesta filosofia s'inclou directament en els nostres productes, sobretot, Sentient Chat.


Amb Sentient Chat, el nostre objectiu és assegurar-nos que la comunitat se senti realment propietat. Els usuaris no són merament consumidors passius; són creadors, modeladors i administradors de la plataforma. Tenen un control total, des del model i els agents d'IA subjacents, fins a les dades i el govern, que els permet donar forma al producte amb precisió per adaptar-se a les seves necessitats i casos d'ús diversos.


De manera crítica, la descentralització i la usabilitat es reforcen mútuament a Sentient Chat. En permetre als usuaris personalitzar i millorar la plataforma, cada innovació desenvolupada per un usuari o equip es fa accessible per a la comunitat més àmplia. Aquesta contribució col·lectiva enriqueix la usabilitat de la plataforma, impulsant contínuament millores i innovacions que beneficien tots els implicats.


En definitiva, la descentralització no complica l'experiència de l'usuari, sinó que la millora, creant un ecosistema vibrant on la creativitat i la col·laboració col·lectives es tradueixen directament en una plataforma més potent, flexible i fàcil d'utilitzar.

Ishan Pandey: Has posicionat Sentient Chat com a competidor de Perplexity, impulsat per Dobby, el primer model d'IA propietat de la comunitat del món. Ens pots explicar la innovació tècnica que hi ha darrere de Dobby i com admet les capacitats úniques de Sentient Chat?

Himanshu Tyagi: La IA s'està convertint ràpidament en l'intermediari entre les xarxes d'informació i els usuaris, atorgant-li un poder significatiu per influir en les perspectives dels usuaris basant-se en biaixos inherents. El nostre objectiu és empoderar les comunitats permetent-los alinear els models d'IA segons els seus valors específics, promovent així un ecosistema divers de models d'"IA lleial". Tot i que els biaixos sempre existiran a causa de les dades de formació, els usuaris no s'han de limitar a models generalitzats que simplement fan una mitjana de les opinions d'Internet. En canvi, ens imaginem que els usuaris seleccionen entre una àmplia gamma de models alineats amb diferents valors de la comunitat.


Dobby representa el primer d'aquests models, explícitament alineat amb els valors de la comunitat criptogràfica: llibertat pro-cripto i pro-personal. Amb Dobby, hem aconseguit tres avenços tècnics notables:


  • Alineació efectiva del valor sense pèrdua de rendiment: alinear els models d'IA amb valors específics mitjançant l'ajustament és notòriament un repte, sovint comporta un rendiment degradat i sortides incoherents. Amb Dobby, hem ajustat amb èxit el model Llama per adoptar valors específics tot mantenint un rendiment excel·lent en els punts de referència crítics.


  • To centrat en l'ésser humà i llibertat d'expressió amb seguretat: per aconseguir l'alineació desitjada, calia eliminar les baranes existents de Llama i reconstruir-les amb cura. Sorprenentment, aquest procés va millorar el to del model, donant lloc a interaccions més naturals i centrades en l'ésser humà. Fins i tot amb restriccions relaxades, Dobby segueix segur, tal com demostren les mètriques del nostre "Banc de disculpes". A més, els nostres models Dobby-mini 8B i Dobby 70B presenten un control granular sobre dimensions específiques de seguretat (com ara discurs d'odi, assessorament financer, mèdic i legal i contingut explícit), cosa que ens permet ajustar amb precisió el perfil de seguretat del model.


  • Empremtes dactilars per a la propietat del model més distribuïda que mai: Dobby és actualment el model més distribuït, amb més de 660.000 propietaris. Aquest nivell de distribució sense precedents es veu facilitat per la nostra innovadora tecnologia d'empremtes dactilars. L'empremta digital injecta parells de respostes clau únics al model, cosa que permet una verificació sòlida de la propietat. Aquestes empremtes dactilars tenen un impacte insignificant en el rendiment global del model i són resistents a l'eliminació mitjançant l'ajustament, la fusió de models o altres modificacions.


Sentient Chat és la nostra plataforma de cerca impulsada per IA, dissenyada per mostrar i oferir als usuaris una experiència directa del concepte intangible de Loyal AI. Aquesta plataforma demostra l'avantatge competitiu dels ecosistemes de codi obert, superant amb èxit plataformes com Perplexity i fent coincidir els punts de referència de cerca de ChatGPT.


Impulsat per Dobby, Sentient Chat il·lustra com Loyal AI pot influir directament en la informació que es lliura als usuaris, presentant el contingut de manera concisa i atractiva. La integració de Dobby a Sentient Chat ha millorat notablement l'eficiència i el valor d'entreteniment de les interaccions de cerca. Amb l'estil de comunicació clar, humà i sense sentit de Dobby, els usuaris poden accedir de manera ràpida i eficaç a la informació que busquen, destacant el distint avantatge de la plataforma en les experiències de cerca impulsades per IA.

Ishan Pandey: un dels aspectes més intrigants de Sentient Chat és el seu agent de raonament, equipat amb eines com la cerca, la calculadora i el pensament. Com vau dissenyar aquest agent i quins obstacles tècnics vau superar per fer del raonament una força bàsica?

Himanshu Tyagi: Els avenços recents han demostrat que la generació de codi Python executable per a la trucada d'eines ofereix un augment significatiu del rendiment en comparació amb els enfocaments convencionals basats en JSON. En particular, els LLM són inherentment hàbils a comprimir l'espai d'acció de les tasques mitjançant codi. Això va provocar, naturalment, l'ús del codi com a mode d'expressió del nostre agent de raonament. De vegades, el codi d'escriptura de LLM que no s'executa/executa com està previst, això és solucionat per un intèrpret de Python que comprova si el codi generat s'executa o genera errors, si genera errors, després continuarà regenerant el codi (amb les traces d'error anteriors) fins que produeixi codi satisfactori.


Una altra advertència és que el LLM pot generar codi funcional que no fa el que pretén fer (per exemple, crida a l'eina de la calculadora en lloc de cercar); l'agent de raonament és capaç de digerir la sortida de la informació i avaluar si encaixa, a nivell general, amb el que espera de la trucada de codi/eina particular.


Hem provat dos tipus diferents d'agents a la part Open Reasoning Agent del marc ODS: Chain-of-Thought amb l'agent ReAct i Chain-of-Code amb l'agent CodeAct.


A l'arquitectura Chain-of-Thought ReAct, l'agent segueix un bucle iteratiu de raonament-acció. En primer lloc, el pas "Pensar" permet a l'agent raonar internament, articulant plans o interpretant resultats intermedis en llenguatge natural. Sempre que l'agent es troba amb incertesa o no té informació crítica, invoca l'eina "Cerca", recuperant activament informació externa del web. Per a tasques aritmètiques o computacionals que requereixen una alta precisió, l'agent utilitza l'eina "Calcular". Així, CoT-ReAct recorre contínuament pensant, buscant i calculant segons sigui necessari, fins que arriba a una solució fiable.


D'altra banda, l'agent Chain-of-Code o CodeAct empra codi executable per realitzar les seves tasques de raonament. Inicialment, l'agent pensa a través de la seva estratègia, de manera similar a CoT-ReAct. No obstant això, en lloc de basar-se exclusivament en el llenguatge natural, genera codi Python executable com a part del seu raonament. La funció "Calcular" està perfectament integrada aquí, directament integrada a l'entorn d'execució de Python. Això permet càlculs precisos i raonament algorítmic. Igual que CoT-ReAct, CodeAct també utilitza l'eina "Cerca" quan es necessita informació externa addicional, incorporant els resultats directament als seus processos de generació i execució de codi.


La diferència clau rau en com cada agent interactua amb aquestes eines. Per a CoT-ReAct, "Pensa", "Cerca" i "Calcula" són accions clarament separades escollides explícitament durant el raonament. Per a CodeAct, tot i que "Think" continua sent un pas de planificació explícit, "Calculate" està inherentment integrat a l'execució del codi, fent que les tasques computacionals siguin integrals i no externes. La "cerca" continua sent igualment explícita en ambdós enfocaments, proporcionant un context extern vital sempre que el coneixement intern de l'agent sigui insuficient.

Ishan Pandey: Sentient va completar un rècord de 650.000 NFT per a Dobby, vinculant la propietat a un model d'IA descentralitzat. Quina infraestructura tècnica vau construir per gestionar aquesta escala i com millora la cadena de blocs l'aspecte de la propietat de la comunitat?


Himanshu Tyagi: Aquest no era un problema tècnicament difícil: les cadenes de blocs modernes poden gestionar fàcilment aquesta càrrega. La part més interessant aquí és que aquesta és la primera vegada que algú demostra aquesta escala de "democràcia directa" en el model de govern. A les empreses centralitzades, aquesta governança la fa un petit equip d'alineació que de vegades fins i tot ha modificat el model perquè coincideixi amb les seves pròpies creences. Anthropic havia fet alguns experiments senzills sota el nom d'IA constitucional amb unes 1000 persones, però res a prop d'aquesta governança oberta per comunitat. Volíem donar aquest poder a la gent i les cadenes de blocs són instruments perfectes per a això. La comunitat de Dobby ja va decidir quin tipus de persona hauria de tenir Dobby, lligat o desencaixat (van escollir desencaixat en lloc de lligat). En el futur, aquesta comunitat prendrà totes les decisions sobre el model Dobby-desquitjat, que també rebrà una recompensa a mesura que augmenti l'ús del model.


En el futur, aquests NFT de propietat es convertiran en fitxes de propietat a la nostra cadena de blocs que es poden utilitzar per governar l'alineació i les actualitzacions d'aquest model. A més, les empremtes dactilars associades es comprometran com a arrel de Merkle amb el mateix contracte: qualsevol pot verificar la identitat del model fent les nostres consultes d'empremtes digitals i pot comprovar que les mateixes consultes estan compromeses amb el contracte de propietat.

Ishan Pandey: Your Reasoning Agent integra eines en temps real i té com a objectiu abordar tasques ambigües i subjectives. En què difereix això dels agents de raonament existents, com ara Deep Research d'OpenAI, i quines solucions noves vau implementar per superar els límits del raonament d'IA?


Himanshu Tyagi: Quan es comparen la nostra plataforma de codi obert amb els competidors de codi tancat, el principal avantatge competitiu dels sistemes tancats ha estat tradicionalment la seva tecnologia. No obstant això, plataformes com Sentient Chat i Open Data Sources (ODS) han igualat de manera efectiva el terreny de joc democratitzant el coneixement de la IA, fent que el nostre marc estigui completament obert a la comunitat. Les plataformes de codi tancat, com les d'OpenAI, funcionen com a caixes negres; ni tu, ni jo ni ningú més podem comprendre completament els seus processos interns.


En canvi, el nostre marc obert convida a la innovació contínua de la comunitat més àmplia, permetent una ràpida identificació i resolució de llacunes que, d'altra manera, podrien passar desapercebudes. Aquest enfocament col·laboratiu, d'entrada i sortida oberta és clau per construir la millor plataforma de cerca possible. La nostra visió final inclou permetre als usuaris aportar les seves pròpies fonts de dades i agents, millorant així dràsticament Sentient Chat i ODS mitjançant millores col·lectives impulsades per la comunitat.

Ishan Pandey: Heu posat èmfasi en l'avantatge de Sentient Chat sobre competidors com Perplexity amb la seva integració d'agents d'IA de més de 15 anys. Quins reptes tècnics va presentar la integració de diversos agents en una única interfície de chatbot i com els vau resoldre?

Himanshu Tyagi: Tècnicament, estem abordant molts reptes complexos de disseny i programari per permetre que una àmplia varietat d'agents participin en una experiència d'usuari singular mitjançant Sentient Chat. També oferim moltes eines a aquests creadors d'agents, com ara les nostres API de cerca d'IA d'última generació, l'oferta Sentient Secure Enclave per a la creació d'"agents impermeables", etc. Però més que abordar aquests reptes tècnics, la part més interessant aquí és la possibilitat d'una manera completament nova d'accedir al coneixement d'Internet.


Durant dècades, Google ha dominat la cerca centrant-se principalment a ajudar els usuaris a trobar informació en línia. La dependència de Google dels ingressos publicitaris, arrelada a recomanar fonts d'informació, limita inherentment la seva capacitat d'innovar més enllà de la recuperació d'informació tradicional. La IA, d'altra banda, ofereix l'oportunitat d'evitar la mera recopilació d'informació, permetent als usuaris executar tasques directament sense necessitat d'anàlisis i fases d'acció separades, que és el nostre avantatge competitiu exacte contra el gigante de Google.


Aquesta visió ambiciosa requereix un ecosistema divers, un que integri fonts de dades indexades variades amb nombrosos agents d'IA capaços de dur a terme accions especialitzades. La clau per alliberar aquest potencial rau en la creació d'una plataforma transparent i oberta, que incentivi activament una àmplia participació de la comunitat. Els proveïdors de dades han d'entendre clarament el valor que aporten les seves contribucions, mentre que els desenvolupadors d'agents han d'integrar perfectament els seus serveis per millorar la funcionalitat general. Aquest ecosistema ha de ser governat per la comunitat, garantint l'equitat, l'obertura i la innovació contínua impulsada per la contribució i la col·laboració col·lectives.

Per cert, molts més de 15 agents vindran a Sentient Chat!

Ishan Pandey: De cara al futur, què és el següent per a Sentient en termes d'innovació tècnica? Com penseu fer evolucionar l'agent de raonament i ampliar l'ecosistema AGI obert?


Himanshu Tyagi: Veiem un futur on la IA esdevé un intermediari entre tots els sentits humans, la informació global i les xarxes socials. La visió de Sentient és assegurar-se que aquesta IA ens sigui lleial. Aquest objectiu singular impulsa tot el nostre desenvolupament. Per als agents de raonament, volem assegurar-nos que els desenvolupadors tinguin accés a models les capacitats i habilitats de raonament dels quals estiguin alineades amb els seus interessos o amb el cas d'ús.


Per exemple, si esteu construint un agent sobirà que pugui controlar les carteres, els models subjacents haurien de tenir capacitats de raonament per garantir que els actors maliciosos no puguin manipular les indicacions i robar fons. Això és l'alineació: construirem aquests models alineats. Cada edifici de desenvolupadors de l'ecosistema Open AGI hauria de tenir l'opció d'utilitzar models d'IA que siguin fidels a la seva aplicació o usuaris. Sentient Chat és l'oferta col·lectiva de tots aquests agents basat en Loyal AI.


No oblidis donar m'agrada i compartir la història!

Divulgació d'interessos creats: aquest autor és un col·laborador independent que publica a través del nostre programa de blocs empresarials . HackerNoon ha revisat la qualitat de l'informe, però les afirmacions aquí pertanyen a l'autor. #DYO


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks