Sentient ha forjado un camino único, combinando la tecnología blockchain con la IA de código abierto para crear un ecosistema comunitario. Con más de un millón de inscripciones en la lista de espera de Sentient Chat en tan solo 24 horas y una acuñación récord de 650.000 NFT para su modelo de IA descentralizada, Dobby, Sentient está redefiniendo el futuro de la IA.
Al frente de esta revolución se encuentra Himanshu Tyagi, cofundador de Sentient y profesor del Instituto Indio de Ciencias. Su experiencia en IA y blockchain impulsa innovaciones como Reasoning Agent y un chatbot que rivaliza con Perplexity. Nos reunimos con Himanshu para explorar los desafíos técnicos, las soluciones innovadoras y la ambiciosa visión que subyacen al auge de Sentient.
Ishan Pandey: Sentient Chat ha irrumpido con fuerza en la escena con más de un millón de inscripciones en listas de espera en menos de 24 horas. ¿Qué desafíos técnicos enfrentaron al desarrollar una plataforma de IA descentralizada y fácil de usar?
Himanshu Tyagi: La descentralización es fundamental para nuestra misión, y se extiende mucho más allá de Sentient Chat. Creemos que el futuro de la IA debe ser abierto y estar impulsado por la comunidad, ya que la descentralización potencia de forma única la participación activa de la comunidad. Esta filosofía se refleja directamente en nuestros productos, en particular en Sentient Chat.
Con Sentient Chat, nuestro objetivo es garantizar que la comunidad se sienta realmente responsable. Los usuarios no son meros consumidores pasivos; son creadores, moldeadores y administradores de la plataforma. Tienen control total, desde el modelo de IA subyacente y los agentes hasta los datos y la gobernanza, lo que les permite adaptar el producto con precisión a sus diversas necesidades y casos de uso.
En Sentient Chat, la descentralización y la usabilidad se refuerzan mutuamente. Al permitir a los usuarios personalizar y mejorar la plataforma, cada innovación desarrollada por un usuario o equipo se vuelve accesible para la comunidad en general. Esta contribución colectiva enriquece la usabilidad de la plataforma, impulsando continuamente mejoras e innovaciones que benefician a todos los involucrados.
En última instancia, la descentralización no complica la experiencia del usuario: la mejora, creando un ecosistema vibrante donde la creatividad y la colaboración colectivas se traducen directamente en una plataforma más poderosa, flexible y fácil de usar.
Ishan Pandey: Has posicionado Sentient Chat como un competidor de Perplexity, impulsado por Dobby, el primer modelo de IA comunitario del mundo. ¿Puedes explicarnos la innovación técnica detrás de Dobby y cómo respalda las capacidades únicas de Sentient Chat?
Himanshu Tyagi: La IA se está convirtiendo rápidamente en el intermediario entre las redes de información y los usuarios, lo que le otorga un poder significativo para influir en las perspectivas de los usuarios basándose en sesgos inherentes. Nuestro objetivo es empoderar a las comunidades permitiéndoles alinear los modelos de IA según sus valores específicos, promoviendo así un ecosistema diverso de modelos de "IA leal". Si bien los sesgos siempre existirán debido a los datos de entrenamiento, los usuarios no deben limitarse a modelos generalizados que simplemente promedian las opiniones en internet. En su lugar, visualizamos a los usuarios seleccionando entre una amplia gama de modelos alineados con los valores distintivos de la comunidad.
Dobby representa el primero de estos modelos, explícitamente alineado con los valores de la comunidad cripto: pro-cripto y pro-libertad personal. Con Dobby, hemos logrado tres avances técnicos notables:
Alineación efectiva de valores sin pérdida de rendimiento: Ajustar los modelos de IA a valores específicos mediante ajustes finos es un desafío, lo que a menudo resulta en un rendimiento reducido y resultados incoherentes. Con Dobby, hemos optimizado con éxito el modelo Llama para que adopte valores específicos y mantenga un rendimiento excelente en parámetros de referencia críticos.
Tono centrado en el ser humano y libertad de expresión con seguridad: Lograr la alineación deseada requirió eliminar las barreras existentes de Llama y reconstruirlas cuidadosamente. Sorprendentemente, este proceso mejoró el tono del modelo, resultando en interacciones más naturales y centradas en el ser humano. Incluso con restricciones más flexibles, Dobby se mantiene seguro, como lo demuestran las métricas de nuestro "Sorry Bench". Además, nuestros modelos Dobby-mini 8B y Dobby 70B exhiben un control granular sobre dimensiones de seguridad específicas (como discurso de odio, asesoramiento financiero, médico y legal, y contenido explícito), lo que nos permite realizar ajustes precisos del perfil de seguridad del modelo.
Huellas digitales para la propiedad de modelos más distribuida de la historia: Dobby es actualmente el modelo con mayor distribución, con más de 660.000 propietarios. Este nivel de distribución sin precedentes se ve facilitado por nuestra innovadora tecnología de huellas digitales. La huella digital inyecta pares clave-respuesta únicos en el modelo, lo que permite una verificación robusta de la propiedad. Estas huellas digitales tienen un impacto mínimo en el rendimiento general del modelo y son resistentes a la eliminación mediante ajustes, la fusión de modelos u otras modificaciones.
Sentient Chat es nuestra plataforma de búsqueda basada en IA, diseñada para mostrar y ofrecer a los usuarios una experiencia directa del concepto intangible de la IA Leal. Esta plataforma demuestra la ventaja competitiva de los ecosistemas de código abierto, superando con éxito a plataformas como Perplexity e igualando los parámetros de búsqueda de ChatGPT.
Impulsado por Dobby, Sentient Chat ilustra cómo la IA Leal puede influir directamente en la información que se entrega a los usuarios, presentando el contenido de forma concisa y atractiva. La integración de Dobby en Sentient Chat ha mejorado notablemente la eficiencia y el entretenimiento de las interacciones de búsqueda. Con el estilo de comunicación claro, humano y directo de Dobby, los usuarios pueden acceder de forma rápida y eficaz a la información que buscan, lo que destaca la ventaja distintiva de la plataforma en las experiencias de búsqueda basadas en IA.
Ishan Pandey: Uno de los aspectos más interesantes de Sentient Chat es su Agente de Razonamiento, equipado con herramientas como búsqueda, calculadora y pensamiento. ¿Cómo diseñaron este agente y qué obstáculos técnicos superaron para convertir el razonamiento en una fortaleza fundamental?
Himanshu Tyagi: Los avances recientes han demostrado que generar código Python ejecutable para la llamada a herramientas mejora significativamente el rendimiento en comparación con los enfoques convencionales basados en JSON. En particular, los LLM son intrínsecamente hábiles para comprimir el espacio de acción de las tareas mediante código. Esto, naturalmente, impulsó el uso del código como modo de expresión para nuestro agente de razonamiento. En ocasiones, los LLM escriben código que no se ejecuta correctamente, lo cual se soluciona mediante un intérprete de Python que verifica si el código generado se ejecuta o genera errores. Si estos errores se producen, se regenera el código (con los rastros de errores previos) hasta obtener un código satisfactorio.
Otra advertencia es que el LLM puede generar código funcional que no hace lo que se pretende que haga (por ejemplo, llama a la herramienta calculadora en lugar de buscar); el agente de razonamiento es capaz de digerir la salida de la información y evaluar si se ajusta, en un nivel general, a lo que espera de la llamada al código/herramienta en particular.
Probamos dos tipos diferentes de agentes en la parte de Agente de Razonamiento Abierto del marco ODS: Cadena de Pensamiento con agente ReAct y Cadena de Código con agente CodeAct.
En la arquitectura ReAct de Cadena de Pensamiento, el agente sigue un ciclo iterativo de razonamiento-acción. Primero, el paso "Pensar" le permite razonar internamente, formulando planes o interpretando resultados intermedios en lenguaje natural. Cuando el agente encuentra incertidumbre o carece de información crítica, invoca la herramienta "Buscar", recuperando activamente información externa de la web. Para tareas aritméticas o computacionales que requieren alta precisión, el agente utiliza la herramienta "Calcular". De este modo, CoT-ReAct alterna continuamente entre pensamiento, búsqueda y cálculo según sea necesario, hasta llegar a una solución fiable.
Por otro lado, el agente de Cadena de Código o CodeAct utiliza código ejecutable para realizar sus tareas de razonamiento. Inicialmente, el agente analiza su estrategia, de forma similar a CoT-ReAct. Sin embargo, en lugar de basarse exclusivamente en lenguaje natural, genera código Python ejecutable como parte de su razonamiento. La función "Calcular" está integrada a la perfección en el entorno de ejecución de Python. Esto permite cálculos precisos y razonamiento algorítmico. Al igual que CoT-ReAct, CodeAct también utiliza la herramienta "Buscar" cuando se necesita información externa adicional, incorporando los resultados directamente en sus procesos de generación y ejecución de código.
La diferencia clave radica en cómo cada agente interactúa con estas herramientas. Para CoT-ReAct, «Pensar», «Buscar» y «Calcular» son acciones claramente independientes, elegidas explícitamente durante el razonamiento. Para CodeAct, mientras que «Pensar» sigue siendo un paso explícito de planificación, «Calcular» está integrado de forma inherente a la ejecución del código, lo que convierte las tareas computacionales en parte integral en lugar de externas. «Buscar» permanece igualmente explícito en ambos enfoques, proporcionando un contexto externo vital cuando el conocimiento interno del agente es insuficiente.
Ishan Pandey: Sentient completó una acuñación récord de 650,000 NFT para Dobby, vinculando la propiedad a un modelo de IA descentralizado. ¿Qué infraestructura técnica construyeron para gestionar esta escala y cómo la tecnología blockchain mejora el aspecto de la propiedad comunitaria?
Himanshu Tyagi: Este no era un problema técnicamente complejo; las cadenas de bloques modernas pueden gestionar fácilmente dicha carga. Lo más interesante es que esta es la primera vez que alguien demuestra esta escala de "democracia directa" en la gobernanza de modelos. En empresas centralizadas, esta gobernanza la lleva a cabo un pequeño equipo de alineación que, en ocasiones, incluso ha modificado el modelo para adaptarlo a sus propias convicciones. Anthropic había realizado experimentos sencillos bajo el nombre de IA constitucional con unas 1000 personas, pero nada parecido a esta gobernanza abierta comunitaria. Queríamos otorgar este poder a la gente, y las cadenas de bloques son instrumentos perfectos para ello. La comunidad de Dobby ya decidió qué tipo de personalidad debería tener Dobby, con o sin control (eligieron sin control en lugar de con o sin control). En el futuro, todas las decisiones sobre el modelo Dobby sin control las tomará esta comunidad, que también recibirá recompensas a medida que aumente el uso del modelo.
En adelante, estos NFT de propiedad se convertirán en tokens de propiedad en nuestra blockchain, que podrán utilizarse para gestionar la alineación y las actualizaciones de este modelo. Además, las huellas dactilares asociadas se comprometerán como raíz de Merkle al mismo contrato: cualquiera puede verificar la identidad del modelo mediante nuestras consultas de huellas dactilares y comprobar que las mismas consultas se comprometen con el contrato de propiedad.
Ishan Pandey: Su Agente de Razonamiento integra herramientas en tiempo real y busca abordar tareas ambiguas y subjetivas. ¿En qué se diferencia de los agentes de razonamiento existentes, como Deep Research de OpenAI, y qué soluciones innovadoras implementaron para ampliar los límites del razonamiento de la IA?
Himanshu Tyagi: Al comparar nuestra plataforma de código abierto con la competencia de código cerrado, la principal ventaja competitiva de los sistemas cerrados ha sido tradicionalmente su tecnología. Sin embargo, plataformas como Sentient Chat y Open Data Sources (ODS) han nivelado eficazmente las condiciones al democratizar el conocimiento de la IA, haciendo que nuestro marco sea completamente abierto a la comunidad. Las plataformas de código cerrado, como las de OpenAI, funcionan como cajas negras; ni usted, ni yo, ni nadie más puede comprender plenamente sus procesos internos.
En contraste, nuestro marco abierto fomenta la innovación continua de la comunidad, lo que permite identificar y resolver rápidamente brechas que, de otro modo, podrían pasar desapercibidas. Este enfoque colaborativo, de entrada y salida abiertas, es clave para construir la mejor plataforma de búsqueda posible. Nuestra visión final incluye permitir que los usuarios aporten sus propias fuentes de datos y agentes, optimizando así drásticamente Sentient Chat y ODS mediante mejoras colectivas impulsadas por la comunidad.
Ishan Pandey: Has destacado la ventaja de Sentient Chat sobre competidores como Perplexity con su integración de más de 15 agentes de IA. ¿Qué desafíos técnicos presentó la integración de varios agentes en una única interfaz de chatbot y cómo los resolvieron?
Himanshu Tyagi: Técnicamente, estamos abordando numerosos desafíos complejos de software y diseño para permitir que una amplia variedad de agentes participen en una experiencia de usuario única a través de Sentient Chat. También ofrecemos numerosas herramientas a estos desarrolladores de agentes, como nuestras API de búsqueda de IA de vanguardia y la solución Sentient Secure Enclave para crear agentes robustos, entre otras. Pero más que abordar estos desafíos técnicos, lo más interesante es la posibilidad de una forma completamente nueva de acceder al conocimiento de internet.
Durante décadas, Google ha dominado las búsquedas, centrándose principalmente en ayudar a los usuarios a encontrar información en línea. Su dependencia de los ingresos publicitarios, basados en la recomendación de fuentes de información, limita inherentemente su capacidad de innovar más allá de la recuperación de información tradicional. La IA, por otro lado, ofrece la oportunidad de evitar la simple recopilación de información, permitiendo a los usuarios ejecutar tareas directamente sin necesidad de fases de análisis y acción independientes, lo que constituye precisamente nuestra ventaja competitiva frente al gigante Google.
Esta ambiciosa visión requiere un ecosistema diverso que integre diversas fuentes de datos indexadas con numerosos agentes de IA capaces de realizar acciones especializadas. La clave para aprovechar este potencial reside en crear una plataforma transparente y abierta que incentive activamente la participación comunitaria. Los proveedores de datos deben comprender claramente el valor que aportan sus contribuciones, mientras que los desarrolladores de agentes deben integrar sus servicios a la perfección para mejorar la funcionalidad general. Dicho ecosistema debe estar gobernado por la comunidad, garantizando la equidad, la apertura y la innovación continua impulsada por la contribución y la colaboración colectivas.
¡Por cierto, muchos más de 15 agentes se unirán a Sentient Chat!
Ishan Pandey: De cara al futuro, ¿qué le depara a Sentient la innovación técnica? ¿Cómo planean evolucionar el Agente de Razonamiento y expandir el ecosistema abierto de IAG?
Himanshu Tyagi: Vemos un futuro en el que la IA se convierte en un intermediario entre todos los sentidos humanos, la información global y las redes sociales. La visión de Sentient es garantizar que esta IA nos sea fiel. Este objetivo singular impulsa todo nuestro desarrollo. En el caso de los agentes de razonamiento, queremos asegurarnos de que los desarrolladores tengan acceso a modelos cuyas capacidades y habilidades de razonamiento se ajusten a sus intereses o al caso de uso.
Por ejemplo, si se crea un agente soberano que pueda controlar billeteras, los modelos subyacentes deben tener capacidades de razonamiento para garantizar que actores maliciosos no puedan manipular las solicitudes y robar fondos. Esto es alineación: construiremos estos modelos alineados. Todo desarrollador que desarrolle en el ecosistema de AGI Abierta debe tener la opción de usar modelos de IA que sean leales a su aplicación o usuarios. Sentient Chat es la oferta colectiva de todos estos agentes basados en IA Leal.
¡No olvides darle me gusta y compartir la historia!
Divulgación de intereses creados: este autor es un colaborador independiente que publica a través de nuestro