¡Hola a todos! Soy Nataraj y, al igual que tú, me han fascinado los recientes avances de la inteligencia artificial. Al darme cuenta de que necesitaba estar al tanto de todos los avances que ocurrían, decidí embarcarme en un viaje personal de aprendizaje, ¡así nació 100 días de IA ! Con esta serie, aprenderé sobre los LLM y compartiré ideas, experimentos, opiniones, tendencias y aprendizajes a través de las publicaciones de mi blog. Puede seguir el viaje en HackerNoon aquí o en mi sitio web personal aquí . En el artículo de hoy, buscaremos construir un kernel semántico con la ayuda de GPT-4.
Están sucediendo muchas cosas en el espacio de la IA generativa. Hasta tal punto que Nvidia, el traficante de armas de IA generativa con sus chips H100, ha superado ahora las valoraciones de mercado de Amazon. También es un espacio muy dinámico con mucha actividad por parte de startups y grandes empresas tecnológicas. En esta publicación destacaré tres grandes tendencias que podríamos ver en los próximos 12 a 18 meses.
Durante las últimas dos décadas hemos seguido diciendo que los datos son el nuevo petróleo . Esta frase tendrá implicaciones reales este año. Muchas empresas han acumulado conjuntos de datos únicos y han encontrado un producto que encaja en el mercado. Recientemente, surgió la noticia de que Reddit hizo un trato para acceder a sus datos a una empresa anónima por 60 millones de dólares. Se desconocen los términos del acuerdo, pero son 60 millones de dólares nuevos en ingresos para Reddit. Busque más ofertas de empresas que tengan conjuntos de datos únicos.
Desde que Open AI lanzó el chat gpt, la conversación estuvo dominada por los modelos base de la serie gpt, que son modelos cerrados, lo que significa que nadie, excepto el equipo de Open AI, conoce los detalles de cómo se entrenó el modelo, con qué datos se entrenó y los parámetros del modelo. Veremos más modelos de código abierto subir al escenario y captar la atención. El principal actor en este ámbito a tener en cuenta es Meta (Facebook). Meta está sacando la página del enfoque de Google en dispositivos móviles. Si bien el sistema operativo móvil de Apple estaba cerrado, la estrategia de Google era ser un sistema operativo móvil de código abierto que alimentara más del 80% de los teléfonos móviles del mundo. Así que mantente atento a Meta.
Open AI demostró al mundo cuál es el poder de los modelos de lenguajes grandes (LLM). Pero como todas las empresas de IA están compitiendo para crear productos y características listas para usar e intentando que las empresas adopten la IA para sus negocios. Es posible que los LLM no siempre sean la mejor solución. Un modelo más pequeño que pueda requerir menos computación para entrenar y utilice menos datos pero de mayor calidad podría ser mejor. Estos modelos, denominados SLM, podrían ejecutarse en teléfonos móviles, lo que aumentará el acceso de la IA a un público más amplio. Algunos de los SLM que debe consultar son:
Una de las principales funciones que obligan a adaptarse e innovar con SML es reducir el costo de computación y, por lo tanto, hacer que la IA sea más accesible.
No me refiero a la seguridad de los datos para formar el LLM. Me refiero a casos en los que los usuarios pueden piratear LLM para hacer algo que no deben hacer o simplemente romperlos. Están surgiendo muchos problemas de seguridad sobre cómo piratear los comportamientos de LLM. Algunos incluyen:
Cada vez descubrimos más formas en que los LLM pueden verse comprometidos a medida que reparamos los que conocemos. Esta será una de las áreas activas en las que se lograrán avances en 2024, tanto en investigación como en productos.
Está bastante claro que la IA tendrá enormes implicaciones en la sociedad en todos los sectores. Se cruzará con todos los aspectos de la sociedad y, como hemos visto, todas las grandes empresas anuncian importantes iniciativas e inversiones en IA durante 2022-23.
Los reguladores ya estaban centrados en las grandes tecnologías, lo que les impidió realizar adquisiciones en los últimos 3 años. Teniendo esto en cuenta, veremos a los reguladores tanto de EE. UU. como de la UE vigilar de cerca las inversiones en IA y también potencialmente desenredar algunas de las inversiones. Las inversiones se realizaron principalmente para evitar adquisiciones porque las personas que dirigen grandes empresas de tecnología saben que será una batalla cuesta arriba lograr su aprobación. Pero incluso algunas de estas inversiones también podrían estar bajo escrutinio.
Eso es todo por el día 14 de 100 días de IA.
Escribo un boletín llamado Above Average donde hablo sobre los conocimientos de segundo orden detrás de todo lo que está sucediendo en la gran tecnología. Si estás en tecnología y no quieres ser promedio, suscríbete .
Sígueme en Twitter , LinkedIn o HackerNoon para obtener las últimas actualizaciones sobre 100 días de IA. Si está en tecnología, es posible que le interese unirse a mi comunidad de profesionales de la tecnología aquí .