paint-brush
Explicando la ingeniería rápidapor@docligot
2,932 lecturas
2,932 lecturas

Explicando la ingeniería rápida

por Dominic Ligot5m2024/11/14
Read on Terminal Reader
Read this story w/o Javascript

Demasiado Largo; Para Leer

¿Cómo y por qué funciona realmente la ingeniería rápida?

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - Explicando la ingeniería rápida
Dominic Ligot HackerNoon profile picture
0-item
1-item

El arte de la ingeniería rápida se está convirtiendo en una habilidad fundamental para aprovechar eficazmente el potencial de la IA a medida que esta sigue evolucionando. Sin embargo, a pesar de toda su importancia, la ingeniería rápida suele reducirse a consejos simplistas, como “sea específico” o trucos rápidos como “pensemos paso a paso”.


Si bien estos consejos son útiles para principiantes, apenas rozan la superficie. La verdadera ingeniería de indicaciones requiere una comprensión mucho más profunda de la mecánica detrás de las respuestas de la IA, que va mucho más allá de lo que a menudo es poco más que una búsqueda de Google sin resultados. Aquí repasamos algunos principios fundamentales para explicar por qué una buena indicación realmente funciona.


Incrustaciones: la base de una comprensión rápida

Uno de los conceptos fundamentales de una indicación eficaz es la comprensión de las incrustaciones. Cuando introducimos una indicación en un modelo, este no procesa el lenguaje como lo hacemos nosotros, sino que cada palabra o frase se transforma en una incrustación, una representación numérica que captura tanto el significado como el contexto del lenguaje. Estas incrustaciones actúan como el mapa interno del modelo, ayudándolo a interpretar relaciones, matices y asociaciones entre las palabras.


Fuente: Proyector de incrustación de Tensorflow


Para los ingenieros de indicaciones, comprender las incrustaciones es esencial para la intuición de las indicaciones. La forma en que se representa una palabra en el espacio de incrustación determina cómo la interpreta el modelo, lo que afecta el contenido y el enfoque de las respuestas. Por ejemplo, si una indicación solicita información sobre "fabricación", el modelo extraerá contenido en función de las incrustaciones vinculadas a esos términos, posiblemente de áreas como procesos de producción, logística de la cadena de suministro o avances tecnológicos. Un ingeniero de indicaciones puede influir en estas respuestas elaborando hábilmente la redacción, lo que mejora la relevancia y la profundidad del resultado.


Comprender las incrustaciones también permite a los ingenieros de indicaciones encadenar mejor las indicaciones , donde cada respuesta se basa en interacciones anteriores. Al crear secuencias teniendo en cuenta las relaciones de incrustación, los ingenieros de indicaciones crean conversaciones complejas y conscientes del contexto que se adaptan a necesidades específicas y producen resultados detallados y receptivos.


El papel de la atención: modelo orientador del enfoque

Otro componente central de la ingeniería de indicaciones es la atención. A diferencia de la atención humana, que puede cambiar dinámicamente entre diferentes temas, la atención de la IA asigna peso a las relaciones entre las palabras dentro de la indicación y el texto de respuesta. La atención ayuda al modelo a priorizar ciertas partes de la entrada, y una indicación bien diseñada la utiliza para dar forma al enfoque del modelo. Tomemos, por ejemplo, una indicación que pide una visión matizada de un gato sentado en una alfombra.


Fuente: Tutorial interactivo de Bertviz


Los ingenieros de estímulos pueden guiar el modelo para enfatizar aspectos relevantes del tema del estímulo, como la postura del gato, la textura y el color de la alfombra o el ambiente general de la escena, lo que genera una respuesta más detallada y vívida. Este enfoque de estímulos, conocido como estímulo direccional , permite la extracción de respuestas más ricas y relevantes del modelo.

RAG: Generación aumentada de recuperación para respuestas mejoradas

La generación aumentada por recuperación (RAG) combina la inteligencia artificial generativa con los sistemas de recuperación para mejorar la precisión y la relevancia de las respuestas. La ingeniería de indicaciones tradicional se basa en el conocimiento interno de un modelo, que puede estar desactualizado o incompleto. La RAG aborda este problema añadiendo una capa de recuperación que extrae información actual y contextualmente relevante de fuentes externas, como bases de datos o motores de búsqueda, lo que permite que el modelo proporcione respuestas más precisas y actualizadas.


Proceso típico de RAG


RAG es transformador para la ingeniería de avisos. Permite a los ingenieros estructurar avisos que dirigen tanto los componentes de recuperación como los generativos para que trabajen juntos, algo especialmente valioso para temas complejos o de rápida evolución. Por ejemplo, un aviso sobre “cambios recientes en las leyes de privacidad de datos” podría hacer que el modelo busque los documentos o noticias legales más recientes, que luego combina con información interna a través de RAG para sintetizar en una respuesta coherente. Esta doble capacidad reduce las alucinaciones y mantiene al modelo basado en información confiable en tiempo real.


De este modo, los ingenieros que trabajan dentro de los marcos RAG pueden crear interacciones que sean innovadoras y estén basadas en el conocimiento actual, agregando una capa adicional de sofisticación al resultado de la IA.

La estimulación de imágenes y el proceso de difusión

En la generación de imágenes, la ingeniería de indicaciones adquiere otro nivel de complejidad. En este caso, las indicaciones no se limitan a las palabras, sino que sirven para guiar a un modelo a través del proceso de difusión, una técnica en la que el ruido aleatorio se transforma iterativamente en una imagen coherente. El proceso de difusión se basa en ajustes iterativos y cada ciclo se basa en el anterior para refinar una imagen en función de la guía de la indicación.


Fuente: Midjourney - gato <prompt>



Al crear indicaciones para la generación de imágenes, es fundamental comprender la difusión. Descripciones como “fotografía premiada” o “fotografía de moda” pueden arrojar resultados variables según cómo el modelo interprete “premiado” o “moda”. Los ingenieros de indicaciones deben comprender la interpretación que hace el modelo de las relaciones espaciales, el color y la composición para producir el resultado deseado. No se trata solo de estética; se trata de guiar al modelo a través de cada paso para que se alinee con el concepto visual deseado.


Alucinaciones y los peligros de una mala incitación

Uno de los aspectos más desafiantes de la estimulación con IA es el manejo de las alucinaciones, cuando un modelo produce contenido que suena plausible pero es totalmente inventado. Las alucinaciones suelen ser resultado de indicaciones vagas o mal estructuradas , que dejan mucho espacio a la interpretación del modelo. En campos como la atención médica o las finanzas, donde la precisión es fundamental, incluso una pequeña alucinación puede tener consecuencias graves.


Los ingenieros de indicaciones capacitados evitan esto mediante la construcción de indicaciones que minimizan la ambigüedad , verificando los resultados con indicaciones de verificación de hechos y manteniendo una estricta claridad y enfoque.


Por qué la ingeniería rápida es una habilidad real

En definitiva, la ingeniería de indicaciones es una habilidad genuina que combina la intuición del lenguaje con un profundo conocimiento técnico de la mecánica de la IA. A diferencia de las consultas de búsqueda simples, los ingenieros de indicaciones con conocimiento de las incrustaciones, los mecanismos de atención y las limitaciones del modelo pueden crear mejores indicaciones. El dominio de estos elementos permite a los ingenieros de indicaciones dar forma a respuestas que son precisas, confiables y, a menudo, sorprendentemente creativas.


La necesidad de ingenieros de programación cualificados no hará más que aumentar a medida que la tecnología de IA siga integrándose en sectores que van desde la educación hasta el entretenimiento. Serán esenciales no solo para generar contenido, sino también para perfeccionar las aplicaciones de IA, solucionar problemas de salida y optimizar el rendimiento de los modelos en todos los campos. Lejos de ser una tendencia pasajera, la ingeniería de programación se perfila como una de las habilidades que definirán la era de la IA: una herramienta esencial para construir la comunicación entre humanos y máquinas.



Acerca de mí: Más de 25 años de experiencia en TI que combina datos, inteligencia artificial, gestión de riesgos, estrategia y educación. Ganador de 4 hackathons globales y defensor del impacto social de los datos. Actualmente, trabajo para impulsar la fuerza laboral de inteligencia artificial en Filipinas. Obtenga más información sobre mí aquí .