GPT-4 es un comodín en el juego de cartas corporativo. Puede aumentar sustancialmente la productividad y conducir a un trabajo de mayor o menor calidad dependiendo de la tarea en cuestión y de cómo se utilice. En términos generales, podemos adoptar una postura optimista o pesimista sobre la rápida implementación de GPT-4 en entornos de oficina en todo el mundo.
La postura optimista es que la asistencia de la IA conducirá a un aumento de la calidad y la productividad de los trabajadores. Se realizará más trabajo más rápido y mejor. La asistencia de la IA ayudará con las tareas rutinarias, brindará apoyo vital en tareas no rutinarias y liberará tiempo y recursos para que los trabajadores se concentren en cosas críticas para el negocio que “mueven la aguja”.
La postura pesimista es que el regalo de la asistencia de la IA es un caballo de Troya. La automatización se infiltrará en las empresas y lentamente devorará el trabajo del conocimiento humano poco a poco, en beneficio de una élite tecnológica súper rica y a expensas de los asalariados sin poder. Los empleados de oficina amantes de ChatGPT sufren una especie de síndrome de Estocolmo y coquetean con sus propios sustitutos.
Mi opinión personal se inclina más hacia la postura pesimista. Reconozco lo útil que es GPT-4 como herramienta de recuperación de información, esencialmente una versión más inteligente y personalizada de la Búsqueda de Google. Pero si dependía de la ayuda de un chatbot para, por ejemplo, escribir un borrador de un artículo o generar nuevas ideas para una publicación, ¿por qué hacer el trabajo en primer lugar? También podría subcontratarlo por completo a la IA o, preferiblemente, no hacer ningún trabajo.
Hoy, echaremos un vistazo a un artículo de la Escuela de Negocios de Harvard que arroja luz sobre el impacto de la asistencia GPT-4 en el trabajo del conocimiento: " Navegando por la frontera tecnológica irregular: evidencia experimental de campo de los efectos de la IA en la productividad y la calidad de los trabajadores del conocimiento ". , publicado en septiembre de 2023.
Un grupo de científicos sociales llevó a cabo un experimento para probar las habilidades de 758 consultores de Boston Consulting Group (BCG) en diferentes tareas con y sin acceso a GPT-4.
Aproximadamente la mitad de los consultores participantes (385) realizaron 18 tareas relacionadas con el desarrollo de productos creativos, mientras que la otra mitad (373) participó en una tarea de resolución de problemas comerciales que dependía de datos externos y otras fuentes. Examinaremos más de cerca las tareas específicas en la siguiente sección.
Todos los participantes realizaron una prueba inicial sin asistencia de IA para que los investigadores pudieran comparar el desempeño del consultor individual sin ayuda con su desempeño con GPT-4. Los participantes también fueron asignados a uno de los tres subgrupos dentro de los dos experimentos: un grupo de control sin acceso a GPT-4, un segundo grupo con acceso a GPT-4 y un tercer grupo con acceso a GPT-4 y material de aprendizaje. sobre cómo activar GPT-4 de manera efectiva.
Los resultados de los titulares mostraron que los consultores con acceso a la IA en general obtuvieron resultados notablemente mejores en las tareas creativas de desarrollo de productos. En este caso, el consultor completó un 12,2 % más de tareas en promedio, completó las tareas un 25,1 % más rápido y con un 40 % más de calidad, según evaluadores humanos que calificaron las pruebas a ciegas.
El segundo grupo de consultores que trabajó con tareas de resolución de problemas empresariales tenía un 19% menos de probabilidades de producir resultados correctos con acceso a GPT-4. En promedio, GPT-4 ayudó a los consultores a terminar las tareas unos minutos más rápido: seis minutos más rápido para "solo GPT" y once minutos para "GPT + descripción general".
Basándose en los resultados experimentales, el equipo de investigación imagina una "frontera irregular".
Dentro de “la frontera irregular”, la asistencia de la IA aumenta la calidad y la productividad del desempeño humano. Fuera de la frontera, la asistencia de la IA la limita. La frontera es “irregular” porque es difícil predecir qué tareas quedan dentro o fuera de la frontera y, a veces, parece ilógico. Por ejemplo, GPT-4 puede aprobar la mayoría de los exámenes universitarios , pero también tiene problemas con problemas matemáticos básicos .
El concepto de “la frontera irregular” es acertado. Sin embargo, en mi opinión, el documento exagera significativamente las capacidades del GPT-4. Lo más importante es que esto se debe a las estrictas limitaciones de tiempo con las que tuvieron que trabajar los consultores de BCG en el experimento.
En la parte del experimento de desarrollo de productos creativos, donde se demostró que la asistencia GPT-4 aumenta significativamente la productividad y la calidad, los consultores tuvieron que completar 18 tareas en solo 90 minutos. A continuación se muestran algunos ejemplos de tareas que los consultores tuvieron que responder dentro del umbral de 90 minutos:
“Generar ideas para un nuevo calzado dirigido a un mercado o deporte específico que está desatendido. Sea creativo y dé al menos 10 ideas”.
“Elabore una lista de los pasos necesarios para lanzar el producto. Sea conciso pero completo”.
“Piensa en un nombre para el producto: considera al menos 4 nombres, escríbelos y explica cuál escogiste”.
"Escribe un memorando de 500 palabras a tu jefe explicando tus hallazgos".
"Escribir un texto de marketing para un comunicado de prensa".
"Por favor, sintetice los conocimientos que ha obtenido de las preguntas anteriores y cree un esquema para un artículo estilo Harvard Business Review de aproximadamente 2500 palabras".
Solo una de estas tareas individualmente podría tardar días, incluso semanas, en completarse. Ni siquiera el consultor más selecto del mundo podía esperar que realizara todas estas tareas con un nivel satisfactorio de calidad y precisión en 90 minutos. Es humanamente imposible.
En el experimento con tareas "fuera de la frontera", los participantes tuvieron que analizar el desempeño de la marca de una empresa hipotética basándose en información de entrevistas y datos financieros y preparar una nota de 500 a 750 palabras para un CEO ficticio. La restricción de tiempo en esta parte del experimento fue de 60 minutos, lo que, nuevamente, no se aproxima en mucho al tiempo que los consultores realmente dedicarían a una tarea como esta en la vida real.
Mi hipótesis : cuanto más tiempo se les da a los humanos para realizar una tarea, menos significativa es la asistencia de la IA. Si, por ejemplo, a los consultores de BCG se les dieran semanas o meses para llevar a cabo las mismas 18 tareas creativas de desarrollo de productos, lo que reflejaría mejor cómo trabajan realmente los consultores, las mejoras derivadas del uso de GPT-4 serían, en el mejor de los casos, minúsculas. En general, el resultado final también sería de una calidad significativamente mayor que la que un humano puede producir con GPT-4 en 90 minutos.
En mi opinión, navegar por la frontera irregular no se trata de comprender en qué tipo de tareas GPT-4 puede ayudarlo de manera efectiva, sino de explorar qué habilidades puede ofrecer que la automatización no puede reemplazar fácilmente.
Los autores analizaron diferentes enfoques que adoptaron los participantes para trabajar con IA e identificaron dos modelos predominantes, "comportamiento centauro" y "comportamiento cyborg":
“Comprender las características y comportamientos de estos participantes puede resultar importante a medida que las organizaciones piensan en formas de identificar y desarrollar talentos para una colaboración eficaz con herramientas de IA .
Identificamos dos modelos predominantes que resumen su enfoque.
El primero es el comportamiento de los centauros. Este enfoque, que lleva el nombre de la criatura mítica que es mitad humana y mitad caballo, implica una división estratégica similar del trabajo entre humanos y máquinas estrechamente fusionadas. Los usuarios con esta estrategia cambian entre IA y tareas humanas, asignando responsabilidades en función de las fortalezas y capacidades de cada entidad. Disciernen qué tareas son más adecuadas para la intervención humana y cuáles pueden ser gestionadas eficientemente por la IA.
El segundo modelo que observamos es el comportamiento Cyborg. Este enfoque, que lleva el nombre de seres híbridos humano-máquina previstos en la literatura de ciencia ficción, trata sobre una integración intrincada. Los usuarios de Cyborg no sólo delegan tareas; entrelazan sus esfuerzos con la IA en la frontera misma de las capacidades. Esta estrategia podría manifestarse como responsabilidades alternas a nivel de subtarea, como iniciar una oración para que la IA la complete o trabajar en conjunto con la IA”.
No soy un gran admirador de enmarcar a GPT-4 como un socio de colaboración. Principalmente por dos razones:
En las asociaciones entre humanos e IA, la IA puede hacer la mayor parte del trabajo, pero la responsabilidad total del trabajo recae en el ser humano.
Preferiría dedicar mi tiempo a crear nuevos trabajos desde cero que revisar y editar los resultados generados por IA en busca de errores, inexactitudes y sesgos. En primer lugar, revisar el contenido generado automáticamente no es muy divertido. En segundo lugar, pase lo que pase, sigo siendo responsable de cualquier error que pueda haber. Si dependí demasiado de GPT-4 para completar una tarea, no puedo explicar por qué cometí los errores que cometí y tampoco puedo aprender ni crecer a partir de ellos. ¿Hasta qué punto podemos decir que una obra sigue siendo el resultado de un esfuerzo creativo exclusivamente humano cuando el trabajador está "colaborando" con la IA generativa?
"El juicio profesional de un abogado no se puede delegar a la IA generativa y sigue siendo responsabilidad del abogado en todo momento".
- “Guía práctica para el uso de inteligencia artificial generativa en la práctica del derecho ”, Comité Permanente sobre Responsabilidad y Conducta Profesional del Colegio de Abogados del Estado de California (noviembre de 2023).
Como escribí en mi última publicación , hubo un breve lapso de tiempo después de la victoria de Deep Blue en 1997 sobre el actual campeón de ajedrez Garry Kasparov, donde parecía que los humanos que colaboraban con la IA podían derrotar incluso a los motores de ajedrez más fuertes. Kasparov popularizó el término "centauros" para describir estos equipos mixtos de humanos e inteligencia artificial.
Sin embargo, tal como están las cosas hoy en día, los humanos no pueden aportar mucha experiencia en las partidas que se juegan entre los principales programas de ajedrez. De hecho, lo único que los humanos pueden contribuir es a aumentar la tasa de error. Resulta que jugar al ajedrez es algo que las IA saben hacer mucho mejor que los humanos.
Creo que podemos extraer una lección importante de la evolución de la IA en el tablero de ajedrez: los “centauros” y los “cyborgs” eventualmente son derrotados por una mayor automatización. Por analogía, los trabajadores de oficina que dependen en gran medida de la asistencia de la IA deberían comenzar a pensar profundamente en qué habilidades únicas pueden ofrecer y que un modelo de IA no puede ofrecer. Lo más probable es que la función principal de los centauros y cyborgs sea alimentar a sus sustitutos con más material de capacitación, especialmente para tareas que pueden automatizarse fácilmente y que no implican mucha interacción social, adaptación, flexibilidad y comunicación.
¿Cómo se puede derrotar a los centauros y cyborgs en el lugar de trabajo moderno? Simplemente, los derrotas con más tiempo. Si a los humanos se les permite más tiempo para realizar trabajos complicados y creativos, la ayuda de GPT-4 es superflua.
Por otro lado, ciertas tareas que los humanos realizan hoy “en colaboración” con la IA generativa estarán completamente automatizadas en el futuro previsible. Supongamos que un trabajador humano no puede producir un resultado sustancialmente mejor durante un período de tiempo prolongado que el que las generaciones futuras de GPT-4 pueden producir en unos pocos segundos. En ese caso, realmente no hay razón para seguir subcontratando ese tipo de tareas a trabajadores humanos.
En mi interpretación, navegar por la frontera irregular en realidad consiste en preguntarse: ¿qué habilidad única puedo ofrecer que no pueda ser reemplazada por la automatización en unos pocos años?
Suscríbase a mi boletín gratuito The Gap: www.futuristiclawyer.com
También publicado aquí .