Cuando piensas en el equipo de ciencia de datos perfecto, ¿te imaginas 10 copias del mismo profesor de informática y estadística, con las manos delicadamente manchadas con marcador de pizarra? ¡Espero que no!
Geoff Hinton de Google es uno de mis héroes y un investigador increíble en aprendizaje profundo, pero espero que no esté planeando dotar a su equipo de ciencia de datos aplicados con 10 de él y nadie más.
La ciencia de datos aplicada es un deporte de equipo altamente interdisciplinario. ¡La diversidad de perspectivas importa! De hecho, la perspectiva y la actitud son tan importantes como la educación y la experiencia.
Si está interesado en hacer que sus datos sean útiles con un enfoque de ingeniería de inteligencia de decisiones , esta es mi opinión sobre el orden en el que debe hacer crecer su equipo.
Comenzamos a contar desde cero, por supuesto, ya que debe tener la capacidad de obtener datos antes de que tenga sentido hablar sobre el análisis de datos. Si se trata de conjuntos de datos pequeños, la ingeniería de datos consiste esencialmente en ingresar algunos números en una hoja de cálculo. Cuando opera a una escala más impresionante, la ingeniería de datos se convierte en una disciplina sofisticada por derecho propio. Alguien de su equipo deberá asumir la responsabilidad de lidiar con los complicados aspectos de ingeniería de la entrega de datos con los que el resto de su personal puede trabajar.
Antes de contratar a ese científico de datos con doctorado, asegúrese de tener un tomador de decisiones que comprenda el arte y la ciencia de la toma de decisiones basada en datos .
Las habilidades de toma de decisiones deben estar en su lugar antes de que un equipo pueda obtener valor de los datos.
Esta persona es responsable de identificar las decisiones que vale la pena tomar con los datos, enmarcarlas (todo, desde el diseño de métricas hasta tomar decisiones sobre supuestos estadísticos) y determinar el nivel requerido de rigor analítico en función del impacto potencial en el negocio. Busque un pensador profundo que no siga diciendo: "Oh, vaya, eso ni siquiera se me ocurrió mientras estaba pensando en esta decisión". Ya lo han pensado. Y eso. Y eso también
Luego, la próxima contratación es... todos los que ya trabajan contigo. Todos están calificados para mirar datos e inspirarse, lo único que podría faltar es un poco de familiaridad con el software que es adecuado para el trabajo. Si alguna vez ha mirado una fotografía digital, ha realizado análisis y visualización de datos .
Aprender a usar herramientas como R y Python es solo una actualización sobre MS Paint para la visualización de datos; son simplemente herramientas más versátiles para observar una variedad más amplia de conjuntos de datos que solo matrices de píxeles rojo-verde-azul .
Si alguna vez ha mirado una fotografía digital, ha realizado análisis y visualización de datos. Es lo mismo.
Y oye, si todo lo que tienes estómago para mirar las primeras cinco filas de datos en una hoja de cálculo, bueno, eso es mejor que nada. Si toda la fuerza laboral está capacitada para hacer eso, tendrá un mejor dedo en el pulso de su negocio que si nadie estuviera mirando ningún dato en absoluto.
Nessie 1934: Estos son datos. Saca conclusiones al respecto sabiamente.
Lo importante que debe recordar es que no debe llegar a conclusiones más allá de sus datos. Eso requiere una formación especializada. Al igual que con la foto de arriba, esto es todo lo que puede decir al respecto: “ Esto es lo que hay en mi conjunto de datos. ” Por favor, no lo use para concluir que el Monstruo del Lago Ness es real .
¡Entra en la versión ultrarrápida ! Esta persona puede ver más datos más rápido. El juego aquí es velocidad, exploración, descubrimiento... ¡diversión! (Otro término para análisis es minería de datos). Este no es el rol relacionado con el rigor y las conclusiones cuidadosas. En cambio, esta es la persona que ayuda a su equipo a ver la mayor cantidad posible de sus datos para que la persona que toma las decisiones pueda tener una idea de lo que vale la pena buscar con más cuidado.
El trabajo aquí es la velocidad, encontrar información potencial lo más rápido posible.
Esto puede ser contrario a la intuición, pero no asigne a este rol a sus ingenieros más confiables que escriben un código magnífico y robusto. El trabajo aquí es la velocidad, encontrar información potencial lo más rápido posible y, desafortunadamente, aquellos que se obsesionan con la calidad del código pueden encontrar demasiado difícil hacer zoom a través de los datos lo suficientemente rápido como para ser útiles en este rol.
Aquellos que se obsesionan con la calidad del código pueden tener dificultades para ser útiles en este rol.
He visto a analistas en equipos orientados a la ingeniería intimidados porque sus compañeros no se dan cuenta de lo que significa "buen código" para el análisis descriptivo. Grande es "rápido y humilde" aquí. Si los codificadores rápidos pero descuidados no reciben mucho cariño, dejarán su empresa y usted se preguntará por qué no tiene un dedo en el pulso de su negocio.
Ahora que tenemos a todas estas personas explorando alegremente los datos, será mejor que tengamos a alguien cerca para frenar el frenesí de alimentación. Es seguro mirar esa "foto" de Nessie siempre y cuando tengas la disciplina para evitar aprender más de lo que realmente hay allí... pero ¿y tú? Si bien las personas son bastante buenas para pensar razonablemente sobre las fotos, otros tipos de datos parecen enviar el sentido común por la ventana. Puede ser una buena idea tener a alguien cerca que pueda evitar que el equipo saque conclusiones injustificadas.
La inspiración es barata, pero el rigor es caro.
Lifehack: no saques conclusiones y no tendrás que preocuparte. Sólo estoy bromeando a medias. La inspiración es barata, pero el rigor es caro. Pague o conténtese con la mera inspiración .
Los estadísticos ayudan a los responsables de la toma de decisiones a llegar a conclusiones de forma segura más allá de los datos.
Por ejemplo, si su sistema de aprendizaje automático funcionó en un conjunto de datos, todo lo que puede concluir con seguridad es que funcionó en ese conjunto de datos. ¿Funcionará cuando se esté ejecutando en producción? ¿Deberías lanzarlo? Necesitas algunas habilidades adicionales para lidiar con esas preguntas. Habilidades estadísticas.
Si queremos tomar decisiones serias donde no tenemos hechos perfectos, reduzcamos la velocidad y tomemos un enfoque cuidadoso. Los estadísticos ayudan a los tomadores de decisiones a llegar a conclusiones seguras más allá de los datos analizados.
El mejor atributo de un ingeniero de inteligencia artificial / aprendizaje automático aplicado no es comprender cómo funcionan los algoritmos. Su trabajo es usarlos, no construirlos. (Eso es lo que hacen los investigadores). La experiencia en el código de disputa que hace que los algoritmos existentes acepten y agiten sus conjuntos de datos es lo que está buscando.
Además de los dedos de codificación rápidos, busque una personalidad que pueda hacer frente al fracaso. Casi nunca sabes lo que estás haciendo, incluso si crees que lo sabes. Ejecuta los datos a través de un montón de algoritmos lo más rápido posible y ve si parece estar funcionando... con la expectativa razonable de que fallará mucho antes de tener éxito. Una gran parte del trabajo consiste en incursionar a ciegas, y se necesita cierto tipo de personalidad para disfrutarlo.
Los perfeccionistas tienden a tener dificultades como ingenieros de ML.
Debido a que su problema comercial no está en un libro de texto, no puede saber de antemano qué funcionará, por lo que no puede esperar obtener un resultado perfecto en el primer intento. Está bien, solo pruebe muchos enfoques lo más rápido posible e itere hacia una solución.
Hablando de "ejecutar los datos a través de algoritmos"... ¿qué datos? Los aportes que sus analistas identificaron como potencialmente interesantes, por supuesto. Es por eso que los analistas tienen sentido como una contratación anterior.
Aunque hay muchos retoques, es importante que el ingeniero de aprendizaje automático tenga un profundo respeto por la parte del proceso donde el rigor es vital: la evaluación. ¿La solución realmente funciona con nuevos datos? Afortunadamente, hizo una buena elección con su contratación anterior, por lo que todo lo que tiene que hacer es pasarle el testigo al estadístico .
Los ingenieros de ML aplicado más fuertes tienen una muy buena idea de cuánto tiempo lleva aplicar varios enfoques .
Cuando un posible empleado de ML puede clasificar las opciones por el tiempo que lleva probarlas en varios tipos de conjuntos de datos, quedará impresionado.
De la forma en que uso la palabra, un científico de datos es alguien que es un experto completo en los tres roles anteriores. No todo el mundo usa mi definición : verá solicitudes de empleo con personas que se hacen llamar "científicos de datos" cuando realmente solo dominan uno de los tres, por lo que vale la pena comprobarlo .
Los científicos de datos son expertos completos en los tres roles anteriores.
Este rol está en la posición n.° 6 porque contratar al verdadero tres en uno es una opción costosa. Si puede contratar a uno dentro del presupuesto, es una gran idea, pero si tiene un presupuesto ajustado, considere mejorar sus habilidades y hacer crecer a sus especialistas existentes de un solo rol.
El gerente de análisis es la gallina de los huevos de oro: es un híbrido entre el científico de datos y el tomador de decisiones. Su presencia en el equipo actúa como un multiplicador de fuerza, lo que garantiza que su equipo de ciencia de datos no se quede atrás en lugar de agregar valor a su negocio.
El híbrido tomador de decisiones + científico de datos es un multiplicador de fuerza. Desafortunadamente, son raros y difíciles de contratar.
Esta persona se mantiene despierta por la noche con preguntas como: “ ¿Cómo diseñamos las preguntas correctas? ¿Cómo tomamos decisiones? ¿Cómo asignamos mejor a nuestros expertos? ¿Qué vale la pena hacer? ¿Las habilidades y los datos coincidirán con los requisitos? ¿Cómo aseguramos buenos datos de entrada? ”
Si tienes la suerte de contratar uno de estos, aférrate a ellos y nunca los dejes ir. Obtenga más información sobre este rol aquí .
A veces, quien toma las decisiones es un líder brillante, gerente, motivador, influenciador o navegante de la política organizacional... pero sin experiencia en el arte y la ciencia de la toma de decisiones. La toma de decisiones es mucho más que un talento. Si la persona que toma las decisiones no ha perfeccionado su oficio, es posible que haga más daño que bien.
En lugar de despedir a un tomador de decisiones no calificado, puede complementarlos con un experto cualitativo.
No despida a un tomador de decisiones no calificado, auméntelo. Puede contratarles una actualización en forma de ayudante. El experto cualitativo está aquí para complementar sus habilidades.
Esta persona generalmente tiene experiencia en ciencias sociales y datos: los economistas del comportamiento , los neuroeconomistas y los psicólogos JDM reciben la capacitación más especializada, pero los autodidactas también pueden ser buenos en eso. El trabajo es ayudar al tomador de decisiones a aclarar ideas, examinar todos los ángulos y convertir intuiciones ambiguas en instrucciones bien pensadas en un lenguaje que facilite la ejecución del resto del equipo.
No nos damos cuenta de lo valiosos que son los científicos sociales. Por lo general, están mejor equipados que los científicos de datos para traducir las intuiciones e intenciones de un tomador de decisiones en métricas concretas.
El experto cualitativo no toma ninguna de las decisiones. En cambio, se aseguran de que el tomador de decisiones haya captado completamente los tiros disponibles para igualar. También son un asesor de confianza, un compañero de intercambio de ideas y una caja de resonancia para quien toma las decisiones. Tenerlos a bordo es una excelente manera de garantizar que el proyecto comience en la dirección correcta.
Muchos gerentes de contratación piensan que su primer miembro del equipo debe ser el exprofesor, pero en realidad no necesita a esos doctores a menos que ya sepa que la industria no le proporcionará los algoritmos que necesita. La mayoría de los equipos no lo sabrán de antemano, por lo que tiene más sentido hacer las cosas en el orden correcto: antes de construir ese bolígrafo espacial , primero verifique si un lápiz hará el trabajo. Comience primero y si encuentra que las soluciones estándar disponibles no le están dando mucho amor, entonces debería considerar contratar investigadores.
Si un investigador es su primera contratación, probablemente no tendrá el entorno adecuado para hacer un buen uso de él.
No los traiga de buenas a primeras. Es mejor esperar hasta que su equipo esté lo suficientemente desarrollado como para haber descubierto para qué necesitan un investigador. Espere hasta que haya agotado todas las herramientas disponibles antes de contratar a alguien para que le construya herramientas nuevas y costosas.
Antes de inventar bolígrafos que funcionen en el espacio, compruebe que las soluciones existentes aún no satisfacen sus necesidades.
Además de los roles que vimos, estas son algunas de mis personas favoritas para dar la bienvenida a un proyecto de inteligencia de decisiones :
Muchos proyectos no pueden prescindir de ellos; la única razón por la que no aparecen en mi lista de los 10 principales es que la inteligencia de decisiones no es su negocio principal. En cambio, son genios en su propia disciplina y han aprendido lo suficiente sobre datos y toma de decisiones para ser notablemente útiles para su proyecto. Piense en ellos como si tuvieran su propia especialización o especialización, pero suficiente amor por la inteligencia de decisión como para optar por especializarse en ella.
Después de leer todo eso, es posible que te sientas abrumado. ¡Tantos papeles! Tomar una respiración profunda. Dependiendo de sus necesidades, puede obtener suficiente valor de los primeros roles.
Volviendo a mi analogía del aprendizaje automático aplicado como innovación en la cocina , si personalmente desea abrir una pizzería a escala industrial que haga pizzas innovadoras, necesita un gran equipo o necesita asociarse con proveedores/consultores. Si quieres hacer una o dos pizzas únicas este fin de semana, ¿alguien quiere una sorpresa de anchoas caramelizadas? — entonces aún debe pensar en todos los componentes que mencionamos. Vas a decidir qué hacer ( función 1 ), qué ingredientes usar ( funciones 2 y 3 ), dónde obtener los ingredientes ( función 0 ), cómo personalizar la receta ( función 5 ) y cómo darle un Prueba de sabor ( función 4 ) antes de servir a alguien a quien quieras impresionar, pero para la versión informal con menos en juego, puedes hacerlo todo por tu cuenta. Y si su objetivo es solo hacer pizza tradicional estándar, ni siquiera necesita todo eso: ¡consiga la receta probada de otra persona (no es necesario que reinvente la suya propia) junto con los ingredientes y comience a cocinar!