Sabes como se fan os grandes éxitos de taquilla? O proceso inclúe localizacións coidadosamente seleccionadas, equipos profesionais, actores, operadores de cámara, especialistas en iluminación e todo un equipo para recrear cada escena con precisión. No mundo da IA, a creación de datos funciona do mesmo xeito. Reflicte este proceso cinematográfico, pero en lugar de entreter ao público, o obxectivo é producir os "cadros" necesarios para que os algoritmos aprendan de forma eficaz.
Segundo Cognilytica , o 80 % do desenvolvemento da IA non se refire á formación real senón á preparación de datos: creación, recollida, anotación e procesamento. Nunha destas etapas, cando os datos do mundo real son insuficientes, a creación de datos intervén. Canto máis realista e diversa sexa a "escena", máis intelixente se fai a IA.
O xefe de Xestión de Proxectos de Keymakr , Dennis Sorokin, comparte información sobre a importancia, o proceso, os desafíos e as aplicacións do mundo real da creación de datos.
A creación de datos é o proceso de xeración de conxuntos de datos de imaxe e vídeo personalizados adaptados ás necesidades específicas do proxecto. Estes conxuntos de datos deberían reflectir con precisión escenarios do mundo real. A creación de datos é cada vez máis popular debido á crecente demanda de calidade e volume de datos, especialmente en automoción, medicina, sistemas de seguridade, deportes e venda polo miúdo. As empresas invisten na creación de datos para mellorar a precisión e o rendemento dos modelos.
A creación de datos adoita utilizarse cando os datos do mundo real non están dispoñibles ou son insuficientes. Este proceso pode incluír:
Aumentar conxuntos de datos existentes: modificar condicións, engadir obxectos ou aumentar a variabilidade. As empresas poden comprar conxuntos de datos existentes e facer que as anoten empresas especializadas.
Xeración de datos sintéticos: Uso de ferramentas de software para crear imaxes, textos ou vídeos para a formación de modelos. Por exemplo, o software pode xerar imaxes ou vídeos en función dun escenario determinado. Non obstante, os datos sintéticos teñen limitacións: xéranse en función de parámetros predefinidos e carecen da variabilidade natural dos datos reais. Como explica Dennis Sorokin, "Nas tarefas do mundo real, especialmente cando se require unha precisión superior ao 99 %, os datos sintéticos non proporcionan a calidade necesaria. Un sistema cunha taxa de erro do 0,1 % pode identificar mal a centos de persoas nun aeroporto ou provocar situacións perigosas na estrada. Por iso os escenarios personalizados son cruciais".
Creación de datos para casos Edge: captura de imaxes e vídeos en escenarios únicos para a fiabilidade do modelo. Para tarefas complexas, os datos reais son esenciais. Por exemplo, para adestrar a un modelo para recoñecer a inconsciencia do condutor, son necesarios polo menos 1.000 vídeos con persoas diferentes que simulen esta condición. Os participantes reciben instrucións sinxelas como "finxir perder o coñecemento" sen especificar como. Unha persoa pode caer a cabeza, outra pode pechar os ollos e outra pode inclinarse de lado. Esta variabilidade natural fai que os datos reais sexan incriblemente valiosos, mellorando significativamente a precisión do adestramento do modelo.
A carteira de Keymakr inclúe numerosas rodaxes para proxectos diversos, cada un con requisitos únicos, desde equipos e cámaras ata actores e localizacións en Europa, América e Canadá. "Entender todos os matices do proxecto é esencial para ofrecer solucións únicas. Este proceso parécese realmente a dirixir unha película de Hollywood e é moi atractivo. Calquera escenario é solucionable sempre que se axuste aos estándares éticos, morais e legais ", di Sorokin.
Proxectos en cabina
Un exemplo son os proxectos centrados na detección de distraccións dos condutores. Keymakr desenvolveu unha serie de escenarios para simular comportamentos de distracción comúns, como:
Estes escenarios foron modelados en condicións controladas con decenas de participantes. Para un proxecto, máis de 5.000 vídeos curtos de 1 a 5 minutos captaron aos participantes realizando varias actividades que distraían. Isto permitiu ao sistema recoñecer patróns de comportamento e responder adecuadamente a situacións pouco habituais.
Recoñecemento de ataque armado
A creación de datos úsase a miúdo para modelos de IA centrados na seguridade da oficina. Un proxecto recente incluía escenarios que simulaban:
O adestramento do modelo requiriu máis de 3.000 vídeos que mostrasen varias combinacións de comportamento agresivo, movementos grupais e manexo de obxectos.
Proxectos de seguridade
Keymakr traballou en proxectos de cámaras de seguridade aeroportuarias deseñadas para substituír aos gardas de fronteiras. As cámaras precisaban:
O proxecto requiriu:
Un aspecto crítico foi a recollida de datos de datos demográficos específicos, como os afroamericanos maiores de 50 anos ou os individuos do sur de Asia. Estes datos de nicho non están dispoñibles publicamente, o que subliña a necesidade de crear datos personalizados.
Keymakr tamén crea datos para proxectos médicos e sistemas virtuais de instrutor de fitness. Aínda que este último aínda está emerxendo, a demanda crece, especialmente co aumento dos adestramentos remotos e da rehabilitación.
Do mesmo xeito que Xbox Kinect, estes sistemas usan sensores para rastrexar os movementos dos usuarios en tempo real. A tecnoloxía moderna permite non só o seguimento do movemento, senón tamén unha análise detallada da execución do exercicio. Para a rehabilitación, os movementos precisos son cruciais, como alcanzar a punta do dedo ata o ombreiro nun ángulo específico. O sistema proporciona comentarios, corrixe a postura, destaca erros e suxire axustes.
Para un proxecto, Keymak filmou amplamente sesións de adestramento, incluíndo exercicios como estocadas, saltos e levantamentos de pernas. Ao redor de 60 participantes realizaron exercicios de 15 minutos cada un, cunha gravación continua para recoller datos para anotar o movemento con precisión. As rodaxes foron fisicamente esixentes, mesmo para os participantes máis novos, debido ás actividades repetitivas e de alta intensidade.
Estudos médicos: reacción da pupila á luz
Para un proxecto da empresa de biometría, Keymakr capturou datos sobre as reaccións dos alumnos ante estímulos luminosos utilizando equipos especializados que se asemellan a prismáticos. O obxectivo era analizar os tempos de resposta dos alumnos ante as condicións de luz cambiantes.
Participaron uns 200 participantes. Foron informados a fondo para garantir a seguridade do procedemento.
O experimento implicou:
A creación de datos de calidade é un proceso de varios pasos que implica unha planificación, recollida, procesamento e entrega coidadosos. Dependendo da tarefa, este proceso pode variar significativamente.
As etapas clave inclúen:
A investigación médica utiliza sensores especializados
A análise de movemento emprega configuracións multicámara
As cámaras dos coches captan o comportamento do condutor/pasaxeiro
Antes da rodaxe, compróbase o equipamento, probóanse os escenarios e infórmase aos participantes. Préstase especial atención á creación de datos en condicións que imiten de preto as operacións do mundo real. Por exemplo, nos proxectos de análise de fatiga do condutor, simuláronse as condicións de viaxes longas, mentres que nos estudos de mareos rexístranse os cambios de estado dos pasaxeiros en diferentes condicións de movemento.
Para a anotación utilízanse tanto métodos manuais como ferramentas automatizadas. Ás veces, os clientes requiren detalles específicos, como o seguimento dos movementos dos micro-ollos na investigación médica ou a análise de centos de parámetros de comportamento do condutor.
Tamén se consideran cuestións relacionadas co almacenamento e transferencia de datos. Por exemplo, o volume de vídeo 4K de varias horas de rodaxe pode alcanzar varios terabytes, o que require servidores especiais ou solucións na nube.
Ao proporcionar a creación de datos, é esencial ter en conta non só as limitacións técnicas, senón tamén os aspectos legais e éticos do traballo con datos.
"No mundo dos datos, onde cada detalle importa, non abonda con só crear datos; é fundamental garantir a súa precisión, diversidade e o cumprimento dos estándares éticos. Sen isto, todo o proceso perde o seu valor e corre o risco de distorsionar a realidade", afirma Dennis Sorokin.
Segundo o proxecto, os participantes poden ter que vir de diferentes grupos de idade, xéneros, nacionalidades e tons de pel. Nalgúns casos, son necesarios participantes con características específicas, como persoas maiores para estudos médicos con diversas expresións faciais para análise de emocións ou individuos con trazos fisiolóxicos particulares para sistemas biométricos.
Atopar participantes axeitados en diferentes rexións pode ser un reto. Ás veces, o proceso de "casting" pode levar semanas ou incluso meses para garantir a cantidade correcta de participantes para crear conxuntos de datos verdadeiramente variados con diferentes membros da comunidade.
A captura de vídeo de alta calidade require importantes recursos de almacenamento e transferencia de datos. Por exemplo, gravar vídeo 4K durante unha hora pode ocupar varias decenas de gigabytes. As cámaras especiais como infravermellos, térmicas, etc., poden producir aínda máis datos. Se se usan varias cámaras no proxecto, o volume total de datos pode aumentar a varios terabytes. A organización do fluxo de traballo require un equipo potente e unha loxística coidadosamente planificada, desde a transferencia eficiente de datos ata a anotación e entrega aos clientes.
A creación de datos suscita varias preocupacións éticas e legais, especialmente cando se trata de recoller información que contén imaxes de persoas, datos biométricos ou accións en lugares públicos. Desde unha perspectiva ética, todos os participantes na rodaxe deberán prestar o seu consentimento informado para que os seus datos sexan utilizados mediante a sinatura dos documentos necesarios. A confidencialidade tamén xoga un papel fundamental; é necesario garantir que as persoas non poidan ser identificadas cando o cliente non o requira e cumprir as normas de protección de datos. Outro problema urxente é a manipulación de datos: o modelado artificial ou as escenas escenificadas deben reflectir de preto a realidade para evitar a distorsión da información e o sesgo algorítmico.
Desde o punto de vista legal, o principal desafío reside na protección dos datos persoais. Normas como o GDPR en Europa e a CCPA nos EUA establecen pautas estritas para a recollida e procesamento de datos, incluídos os dereitos dos participantes a solicitar a eliminación dos seus datos. Tamén hai restricións para o uso dos datos recollidos con fins comerciais: a información recollida para un proxecto non sempre pode ser revendida ou usada noutras investigacións sen o consentimento dos participantes. Ademais, as leis sobre as filmacións públicas difiren dun país a outro: algúns lugares permiten filmar persoas sen o seu consentimento. En cambio, outros requiren permisos específicos, especialmente cando os datos se utilizan con fins comerciais ou de investigación. O cumprimento dos estándares éticos e dos requisitos legais é un aspecto clave do manexo de datos, que axuda a mitigar os riscos e garante que a información se utiliza de forma axeitada e segura.
Dennis Sorokin cre que a creación de datos segue sendo un campo moi demandado, especialmente nos proxectos que requiren materiais de vídeo específicos que non se atopan no dominio público. "Se estás adestrando AI para o transporte de nova xeración, analizando o comportamento dos consumidores nas tendas ou superando os límites da investigación médica, a clave é manterte flexible, preciso e aliñado co que necesitan os clientes", di. A pesar dos retos, este campo segue evolucionando, atopando aplicacións en varias industrias e gañando cada vez máis atención e demanda.