Katta hajmdagi blokbasterlar qanday yasalishini bilasizmi? Jarayon diqqat bilan tanlangan joylar, professional uskunalar, aktyorlar, operatorlar, yoritish bo'yicha mutaxassislar va har bir sahnani aniq qayta yaratish uchun butun ekipajni o'z ichiga oladi. AI dunyosida ma'lumotlarni yaratish xuddi shunday ishlaydi. U ushbu kinematik jarayonni aks ettiradi, lekin tomoshabinlarni qiziqarli qilish o'rniga, maqsad algoritmlarni samarali o'rganish uchun zarur bo'lgan "ramkalarni" ishlab chiqarishdir.
Cognilytica ma'lumotlariga ko'ra, sun'iy intellektni rivojlantirishning 80 foizi haqiqiy o'qitish emas, balki ma'lumotlarni tayyorlash - yaratish, to'plash, izohlash va qayta ishlash bilan bog'liq. Ushbu bosqichlardan birida, real dunyo ma'lumotlari etarli bo'lmaganda, ma'lumotlar yaratish boshlanadi. "Sahna" qanchalik real va rang-barang bo'lsa, AI shunchalik aqlli bo'ladi.
Keymakrning Loyiha boshqaruvi boshlig'i Dennis Sorokin Ma'lumotlarni yaratishning ahamiyati, jarayoni, muammolari va real hayotda qo'llanilishi haqida tushunchalar bilan o'rtoqlashadi.
Ma'lumotlarni yaratish - bu muayyan loyiha ehtiyojlariga moslashtirilgan maxsus tasvir va video ma'lumotlar to'plamini yaratish jarayoni. Ushbu ma'lumotlar to'plami haqiqiy dunyo stsenariylarini to'g'ri aks ettirishi kerak. Ma'lumotlarni yaratish, ayniqsa, avtomobilsozlik, tibbiyot, xavfsizlik tizimlari, sport va chakana savdoda ma'lumotlar sifati va hajmiga talab ortib borayotgani sababli tobora ommalashib bormoqda. Kompaniyalar model aniqligi va ishlashini yaxshilash uchun ma'lumotlar yaratishga sarmoya kiritadilar.
Ma'lumotlarni yaratish odatda haqiqiy ma'lumotlar mavjud bo'lmaganda yoki etarli bo'lmaganda qo'llaniladi. Bu jarayon quyidagilarni o'z ichiga olishi mumkin:
Mavjud ma'lumotlar to'plamini ko'paytirish: shartlarni o'zgartirish, ob'ektlarni qo'shish yoki o'zgaruvchanlikni oshirish. Kompaniyalar mavjud ma'lumotlar to'plamlarini sotib olishlari va ularga ixtisoslashgan kompaniyalar tomonidan izoh berishlari mumkin.
Sintetik ma'lumotlarni yaratish: Modelni o'qitish uchun tasvirlar, matnlar yoki videolar yaratish uchun dasturiy vositalardan foydalanish. Masalan, dasturiy ta'minot berilgan stsenariy asosida tasvir yoki video yaratishi mumkin. Biroq, sintetik ma'lumotlarning cheklovlari mavjud: ular oldindan belgilangan parametrlar asosida ishlab chiqariladi va haqiqiy ma'lumotlarning tabiiy o'zgaruvchanligi yo'q. Dennis Sorokin tushuntirganidek, "Haqiqiy vazifalarda, ayniqsa 99% dan yuqori aniqlik talab qilinganda, sintetik ma'lumotlar kerakli sifatni ta'minlamaydi. Hatto 0,1% xatolik darajasiga ega tizim aeroportdagi yuzlab odamlarni noto'g'ri aniqlashi yoki yo'lda xavfli vaziyatlarni keltirib chiqarishi mumkin. Shuning uchun maxsus stsenariylar juda muhim ".
Edge Cases uchun ma'lumotlarni yaratish: Model ishonchliligi uchun noyob stsenariylarda tasvir va videolarni suratga olish. Murakkab vazifalar uchun haqiqiy ma'lumotlar muhim ahamiyatga ega. Misol uchun, modelni haydovchining hushidan ketish holatini aniqlashga o'rgatish uchun kamida 1000 ta video kerak bo'ladi, unda turli odamlar ushbu holatni taqlid qiladi. Ishtirokchilarga qanday qilib buni ko'rsatmasdan turib, "hushini yo'qotgandek ko'rsatish" kabi oddiy ko'rsatmalar beriladi. Bir kishi boshini cho'ktirishi mumkin, boshqasi ko'zlarini yumadi va boshqasi yon tomonga egilishi mumkin. Ushbu tabiiy o'zgaruvchanlik haqiqiy ma'lumotlarni nihoyatda qimmatli qiladi va modelni o'qitishning aniqligini sezilarli darajada yaxshilaydi.
Keymakr portfeli turli loyihalar uchun ko'plab suratga olishlarni o'z ichiga oladi, ularning har biri o'ziga xos talablarga ega - uskunalar va kameralardan tortib aktyorlar va Evropa, Amerika va Kanadadagi joylargacha. “Loyihaning barcha nuanslarini tushunish noyob yechimlarni taqdim etish uchun zarur. Bu jarayon haqiqatan ham Gollivud filmining rejissyorligiga o'xshaydi va juda jozibali. Har qanday stsenariy axloqiy, axloqiy va huquqiy me'yorlarga to'g'ri kelsa, uni hal qilish mumkin, - deydi Sorokin.
Idishdagi loyihalar
Bunga misol qilib, haydovchilarni chalg'itadigan narsalarni aniqlashga qaratilgan loyihalarni keltirish mumkin. Keymakr keng tarqalgan chalg'ituvchi xatti-harakatlarni taqlid qilish uchun bir qator stsenariylarni ishlab chiqdi, masalan:
Ushbu stsenariylar o'nlab ishtirokchilar bilan boshqariladigan sharoitlarda modellashtirilgan. Bitta loyiha uchun 1-5 daqiqalik 5000 dan ortiq qisqa videolar ishtirokchilarni turli chalg'ituvchi harakatlarni amalga oshirayotgani tasvirlangan. Bu tizimga xatti-harakatlar modellarini tanib olish va noodatiy vaziyatlarga mos ravishda javob berish imkonini berdi.
Qurolli hujumni tan olish
Ma'lumotlar yaratish ko'pincha ofis xavfsizligiga yo'naltirilgan AI modellari uchun ishlatiladi. Yaqinda bir loyiha simulyatsiya stsenariylarini o'z ichiga oladi:
Modelni o'rgatish uchun tajovuzkor xatti-harakatlar, guruh harakatlari va ob'ektlarga ishlov berishning turli kombinatsiyalarini aks ettiruvchi 3000 dan ortiq video kerak edi.
Xavfsizlik loyihalari
Keymakr chegarachilarni almashtirish uchun mo'ljallangan aeroport xavfsizlik kameralari loyihalari ustida ishlagan. Kameralar quyidagilar uchun kerak:
Loyiha talab qilinadi:
Muhim jihat 50 yoshdan oshgan afro-amerikaliklar yoki janubiy osiyolik shaxslar kabi o'ziga xos demografik ma'lumotlarni to'plash edi. Bunday ma'lumotlar ommaga ochiq emas, bu esa maxsus ma'lumotlarni yaratish zarurligini ta'kidlaydi.
Keymakr, shuningdek, tibbiy loyihalar va virtual fitnes instruktor tizimlari uchun ma'lumotlarni yaratadi. Ikkinchisi hali ham paydo bo'layotgan bo'lsa-da, talab ortib bormoqda, ayniqsa masofaviy mashqlar va reabilitatsiya kuchayishi bilan.
Xbox Kinect singari, bu tizimlar real vaqtda foydalanuvchi harakatlarini kuzatish uchun sensorlardan foydalanadi. Zamonaviy texnologiyalar nafaqat harakatni kuzatish, balki mashqlar bajarilishini batafsil tahlil qilish imkonini beradi. Reabilitatsiya qilish uchun aniq harakatlar, masalan, ma'lum bir burchak ostida yelkaga barmoq uchiga etib borish juda muhimdir. Tizim fikr-mulohazalarni taqdim etadi, holatni tuzatadi, xatolarni ta'kidlaydi va tuzatishlarni taklif qiladi.
Bitta loyiha uchun Keymak oʻquv mashgʻulotlarini, jumladan oʻpka, sakrash va oyoq koʻtarish kabi mashqlarni suratga oldi. 60 ga yaqin ishtirokchilar har biri 15 daqiqadan mashqlarni bajardilar, bunda aniq harakat izohi uchun ma'lumotlarni to'plash uchun uzluksiz yozib olishdi. Asirlar takrorlanuvchi, yuqori intensiv harakatlar tufayli hatto yosh ishtirokchilar uchun ham jismonan talabchan edi.
Tibbiy tadqiqotlar: o'quvchilarning yorug'likka reaktsiyasi
Biometrik kompaniya loyihasi uchun Keymakr durbinga o'xshash maxsus jihozlar yordamida o'quvchilarning yorug'lik stimullariga reaktsiyalari haqida ma'lumot oldi. Maqsad o'quvchilarning yorug'lik sharoitlariga javob berish vaqtlarini tahlil qilish edi.
200 ga yaqin ishtirokchi qatnashdi. Jarayon xavfsizligini ta'minlash uchun ularga batafsil ma'lumot berildi.
Tajriba quyidagilarni o'z ichiga oldi:
Sifatli ma'lumotlarni yaratish - puxta rejalashtirish, to'plash, qayta ishlash va etkazib berishni o'z ichiga olgan ko'p bosqichli jarayon. Vazifaga qarab, bu jarayon sezilarli darajada farq qilishi mumkin.
Asosiy bosqichlarga quyidagilar kiradi:
Tibbiy tadqiqotlar maxsus sensorlardan foydalanadi
Harakat tahlili ko'p kamerali sozlamalarni qo'llaydi
Avtomobil ichidagi kameralar haydovchi/yo‘lovchining xatti-harakatlarini suratga oladi
Rasmga tushirishdan oldin jihozlar tekshiriladi, stsenariylar sinovdan o'tkaziladi va ishtirokchilar bilan tanishtiriladi. Haqiqiy operatsiyalarni taqlid qiladigan sharoitlarda ma'lumotlarni yaratishga alohida e'tibor beriladi. Misol uchun, haydovchilarning charchoqlarini tahlil qilish loyihalarida uzoq safarlar shartlari simulyatsiya qilinadi, harakat kasalligini o'rganishda esa yo'lovchilar holatining o'zgarishi turli harakat sharoitlarida qayd etiladi.
Annotatsiya uchun qo'lda usullar ham, avtomatlashtirilgan vositalar ham qo'llaniladi. Ba'zida mijozlar tibbiy tadqiqotlarda mikro-ko'z harakatlarini kuzatish yoki yuzlab haydovchi xatti-harakatlari parametrlarini tahlil qilish kabi aniq tafsilotlarni talab qiladi.
Ma'lumotlarni saqlash va uzatish bilan bog'liq masalalar ham ko'rib chiqiladi. Misol uchun, bir necha soatlik suratga olishdan olingan 4K videoning hajmi bir necha terabaytga yetishi mumkin, bu esa maxsus serverlar yoki bulutli yechimlarni talab qiladi.
Ma'lumotlar yaratishni ta'minlashda nafaqat texnik cheklovlarni, balki ma'lumotlar bilan ishlashning huquqiy va axloqiy jihatlarini ham hisobga olish kerak.
"Har bir tafsilot muhim ahamiyatga ega boʻlgan maʼlumotlar olamida faqat maʼlumotlarni yaratishning oʻzi yetarli emas; uning aniqligi, xilma-xilligi va axloqiy meʼyorlarga muvofiqligini taʼminlash juda muhim. Busiz butun jarayon oʻz qiymatini yoʻqotadi va haqiqatni buzish xavfi tugʻiladi”, - deydi Dennis Sorokin.
Loyihaga qarab, ishtirokchilar turli yosh guruhlari, jinslar, millatlar va terining rangidan kelishi kerak bo'lishi mumkin. Ba'zi hollarda, o'ziga xos xususiyatlarga ega bo'lgan ishtirokchilar talab qilinadi - masalan, hissiyotlarni tahlil qilish uchun turli xil yuz ifodalari bilan tibbiy tadqiqotlar uchun keksa odamlar yoki biometrik tizimlar uchun ma'lum fiziologik xususiyatlarga ega bo'lgan shaxslar.
Turli mintaqalarda munosib ishtirokchilarni topish qiyin bo'lishi mumkin. Ba'zan, turli hamjamiyat a'zolari bilan chinakam xilma-xil ma'lumotlar to'plamini yaratish uchun kerakli miqdordagi ishtirokchilarni ta'minlash uchun "kasting" jarayoni haftalar yoki hatto oylarni olishi mumkin.
Yuqori sifatli videoni suratga olish katta hajmdagi saqlash va ma'lumotlarni uzatish resurslarini talab qiladi. Misol uchun, bir soat davomida 4K videoni yozib olish bir necha o'nlab gigabaytni egallashi mumkin. Infraqizil, termal va boshqalar kabi maxsus kameralar ko'proq ma'lumot ishlab chiqarishi mumkin. Agar loyihada bir nechta kameralar ishlatilsa, umumiy ma'lumotlar hajmi bir necha terabaytgacha oshishi mumkin. Ish jarayonini tashkil qilish kuchli jihozlar va puxta rejalashtirilgan logistikani talab qiladi, ma'lumotlarni samarali uzatishdan tortib izohlash va mijozlarga yetkazib berishgacha.
Ma'lumotlarni yaratish, ayniqsa, odamlar tasvirlari, biometrik ma'lumotlar yoki jamoat joylaridagi harakatlarni o'z ichiga olgan ma'lumotlarni to'plashni o'z ichiga olgan holda, bir qator axloqiy va huquqiy muammolarni keltirib chiqaradi. Axloqiy nuqtai nazardan, suratga olishning barcha ishtirokchilari kerakli hujjatlarni imzolash orqali o'z ma'lumotlaridan foydalanishga rozilik berishlari kerak. Maxfiylik ham hal qiluvchi rol o'ynaydi; mijoz talab qilmasa, odamlarni aniqlab bo'lmasligini ta'minlash va ma'lumotlarni himoya qilish standartlariga rioya qilish kerak. Yana bir dolzarb masala - ma'lumotlar manipulyatsiyasi - sun'iy modellashtirish yoki sahnalashtirilgan sahnalar axborotni buzish va algoritmik noto'g'rilikni oldini olish uchun haqiqatni yaqindan aks ettirishi kerak.
Huquqiy nuqtai nazardan, asosiy muammo shaxsiy ma'lumotlarni himoya qilishdir. Evropadagi GDPR va AQShdagi CCPA kabi qoidalar ma'lumotlarni yig'ish va qayta ishlash bo'yicha qat'iy ko'rsatmalarni, shu jumladan ishtirokchilarning o'z ma'lumotlarini o'chirishni talab qilish huquqlarini belgilaydi. To'plangan ma'lumotlardan tijorat maqsadlarida foydalanish bo'yicha ham cheklovlar mavjud: bitta loyiha uchun to'plangan ma'lumotlar har doim ham ishtirokchilarning roziligisiz qayta sotilmaydi yoki boshqa tadqiqotlarda foydalanilmaydi. Bundan tashqari, ommaviy suratga olish haqidagi qonunlar mamlakatdan mamlakatga farq qiladi - ba'zi joylarda odamlarni ularning roziligisiz suratga olishga ruxsat beriladi. Aksincha, boshqalar maxsus ruxsatlarni talab qiladi, ayniqsa ma'lumotlar tijorat yoki tadqiqot maqsadlarida foydalanilganda. Axloqiy me'yorlar va qonuniy talablarga rioya qilish ma'lumotlar bilan ishlashning asosiy jihati bo'lib, xavflarni kamaytirishga yordam beradi va ma'lumotlardan to'g'ri va xavfsiz foydalanishni ta'minlaydi.
Dennis Sorokinning fikricha, ma'lumotlarni yaratish juda talab qilinadigan soha bo'lib qolmoqda, xususan, jamoat mulkida topib bo'lmaydigan maxsus video materiallarni talab qiladigan loyihalarda. “Siz sun’iy intellektni keyingi avlod transporti uchun o‘rgatasizmi, do‘konlarda iste’molchilarning xatti-harakatlarini tahlil qilasizmi yoki tibbiy tadqiqotlar chegaralarini oshirasizmi, asosiysi moslashuvchan, aniq va mijozlar kerak bo‘lgan narsaga mos bo‘lishdir”, deydi u. Qiyinchiliklarga qaramay, bu soha rivojlanishda davom etmoqda, turli sohalarda ilovalarni topmoqda va ortib borayotgan e'tibor va talabni qozonmoqda.