ওপেনএআই সোরার সাথে জেনারেটিভ এআইকে নতুন উচ্চতায় নিয়ে গেছে, এর নতুন টেক্সট-টু-ভিডিও মডেল যা লিখিত নির্দেশ থেকে বাস্তবসম্মত দৃশ্য তৈরি করতে পারে। যদিও DALL-E এবং অন্যান্য টেক্সট-টু-ইমেজ মডেলগুলি আমাদের AI জেনারেশনের শক্তি দেখিয়েছে, সোরা দেখায় যে আমরা গতির উপাদান যোগ করে কতদূর এসেছি।
আমরা সোরা মডেলটি লাইভ হয়ে গেলে পরীক্ষা করব এবং এমনকি আমাদের সাপ্তাহিক নিউজলেটারে একটি বিনামূল্যের নির্দেশিকা প্রকাশ করব - 'AI Hunters' ! নতুন এআই গ্রাউন্ডব্রেকিং প্ল্যাটফর্ম এবং ইভেন্টগুলি মিস করবেন না!
এআই সৃজনশীলতার নতুন সীমানা
স্থির চিত্রের বাইরে, সোরা এক মিনিট পর্যন্ত দীর্ঘ ভিডিও তৈরি করতে পারে। এটি বিদ্যমান ভিডিওগুলিও নিতে পারে এবং সামগ্রী উন্নত করতে অনুপস্থিত ফ্রেমগুলি পূরণ করতে পারে৷ সৃষ্টির সম্ভাবনা অন্তহীন - আমরা ভবিষ্যতে এআই-জেনারেটেড শর্ট ফিল্ম, অ্যানিমেশন বা এমনকি উন্নত স্পোর্টস রিপ্লে দেখতে পাব।
কিন্তু সোরা সম্পর্কে যা সত্যিই চিত্তাকর্ষক তা হল ভৌত জগতের বোঝা। এটি একাধিক অক্ষর এবং গতির সাথে জড়িত জটিল দৃশ্যগুলি অনুকরণ করতে পারে। বাস্তবসম্মত পাতা কুচকে যাওয়া এবং গাছের মধ্য দিয়ে সূর্যালোক ফিল্টারিং সহ কাউকে বনের মধ্য দিয়ে হাঁটতে দেখতে চান? সোরা তোমাকে কভার করেছে।
হুডের নীচে, সোরা ডিফিউশন মডেল এবং ট্রান্সফরমারগুলিতে অতীতের কাজগুলিকে কাজে লাগায়৷ একটি ডিফিউশন মডেলের এলোমেলো পদক্ষেপগুলি ভিডিওর মতো উচ্চ-মাত্রিক ডেটা তৈরি করতে পারদর্শী। এদিকে, ট্রান্সফরমারগুলি প্রাকৃতিক ভাষার মতো ক্রমিক ডেটা প্রক্রিয়াকরণের কাজগুলি পরিচালনা করে।
অবশ্যই, এখনও কিছু সীমাবদ্ধতা আছে। গাড়ি দুর্ঘটনা বা ক্লিফ ডাইভের মতো জটিল পদার্থবিদ্যার অনুকরণ করা কঠিন প্রমাণিত হয়। মডেলটি কারণ এবং প্রভাব নিয়েও লড়াই করে - কেউ কামড় দেওয়ার পরে কুকি কামড় জাদুকরীভাবে প্রদর্শিত হবে বলে আশা করবেন না!
দায়িত্বশীল উন্নয়ন নিশ্চিত করা
স্বাভাবিকভাবেই, OpenAI নিরাপত্তার উপর দৃষ্টি নিবদ্ধ করে। সর্বজনীন প্রকাশের আগে, তারা ক্ষতিকারক বা বিভ্রান্তিকর বিষয়বস্তু ফিল্টার করার কৌশল উন্নত করছে। অগ্রগতির জন্য একটি সূক্ষ্ম ভারসাম্য প্রয়োজন - সোরাকে অবশ্যই অনুপযুক্ত কিছু এড়িয়ে বাস্তবসম্মতভাবে তৈরি করতে হবে।
আপাতত, সংস্থাটি নিম্নলিখিত সুরক্ষা ব্যবস্থাগুলি স্থাপন করেছে:
বিষয়বস্তু বিধিনিষেধ: ওপেনএআই সোরা-এর জন্য কঠোর বিষয়বস্তুর নির্দেশিকা প্রতিষ্ঠা করেছে, যা তার DALL-E 3 মডেলের মতোই। এই নির্দেশিকাগুলি হিংসাত্মক, যৌন বা ঘৃণ্য বিষয়বস্তু তৈরি করা নিষিদ্ধ করে, সেইসাথে প্রকৃত লোকেদের উপমা বা নামী শিল্পীদের শৈলীর প্রয়োগ নিষিদ্ধ করে৷
প্রোভেনেন্স মেটাডেটা এবং আইডেন্টিফিকেশন: স্বচ্ছতা এবং জবাবদিহিতাকে উন্নীত করার জন্য, ওপেনএআই সোরা দ্বারা তৈরি ভিডিওগুলির জন্য প্রোভেনেন্স মেটাডেটা প্রদান করার পরিকল্পনা করেছে। উপরন্তু, কোম্পানী দর্শকদের এআই মডেল দ্বারা তৈরি সামগ্রী সনাক্ত করতে সক্ষম করবে।
রেড টিমিং এবং সীমিত অ্যাক্সেস: ওপেনএআই গবেষক, ভিজ্যুয়াল শিল্পী এবং চলচ্চিত্র নির্মাতাদের একটি নির্বাচিত গোষ্ঠীকে সোরাতে অ্যাক্সেসের অনুমতি দিয়েছে যারা পণ্যটিকে "রেড টিম" করবে, কোম্পানির পরিষেবার শর্তাদি লঙ্ঘনের জন্য সংবেদনশীলতার জন্য এটি পরীক্ষা করবে। এই সীমিত অ্যাক্সেস ওপেনএআই-কে মডেলটিকে আরও ব্যাপকভাবে উপলব্ধ করার আগে প্রতিক্রিয়া সংগ্রহ করতে এবং সম্ভাব্য ঝুঁকিগুলি সনাক্ত করতে দেয়।
নীতিনির্ধারক এবং শিল্পীদের সাথে সম্পৃক্ততা: কোম্পানি উদ্বেগ বুঝতে এবং মডেলের ইতিবাচক ব্যবহারের ক্ষেত্রে চিহ্নিত করতে নীতিনির্ধারক, শিক্ষাবিদ এবং শিল্পীদের সাথে সক্রিয়ভাবে জড়িত। এই সক্রিয় পন্থা ওপেনএআই এর প্রযুক্তির বৃহত্তর সামাজিক প্রভাব মোকাবেলার প্রতিশ্রুতি প্রদর্শন করে।
AI-এর কালকে শেপিং
জেনারেটিভ এআই অগ্রগতির সাথে সাথে, সোরার মতো মডেলগুলিতে বিষয়বস্তু তৈরি এবং ব্যবহারে বিপ্লব ঘটানোর সম্ভাবনা রয়েছে। তারা ব্যক্তিগতকৃত বিষয়বস্তু তৈরি করতে পারে, আমাদের বিশ্বকে বুঝতে সাহায্য করতে পারে এবং বাস্তবসম্মত ভার্চুয়াল বিশ্বকে শক্তিশালী করতে পারে।
যাইহোক, এটি অত্যন্ত গুরুত্বপূর্ণ যে এই মডেলগুলি AI-উত্পন্ন সামগ্রীর ঝুঁকি বিবেচনা করে দায়িত্বশীলভাবে তৈরি করা হয়। সম্ভাব্য সমস্যাগুলি প্রশমিত করার সময় ওপেনএআই এর সুবিধাগুলি সর্বাধিক করার জন্য সোরার সাথে গুরুত্বপূর্ণ পদক্ষেপ নিচ্ছে৷
পিএস হ্যাকারনুন এ আমার আগের নিবন্ধগুলি দেখুন:
- DeFi কমিউনিটি বিল্ডিং: ক্রিপ্টো স্টার্টআপের জন্য একটি ধাপে ধাপে নির্দেশিকা
- দ্য বেস্ট অফ দ্য এআই ওয়ার্ল্ড: এই সপ্তাহে 5টি প্রজেক্ট এবং রিসার্চ পুশিং দ্যা প্যারাডাইম স্পটলাইটিং
- ক্রিপ্টোর পরবর্তী অধ্যায়: 2024 এর গেম-চেঞ্জিং ভবিষ্যদ্বাণী
- 2024 সালের সেরা 10টি এআই প্রবণতা: কীভাবে এআই সবকিছুকে রূপান্তরিত করে
- কীভাবে আপনার ব্যক্তিগত জিপিটি তৈরি করবেন: জিরো থেকে এআই হিরো পর্যন্ত
- GPT-4 Turbo: ChatGPT-এর আত্মপ্রকাশের পর থেকে সবচেয়ে স্মৃতিময় আপডেট!
- 'স্টেট অফ এআই 2023' থেকে প্রয়োজনীয় অন্তর্দৃষ্টি
- GPT-4V উন্মোচন: আবেগ সনাক্ত করা থেকে খাবার অর্ডার করা পর্যন্ত - আপনি বিশ্বাস করবেন না এটি আর কী করতে পারে!
- ChatGPT এখন কথা বলে, শোনে এবং বোঝে: আপনার যা জানা দরকার