প্রশিক্ষণ এবং গভীর শিক্ষার মডেল তৈরির জন্য দুটি সর্বাধিক ব্যবহৃত ওপেন-সোর্স মেশিন লার্নিং ফ্রেমওয়ার্ক হল TensorFlow এবং PyTorch।
এই ফ্রেমওয়ার্কগুলির বিল্ডিং এবং প্রশিক্ষণের মডেলগুলির ক্ষেত্রে তাদের পদ্ধতির অনন্য পার্থক্য রয়েছে। যদিও টেনসরফ্লো একটি স্ট্যাটিক গ্রাফ এবং ঘোষণামূলক প্রোগ্রামিং ব্যবহার করে, যা আরও ভাল অপ্টিমাইজেশনের সুযোগ প্রদান করে এবং বিতরণ করা প্রশিক্ষণের অনুমতি দেয়, পাইটর্চ একটি গতিশীল গণনামূলক গ্রাফ এবং অপরিহার্য প্রোগ্রামিং ব্যবহার করে, যা আরও নমনীয় এবং সহজ ডিবাগিং প্রক্রিয়ার জন্য অনুমতি দেয়। ফ্রেমওয়ার্কের পছন্দ ব্যবহারকারীর নির্দিষ্ট চাহিদা এবং পছন্দের উপর নির্ভর করে।
এই নিবন্ধটি আজ উপলব্ধ ডিপ লার্নিং মডেল তৈরির জন্য সেরা PyTorch ডেটাসেটগুলি দেখে।
পেন ট্রিব্যাঙ্ক হল টীকাযুক্ত ইংরেজি পাঠ্যের একটি সংগ্রহ, যা প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) গবেষণা সম্প্রদায়ে ব্যাপকভাবে অধ্যয়ন করা হয়। এতে ম্যাগাজিন, সংবাদ নিবন্ধ এবং কাল্পনিক গল্পের মতো বিভিন্ন ঘরানার পাঠ্যের 4.5 মিলিয়নেরও বেশি শব্দ রয়েছে। ডেটাসেটে নামের এনটাইটেল, স্পিচ ট্যাগ এবং সিনট্যাকটিক স্ট্রাকচারের অংশ সম্পর্কে ম্যানুয়ালি টীকা করা তথ্য রয়েছে, ভাষা মডেল, পার্সার এবং মেশিন অনুবাদ সিস্টেম সহ NLP মডেলের বিস্তৃত পরিসরকে প্রশিক্ষণ ও মূল্যায়ন করতে ব্যবহৃত হয়।
এই ডেটাসেট ডাউনলোড করতে, ক্লিক করুন
স্কোয়াড (স্ট্যানফোর্ড প্রশ্ন উত্তরকারী ডেটাসেট) হল প্রাকৃতিক ভাষা প্রক্রিয়াকরণের (NLP) একটি জনপ্রিয় বেঞ্চমার্ক ডেটাসেট যা উইকিপিডিয়া নিবন্ধগুলির একটি সেট থেকে নেওয়া 100,000-এরও বেশি প্রশ্ন-উত্তর জোড়া নিয়ে গঠিত। এটি PyTorch বা অন্যান্য গভীর শিক্ষার কাঠামো ব্যবহার করে নির্মিত বিভিন্ন NLP মডেলের কর্মক্ষমতা মূল্যায়ন করতে ব্যবহৃত হয়। উত্তর স্প্যানগুলির গড় দৈর্ঘ্য 3.6 শব্দ, এবং সংশ্লিষ্ট প্যাসেজে গড়ে 11.0 শব্দ রয়েছে।
এখানে স্কোয়াড সম্পর্কে কিছু অতিরিক্ত বিবরণ রয়েছে:
ডেটাসেটের লক্ষ্য হল একটি প্রদত্ত পাঠ্য উত্তরণ সম্পর্কে প্রশ্নের উত্তর দেওয়ার জন্য মেশিন লার্নিং মডেলগুলির জন্য একটি চ্যালেঞ্জিং কাজ প্রদান করা। ডাউনলোড করতে এখানে ক্লিক করুন
এই PyTorch ডেটাসেট হল বুকের গণনা করা টমোগ্রাফি চিত্রগুলির একটি পাবলিক ডেটাসেট যা একাধিক রেডিওলজিস্ট দ্বারা ফুসফুসের নডিউলগুলির জন্য টীকা করা হয়েছে৷ এটি বিভিন্ন প্রতিষ্ঠান থেকে সংগৃহীত 1,018টি সিটি স্ক্যান নিয়ে গঠিত এবং এতে 23,000টিরও বেশি টীকাযুক্ত নডিউল রয়েছে।
ডেটাসেটের প্রতিটি স্ক্যানের সাথে চারজন অভিজ্ঞ রেডিওলজিস্টের টীকা থাকে যা আকৃতি, আকার, নডিউলের অবস্থান এবং টেক্সচার সম্পর্কিত তথ্য প্রদান করে। ফুসফুসের ক্যান্সারের স্ক্রীনিং এবং নির্ণয়ের জন্য কম্পিউটার-এইডেড ডায়াগনসিস (CAD) সিস্টেমের উন্নয়নে গবেষণাকে সমর্থন করার জন্য ডেটাসেট তৈরি করা হয়েছিল।
দ্রষ্টব্য: ডেটাসেটটি সর্বজনীনভাবে উপলব্ধ তবে নির্দিষ্ট বিধিনিষেধ এবং ব্যবহারের জন্য প্রয়োজনীয়তা সাপেক্ষে৷
ক্লিক
PyTorch Fashion MNIST ডেটাসেট মূল MNIST ডেটাসেটের প্রতিস্থাপন হিসাবে Zalando রিসার্চ দ্বারা তৈরি করা হয়েছিল এবং এটি একটি PyTorch-সামঞ্জস্যপূর্ণ ফর্ম্যাটে উপলব্ধ। PyTorch Fashion MNIST ডেটাসেটে 60,000 প্রশিক্ষণের ছবি এবং 10,000 পরীক্ষার ছবি সহ পোশাকের আইটেমগুলির 70,000টি গ্রেস্কেল চিত্র রয়েছে।
চিত্রগুলি 28x28 পিক্সেল আকারের এবং টি-শার্ট/টপস, ট্রাউজার, পুলওভার, ড্রেস, কোট, স্যান্ডেল, শার্ট, স্নিকার, ব্যাগ এবং গোড়ালি বুট সহ 10টি বিভিন্ন শ্রেণীর পোশাকের আইটেমগুলিকে উপস্থাপন করে৷ এটি মূল MNIST ডেটাসেটের অনুরূপ, তবে পোশাকের আইটেমগুলির বৃহত্তর জটিলতা এবং বৈচিত্র্যের কারণে আরও চ্যালেঞ্জিং শ্রেণীবিভাগের কাজ রয়েছে৷
ডেটাসেট ডাউনলোড করা যাবে
Yelp পর্যালোচনা ডেটাসেট হল মার্কিন যুক্তরাষ্ট্রের 11টি মেট্রোপলিটন এলাকা থেকে স্থানীয় ব্যবসার 5 মিলিয়নেরও বেশি পর্যালোচনার একটি বিস্তৃত সংগ্রহ। ডেটাসেটের প্রতিটি পর্যালোচনাতে তারকা রেটিং, ব্যবসার বিভাগ, পর্যালোচনা পাঠ্য, তারিখ এবং অবস্থানের মতো তথ্য থাকে। এটি PyTorch এর সাথে গভীর শিক্ষার মডেল তৈরি করতে আগ্রহী একটি মূল্যবান সম্পদ।
অনুগ্রহ করে সাইন আপ করুন এবং ডেটাসেট ডাউনলোড করতে এখানে ক্লিক করুন।
এই PyTorch ডেটাসেটে 120টি বিভিন্ন প্রজাতির কুকুরের 20,580টি উচ্চ-মানের চিত্রের একটি সংগ্রহ রয়েছে, প্রতিটি ছবিতে কুকুরের জাত সম্পর্কে তথ্য সহ লেবেলযুক্ত। এটি ইমেজ শ্রেণীবিভাগ এবং বস্তুর স্বীকৃতির জন্য ব্যবহার করা যেতে পারে। JPEG ফরম্যাটে প্রদত্ত ডেটাসেট এবং একটি টেক্সট ফাইলে টীকা দিয়ে, ছবিগুলি 224x224 পিক্সেল আকারের। ডেটাসেটের জাতগুলি সাধারণ জাত যেমন গোল্ডেন রিট্রিভারস এবং ল্যাব্রাডর থেকে শুরু করে অটারহাউন্ড এবং সাসেক্স স্প্যানিয়েলের মতো আরও অস্পষ্ট জাত পর্যন্ত।
আপনি ডাউনলোড করতে পারেন
যদিও প্রতি বিভাগে সীমিত সংখ্যক চিত্র একটি চ্যালেঞ্জ হতে পারে, বিস্তারিত টীকাগুলি পাইটর্চ ক্যালটেক 101 ডেটাসেটকে গভীর শিক্ষার মডেলগুলি মূল্যায়নের জন্য একটি মূল্যবান সংস্থান করে তোলে। ডেটাসেট হল একটি লেবেলযুক্ত কম্পিউটার ভিশন ডেটাসেট যেখানে 101টি বিভাগে 9,144টি উচ্চ-মানের ছবি রয়েছে৷ এটি বস্তুর বিভাগগুলির বিস্তৃত পরিসরও কভার করে এবং ছবিগুলি বিভিন্ন উত্স থেকে প্রাপ্ত করা হয়েছিল। প্রতিটি ছবিকে অবজেক্ট এবং ইমেজের ক্যাটাগরি দিয়ে লেবেল করা হয়, যা বিভিন্ন ডিপ লার্নিং ফ্রেমওয়ার্কের সাথে ব্যবহার করা সহজ করে তোলে।
এখানে ক্লিক করুন
STS-B (Semantic Textual Similarity Benchmark) ডেটাসেট হল একটি ইংরেজি ডেটাসেট যা 2012 এবং 2017-এর মধ্যে SemEval-এর প্রেক্ষাপটে সংগঠিত STS কার্যগুলিতে ব্যবহৃত হয়৷ এটি 1 থেকে 5 স্কেলে মানুষের দ্বারা নির্ধারিত সাদৃশ্য স্কোর সহ 8628 বাক্য জোড়া নিয়ে গঠিত৷ বিভিন্ন উৎস থেকে প্রাপ্ত, যেমন সংবাদ নিবন্ধ, ফোরাম পোস্ট, ক্যাপশন সহ ছবি এবং বিস্তৃত বিষয় কভার করে, এটি একটি জনপ্রিয় ডেটাসেট যা PyTorch-এর সাথে দুটি বাক্যের মধ্যে শব্দার্থগত সাদৃশ্য নির্ধারণে মডেলের কর্মক্ষমতা মূল্যায়নের জন্য ব্যবহৃত হয়। STS-B ডেটাসেটটি PyTorch-সামঞ্জস্যপূর্ণ ফর্ম্যাট সহ একাধিক ফর্ম্যাটে উপলব্ধ, কারণ PyTorch হল এই ডেটাসেটে মডেলের প্রশিক্ষণ এবং মূল্যায়নের জন্য একটি গভীর-শিক্ষার কাঠামো৷
\এই ডেটাসেট ডাউনলোড করতে, ক্লিক করুন
এই PyTorch ডেটাসেটটি 2015 সালে স্ট্যানফোর্ড দ্বারা তৈরি ইংরেজি এবং জার্মানের মধ্যে মেশিন অনুবাদের জন্য একটি বেঞ্চমার্ক ডেটাসেট৷ এতে ইংরেজি এবং জার্মান উভয় ভাষায় বাক্য-সংযুক্ত পাঠ্যের সমান্তরাল কর্পোরা রয়েছে, যা গভীর শিক্ষার মডেলগুলি তৈরি এবং মূল্যায়ন করতে ব্যবহৃত হয়৷ যদিও পরীক্ষার সেটে প্রতিটিতে 3,000 বাক্য জোড়া থাকে, প্রশিক্ষণ সেটে প্রায় 4.5 মিলিয়ন বাক্য জোড়া থাকে এবং গড় বাক্যের দৈর্ঘ্য ইংরেজিতে 26 শব্দ এবং জার্মান ভাষায় 30 শব্দ, ইংরেজির জন্য প্রায় 160,000 শব্দ এবং 220,000 শব্দের শব্দভাণ্ডার রয়েছে জার্মান।
আপনি নিচে স্ক্রোল করে ডাউনলোড করতে পারেন
এই ডেটাসেটটি একটি জনপ্রিয় বৃহৎ-স্কেল ফেস অ্যাট্রিবিউট ডেটাসেট যা 200,000 টিরও বেশি সেলিব্রিটির ছবি নিয়ে গঠিত৷ এটি 2015 সালে চাইনিজ ইউনিভার্সিটি অফ হংকং-এর গবেষকরা প্রথম প্রকাশ করেছিলেন৷ CelebA-এর একটি ছবিতে বয়স, চুলের রঙ, মুখের অভিব্যক্তি এবং লিঙ্গের মতো 40টি মুখের বৈশিষ্ট্য রয়েছে৷ এছাড়াও, এই ছবিগুলি ইন্টারনেট থেকে পুনরুদ্ধার করা হয়েছে এবং বিভিন্ন জাতি, বয়স এবং লিঙ্গ সহ মুখের চেহারাগুলির একটি বিস্তৃত পরিসর কভার করেছে৷ প্রতিটি ছবিতে মুখের অবস্থানের জন্য বাউন্ডিং বক্সের টীকা, সেইসাথে চোখ, নাক এবং মুখের জন্য 5টি ল্যান্ডমার্ক পয়েন্ট।
দ্রষ্টব্য: CelebA ডেটাসেট ক্রিয়েটিভ কমন্স অ্যাট্রিবিউশন-অবাণিজ্যিক-শেয়ার-এর লাইসেন্সের অধীনে রয়েছে, যা যথাযথ ক্রেডিট দেওয়া পর্যন্ত এটিকে অ-বাণিজ্যিক গবেষণার উদ্দেশ্যে ব্যবহার করার অনুমতি দেয়।
PyTorch-এ CelebA ডেটাসেট ব্যবহার করতে, আপনি torchvision.datasets.CelebA
ক্লাস ব্যবহার করতে পারেন, যা torchvision
মডিউলের অংশ। আপনি থেকে ডেটাসেট ডাউনলোড করতে পারেন
UFC101 ডেটাসেট কম্পিউটার ভিশনের ক্ষেত্রে ভিডিও শ্রেণীবিভাগের জন্য ব্যাপকভাবে ব্যবহৃত হয়। এটিতে 101টি অ্যাকশন বিভাগ থেকে মানুষের ক্রিয়াকলাপের 13,230টি ভিডিও রয়েছে, প্রতিটিতে প্রায় 100 থেকে 300টি ভিডিও রয়েছে। PyTorch UCF101 ডেটাসেট হল মূল UCF101-এর একটি পূর্ব-প্রসেস করা সংস্করণ যা PyTorch-এ ব্যবহারের জন্য প্রস্তুত৷ প্রি-প্রসেসড ডেটাসেটে এমন ভিডিও ফ্রেম রয়েছে যা প্রতিটি ভিডিওর জন্য সংশ্লিষ্ট লেবেল সহ স্বাভাবিককরণ এবং পুনরায় আকার দেওয়া হয়েছে। এটি তিনটি সেটে বিভক্ত: প্রশিক্ষণ, বৈধতা এবং পরীক্ষা, যথাক্রমে প্রায় 9,500, 3,500 এবং 3,000 ভিডিও সহ।
ডেটাসেট ডাউনলোড করতে ক্লিক করুন
HMDB51 ডেটাসেট হল মুভি, টিভি শো এবং অনলাইন ভিডিও সহ বিভিন্ন উত্স থেকে সংগৃহীত ভিডিওগুলির একটি সংগ্রহ, যেখানে 51টি অ্যাকশন ক্লাস রয়েছে, প্রতিটিতে কমপক্ষে 101টি ভিডিও ক্লিপ রয়েছে৷ এটি 2011 সালে সেন্ট্রাল ফ্লোরিডা বিশ্ববিদ্যালয়ের গবেষকরা মানুষের ক্রিয়া স্বীকৃতিতে গবেষণার জন্য তৈরি করেছিলেন। ভিডিওগুলি AVI ফরম্যাটে রয়েছে এবং প্রতিটি ভিডিওর জন্য গ্রাউন্ড-ট্রুথ টীকা সহ 320x240 পিক্সেলের রেজোলিউশন রয়েছে, অ্যাকশন ক্লাস লেবেল এবং ভিডিওর মধ্যে অ্যাকশনের শুরু এবং শেষ ফ্রেম সহ। ডেটাসেটের প্রতিটি ভিডিও একটি স্ট্যাটিক ক্যামেরার সামনে একটি ক্রিয়া সম্পাদনকারী ব্যক্তিকে উপস্থাপন করে। ক্রিয়াগুলির মধ্যে প্রতিদিন বিস্তৃত ক্রিয়াকলাপ অন্তর্ভুক্ত থাকে, যেমন লাফানো, দোলা দেওয়া, মদ্যপান করা এবং দাঁত ব্রাশ করা, সেইসাথে গিটার বাজানো এবং ঘোড়ায় চড়ার মতো জটিল ক্রিয়াকলাপ।
দ্রষ্টব্য: এটি এর সাথে একযোগে ব্যবহৃত হয়
আপনি ডেটাসেট ডাউনলোড করতে পারেন
ActivityNet হল একটি বৃহৎ-স্কেল ভিডিও বোঝার ডেটাসেট যা রান্না, খেলাধুলা, নাচ ইত্যাদির মতো বিভিন্ন বিভাগের 20,000টিরও বেশি ভিডিও নিয়ে গঠিত৷ ভিডিওগুলির দৈর্ঘ্য 3 মিনিটের এবং গড়ে 1.41টি কার্যকলাপের অংশগুলির সাথে টীকা করা হয়৷ এটি পাইটর্চে উপলব্ধ, যা গভীর শিক্ষার কাঠামোতে ব্যবহার করা সহজ। PyTorch সংস্করণটি RGB ফ্রেম এবং প্রতিটি ভিডিওর অপটিক্যাল ফ্লো ক্ষেত্র থেকে নিষ্কাশিত প্রাক-প্রসেসড বৈশিষ্ট্যের পাশাপাশি টেম্পোরাল সেগমেন্ট এবং কার্যকলাপের লেবেলগুলির জন্য গ্রাউন্ড ট্রুথ টীকা প্রদান করে।
আপনি ডেটাসেট ডাউনলোড করতে পারেন
ভিওসি ডেটাসেট (ভিজ্যুয়াল অবজেক্ট ক্লাস) 2005 সালে PASCAL VOC চ্যালেঞ্জের অংশ হিসাবে প্রথম চালু করা হয়েছিল, যার লক্ষ্য ছিল ভিজ্যুয়াল স্বীকৃতিতে শিল্পের অবস্থাকে এগিয়ে নেওয়া। এটিতে প্রাণী, যানবাহন এবং সাধারণ গৃহস্থালী সামগ্রী সহ 20টি বিভিন্ন অবজেক্ট বিভাগের ছবি রয়েছে। এই চিত্রগুলির প্রত্যেকটি চিত্রের মধ্যে থাকা বস্তুর অবস্থান এবং শ্রেণীবিভাগের সাথে টীকাযুক্ত। টীকাগুলির মধ্যে বাউন্ডিং বাক্স এবং পিক্সেল-স্তরের বিভাজন মাস্ক উভয়ই অন্তর্ভুক্ত। ডেটাসেট দুটি প্রধান সেটে বিভক্ত: প্রশিক্ষণ এবং বৈধতা সেট। প্রশিক্ষণ সেটটিতে টীকা সহ প্রায় 5,000টি চিত্র রয়েছে, যখন বৈধকরণ সেটটিতে টীকা ছাড়াই প্রায় 5,000টি চিত্র রয়েছে৷ এছাড়াও, ডেটাসেটে আনুমানিক 10,000 ইমেজ সহ একটি পরীক্ষা সেটও রয়েছে, কিন্তু এই সেটের জন্য টীকাগুলি সর্বজনীনভাবে উপলব্ধ নয়৷
সাম্প্রতিক ডেটাসেট ডাউনলোড করতে, আপনি এটি থেকে ডাউনলোড করতে পারেন
এই ডেটাসেটটি 3D অবজেক্ট মডেল এবং ভিডিও সিকোয়েন্সের একটি সংগ্রহ যা অবজেক্ট শনাক্তকরণ এবং পোজ অনুমান কার্যের জন্য ডিজাইন করা হয়েছে। এটিতে 21টি দৈনন্দিন গৃহস্থালীর আইটেম রয়েছে, প্রতিটি বস্তু বিভিন্ন আলোর অবস্থা এবং ক্যামেরার দৃষ্টিকোণে ধারণ করা হয়েছে। ডেটাসেটটি পিক্সেল-স্তরের গ্রাউন্ড ট্রুথ টীকা প্রদান করে এবং সাধারণত কম্পিউটার ভিশন অ্যালগরিদম এবং রোবোটিক সিস্টেমের মূল্যায়নের জন্য ব্যবহৃত হয়।
ডাউনলোড করতে এখানে ক্লিক করুন
KITTI ডেটাসেট হল স্বায়ত্তশাসিত ড্রাইভিং গবেষণার জন্য কম্পিউটার ভিশন ডেটার একটি সংগ্রহ৷ এতে 4000টিরও বেশি উচ্চ-রেজোলিউশনের ছবি, LIDAR পয়েন্ট ক্লাউড এবং বিভিন্ন সেন্সর দিয়ে সজ্জিত একটি গাড়ির সেন্সর ডেটা অন্তর্ভুক্ত রয়েছে। ডেটাসেট বস্তুর সনাক্তকরণ, ট্র্যাকিং এবং বিভাজন, সেইসাথে গভীরতার মানচিত্র এবং ক্রমাঙ্কন পরামিতিগুলির জন্য টীকা প্রদান করে। KITTI ডেটাসেটটি স্বায়ত্তশাসিত ড্রাইভিং এবং রোবোটিক্সের জন্য গভীর শিক্ষার মডেলের প্রশিক্ষণ এবং মূল্যায়নের জন্য ব্যাপকভাবে ব্যবহৃত হয়।
সাম্প্রতিক ডেটাসেট ডাউনলোড করতে, আপনি এটি থেকে ডাউনলোড করতে পারেন
ব্র্যাটস পাইটর্চ ডেটাসেট হল ম্যাগনেটিক রেজোন্যান্স ইমেজিং (MRI) স্ক্যানের একটি সংগ্রহ যা ব্রেন টিউমার সেগমেন্টেশনের জন্য। এটিতে 200 টিরও বেশি উচ্চ-রেজোলিউশন 3D মস্তিষ্কের ছবি রয়েছে, প্রতিটিতে চারটি পদ্ধতি (T1, T1c, T2 এবং FLAIR) এবং সংশ্লিষ্ট বাইনারি সেগমেন্টেশন মাস্ক রয়েছে। ডেটাসেটটি সাধারণত স্বয়ংক্রিয় মস্তিষ্কের টিউমার সনাক্তকরণ এবং বিভাজনের জন্য গভীর শিক্ষার মডেল প্রশিক্ষণ এবং মূল্যায়নের জন্য ব্যবহৃত হয়।
আপনি ক্লিক করে Kaggle এই ডেটাসেট ডাউনলোড করতে পারেন
মাল্টি-হিউম্যান পার্সিং PyTorch ডেটাসেট হল একটি বৃহৎ-স্কেল মানব ইমেজ ডেটাসেট যা মানুষের অংশ পার্স করার জন্য পিক্সেল-স্তরের টীকা সহ। এটিতে মানুষের 26,000 টিরও বেশি চিত্র রয়েছে, প্রতিটি 18টি মানব অংশ লেবেলে বিভক্ত। ডেটাসেটটি মানুষের ভঙ্গি অনুমান, বিভাজন এবং ক্রিয়া স্বীকৃতির জন্য গভীর শিক্ষার মডেলগুলি প্রশিক্ষণ এবং মূল্যায়নের জন্য ব্যবহৃত হয়।
ডেটাসেট ডাউনলোড করতে ক্লিক করুন
এই ডেটাসেটটি অ্যাকশন শনাক্তকরণ এবং স্থানীয়করণের জন্য একটি বড় মাপের ভিডিও ডেটাসেট। এটিতে প্রতিদিনের ক্রিয়াকলাপগুলির 9,800 টিরও বেশি ভিডিও রয়েছে, যেমন রান্না করা, পরিষ্কার করা এবং সামাজিকীকরণ, প্রতি ভিডিওর গড় দৈর্ঘ্য 30 সেকেন্ড। ডেটাসেট প্রতিটি ভিডিওর জন্য বিশদ টীকা প্রদান করে, যার মধ্যে অ্যাকশন এবং পারমাণবিক ভিজ্যুয়াল ধারণাগুলির জন্য অস্থায়ী সীমানা রয়েছে, এটিকে প্রশিক্ষণের জন্য উপযুক্ত করে তোলে এবং ক্রিয়া শনাক্তকরণ, সনাক্তকরণ এবং বিভাজন করার জন্য গভীর শিক্ষার মডেলগুলিকে মূল্যায়ন করে৷
Charades PyTorch ডেটাসেট কম্পিউটার ভিশন রিসার্চ কমিউনিটিতে ব্যাপকভাবে ব্যবহৃত হয় এবং অবাধে পাওয়া যায়
এই ডেটাসেটটি উচ্চ-রেজোলিউশনের চিত্রগুলির একটি সমৃদ্ধ সংগ্রহ এবং বস্তু সনাক্তকরণ এবং ভঙ্গি অনুমানের জন্য 3D অবজেক্ট পোজ। এটিতে 2D এবং 3D ভঙ্গিগুলির জন্য টীকা সহ 60টি অবজেক্ট বিভাগের 11,000টিরও বেশি চিত্র রয়েছে। এর বৃহৎ আকার এবং বৈচিত্র্যময় অবজেক্ট ক্যাটাগরি সহ, টিইউ বার্লিন পাইটর্চ ডেটাসেট দৃঢ় এবং নির্ভুল বস্তু সনাক্তকরণ এবং পোজ অনুমান মডেলগুলি বিকাশের জন্য একটি দুর্দান্ত টেস্টবেড সরবরাহ করে।
আপনি ক্লিক করে ওয়েবসাইট থেকে সরাসরি ডেটাসেট পেতে পারেন
PyTorch গবেষণা এবং পরীক্ষা-নিরীক্ষার জন্য উপযোগী, যেখানে ফোকাস প্রায়ই গভীর শিক্ষার মডেল তৈরি করা এবং নতুন পদ্ধতির অন্বেষণ করা হয়। উপরন্তু, PyTorch বাস্তুতন্ত্রে অবদানকারী বিকাশকারী এবং গবেষকদের একটি ক্রমবর্ধমান সম্প্রদায়ের সাথে একটি গবেষণা-কেন্দ্রিক কাঠামো হিসাবে একটি খ্যাতি অর্জন করেছে।
এই ডেটাসেটগুলির একাধিক ক্ষেত্রে অ্যাপ্লিকেশন রয়েছে এবং যে কেউ বিনামূল্যে ডাউনলোড এবং ব্যবহার করার জন্যও উপলব্ধ৷
এই নিবন্ধটির প্রধান চিত্রটি হ্যাকারনুন-এর এআই স্টেবল ডিফিউশন মডেলের মাধ্যমে তৈরি করা হয়েছে প্রম্পট 'PyTorch superimposed images' ব্যবহার করে।