এক্সেল ডেটা বিশ্লেষণের জন্য একটি অপরিহার্য হাতিয়ার এবং সঠিক ডেটাসেট এবং কৌশলগুলির সাহায্যে, নতুনরা অন্তর্দৃষ্টি উন্মোচন করতে এবং জ্ঞাত সিদ্ধান্ত নিতে শিখতে পারে। এর স্বজ্ঞাত ইন্টারফেস এবং শক্তিশালী কার্যকারিতা ব্যবহারকারীদের ডেটা ম্যানিপুলেশন, ডেটা ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণের মতো বিস্তৃত প্রক্রিয়াগুলি সম্পাদন করতে দেয়।
"এক্সেল ডেটাসেট" কি?
এক্সেল ডেটাসেটগুলি হল ডেটার সংগ্রহ যা একটি এক্সেল স্প্রেডশীটে সংরক্ষিত এবং সংগঠিত হয়, যা একটি সাধারণভাবে ব্যবহৃত সফ্টওয়্যার যা ব্যবহারকারীদের একটি কাঠামোগত বিন্যাসে ডেটা তৈরি, ম্যানিপুলেট এবং বিশ্লেষণ করতে সক্ষম করে। এই ডেটাসেট দুটি প্রধান ফর্ম্যাটে আসতে পারে: Excel(.xlsx) এবং কমা বিভাজিত মান (CSV)। এক্সেল ফরম্যাট সূত্র এবং ভিজ্যুয়ালাইজেশনের ব্যবহার সহ জটিল ডেটা সংগঠিত এবং বিশ্লেষণের জন্য আরও উন্নত বৈশিষ্ট্য প্রদান করে, অন্যদিকে CSV একটি সহজ ফর্ম্যাট অফার করে যা বিস্তৃত সফ্টওয়্যার অ্যাপ্লিকেশনের সাথে সামঞ্জস্যপূর্ণ, যা শেয়ার করা সহজ করে তোলে। বিভিন্ন প্রোগ্রামের মধ্যে ডেটা।
এই নিবন্ধে, আমরা ডেটা অ্যানালিটিক্স বিগিনারদের জন্য 15টি এক্সেল ডেটাসেটের একটি তালিকা সংকলন করেছি। এই এক্সেল ডেটাসেটগুলি আর্থিক বিশ্লেষণ, বাজার বিশ্লেষণ এবং সময় সিরিজ বিশ্লেষণের মতো বিষয়গুলিকে কভার করে, নতুনরা বাস্তব-বিশ্বের পরিস্থিতিতে অন্তর্দৃষ্টি অর্জনের সাথে সাথে ডেটা ক্লিনিং, পিভট টেবিল এবং চার্টের মতো ডেটা বিশ্লেষণ কৌশলগুলি অনুশীলন করতে পারে।
ডেটা অ্যানালিটিক্স নতুনদের জন্য এক্সেল ডেটাসেটের তালিকা
- সুপারস্টোর বিক্রয়
- আইরিস
- টাইটানিক
- ওয়াইন গুণমান
- প্রাপ্তবয়স্ক আদমশুমারি আয়
- বোস্টন হাউজিং
- স্তন ক্যান্সার উইসকনসিন ডেটাসেট
- অনলাইন ক্রেতাদের ক্রয় অভিপ্রায়
- ব্যাংক মার্কেটিং
- অ্যাভোকাডোর দাম
- অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বই 2009 – 2019৷
- ফিফা বিশ্বকাপ
- নিউ ইয়র্ক সিটি এয়ারবিএনবি ওপেন ডেটা
- ওয়ার্ল্ড হ্যাপিনেস রিপোর্ট
- স্টকের মূল্য
1. সুপারস্টোর বিক্রয়
সুপারস্টোর বিক্রয় ডেটা একটি কাল্পনিক খুচরা কোম্পানির জন্য পণ্য, অর্ডার এবং গ্রাহকদের তথ্য সহ বিক্রয় ডেটা সরবরাহ করে। এটি প্রায়ই ডেটা বিশ্লেষণ অনুশীলন করতে ব্যবহৃত হয়।
এই এক্সেল ডেটাসেটে নিম্নলিখিত ভেরিয়েবলগুলি রয়েছে:
- অর্ডার আইডি - প্রতিটি অর্ডারের জন্য একটি অনন্য শনাক্তকারী।
- গ্রাহক আইডি - প্রতিটি গ্রাহকের জন্য একটি অনন্য শনাক্তকারী।
- অর্ডারের তারিখ - অর্ডার বসানোর তারিখ।
- জাহাজের তারিখ - অর্ডারটি পাঠানোর তারিখ।
- শিপ মোড - অর্ডারের জন্য শিপিং মোড (যেমন স্ট্যান্ডার্ড, একই দিন)।
- সেগমেন্ট - গ্রাহক সেগমেন্ট (যেমন ভোক্তা, কর্পোরেট, হোম অফিস)।
- অঞ্চল - গ্রাহক যে অঞ্চলে অবস্থিত (যেমন পশ্চিম, মধ্য, পূর্ব)।
- বিভাগ - ক্রয়কৃত পণ্যের বিভাগ (যেমন আসবাবপত্র, প্রযুক্তি, অফিস সরবরাহ)।
- সাব-ক্যাটাগরি - কেনা পণ্যের সাব-ক্যাটাগরি (যেমন চেয়ার, ডেস্কটপ, পেপার)।
- পণ্যের নাম - কেনা পণ্যের নাম।
- বিক্রয় - ক্রয়কৃত পণ্যের বিক্রয় আয়।
- পরিমাণ - কেনা পণ্যের ইউনিট সংখ্যা।
- ডিসকাউন্ট - ক্রয়কৃত পণ্যে প্রযোজ্য ডিসকাউন্ট।
- লাভ - ক্রয়কৃত পণ্য দ্বারা উত্পন্ন লাভ।
2. আইরিস
এই ডেটাসেটে সেপালের দৈর্ঘ্য, সেপালের প্রস্থ, পাপড়ির দৈর্ঘ্য এবং 150টি আইরিস ফুলের পাপড়ির প্রস্থের পরিমাপ রয়েছে, যা 3টি ভিন্ন প্রজাতির অন্তর্ভুক্ত: সেটোসা, ভার্সিকলার এবং ভার্জিনিকা। আইরিস ডেটাসেটে 150টি সারি এবং 5টি কলাম রয়েছে, যা প্রতিটি ফুলের প্রজাতির জন্য একটি কলাম সহ ডেটাফ্রেম হিসাবে সংরক্ষণ করা হয়।
এর ভেরিয়েবলের বর্ণনার মধ্যে রয়েছে:
- Sepal.Length - sepal.length সেপালের দৈর্ঘ্যকে সেন্টিমিটারে উপস্থাপন করে।
- Sepal.Width - sepal.width সেপালের প্রস্থকে সেন্টিমিটারে উপস্থাপন করে।
- Petal.Length - পাপড়ির দৈর্ঘ্য সেন্টিমিটারে পাপড়ির দৈর্ঘ্যকে প্রতিনিধিত্ব করে।
- প্রজাতি - প্রজাতির পরিবর্তনশীল তিনটি সম্ভাব্য মান সহ আইরিস ফুলের প্রজাতিকে প্রতিনিধিত্ব করে: সেটোসা, ভার্সিকলার এবং ভার্জিনিকা।
এক্সেলের আইরিস ডেটাসেটের একটি ব্যবহার হল আইরিস ফুলের বিভিন্ন বৈশিষ্ট্যের মধ্যে সম্পর্ক বিশ্লেষণ করা এবং বৈশিষ্ট্যের মানগুলির উপর ভিত্তি করে ফুলের প্রজাতিকে শ্রেণীবদ্ধ করা। পারস্পরিক সম্পর্ক বিশ্লেষণ, অনুমানমূলক পরিসংখ্যান এবং ভবিষ্যদ্বাণীমূলক মডেলিংয়ের মতো কৌশলগুলি ব্যবহার করে এটি করা যেতে পারে।
আপনি ক্লিক করে কাগল-এ এই এক্সেল ডেটাসেটটি ডাউনলোড করতে পারেন
3. টাইটানিক
এই জনপ্রিয় ওপেন-সোর্স ডেটাসেটটি 15 এপ্রিল, 1912 এ ডুবে যাওয়ার সময় টাইটানিক জাহাজে থাকা যাত্রীদের তথ্য সরবরাহ করে। এটি ডেটা পরিস্কার এবং প্রিপ্রসেসিং, বর্ণনামূলক পরিসংখ্যান, ডেটা ভিজ্যুয়ালাইজেশন এবং ভবিষ্যদ্বাণীমূলক মডেলিং-এ আগ্রহী ডেটা বিশ্লেষণ নতুনদের দ্বারা ব্যবহার করা যেতে পারে।
ডেটাসেটে অন্তর্ভুক্ত কিছু ভেরিয়েবল:
- প্যাসেঞ্জারআইডি - প্রতিটি যাত্রীর জন্য একটি অনন্য শনাক্তকারী।
- বেঁচে গেছে - এটি দেখায় যে যাত্রী বেঁচে আছে কি না (0 = না, 1 = হ্যাঁ)।
- Pclass - একজন যাত্রীর শ্রেণী (1 = 1ম, 2 = 2য়, 3 = 3য়)।
- নাম - একজন যাত্রীর নাম।
- লিঙ্গ - একজন যাত্রীর লিঙ্গ।
- বয়স - একজন যাত্রীর বয়স।
- SibSp - জাহাজে থাকা ভাইবোন/স্বামীর সংখ্যা।
- পারচ - জাহাজে থাকা বাবা-মা/সন্তানের সংখ্যা।
- টিকিট - টিকিটের নম্বর।
- ভাড়া - টিকিটের জন্য দেওয়া ভাড়া।
- কেবিন - কেবিন নম্বর।
- এমবার্কড - যাত্রার বন্দর (C = Cherbourg, Q = Queenstown, S = Southampton)।
4. ওয়াইন গুণমান
ওয়াইন কোয়ালিটির ডেটাসেটে লাল এবং সাদা ওয়াইনের নমুনার তথ্য রয়েছে। এই ডেটাসেটের লক্ষ্য হল পিএইচ, ঘনত্ব, অ্যালকোহল সামগ্রী এবং সাইট্রিক অ্যাসিড সামগ্রীর মতো রাসায়নিক বৈশিষ্ট্যের উপর ভিত্তি করে ওয়াইনের গুণমানকে শ্রেণীবদ্ধ করা।
এই এক্সেল ডেটাসেটে অন্তর্ভুক্ত সাধারণ ভেরিয়েবল:
- স্থির অম্লতা - ওয়াইনে স্থির অ্যাসিডের সংখ্যা, g/dm^3 এ প্রকাশ করা হয়।
- উদ্বায়ী অম্লতা - ওয়াইনে উদ্বায়ী অ্যাসিডের সংখ্যা, g/dm^3 এ প্রকাশ করা হয়।
- সাইট্রিক অ্যাসিড - ওয়াইনে সাইট্রিক অ্যাসিডের পরিমাণ, g/dm^3 এ প্রকাশ করা হয়।
- অবশিষ্ট চিনি - ওয়াইনে অবশিষ্ট চিনির পরিমাণ, g/dm^3 এ প্রকাশ করা হয়
- ক্লোরাইড - ওয়াইনে ক্লোরাইডের পরিমাণ, g/dm^3 এ প্রকাশ করা হয়।
- বিনামূল্যে সালফার ডাই অক্সাইড - ওয়াইনে বিনামূল্যে সালফার ডাই অক্সাইডের পরিমাণ, mg/dm^3 এ প্রকাশ করা হয়।
- মোট সালফার ডাই অক্সাইড - ওয়াইনে মোট সালফার ডাই অক্সাইডের পরিমাণ, mg/dm^3 এ প্রকাশ করা হয়।
- ঘনত্ব - ওয়াইনের ঘনত্ব, g/cm^3 এ প্রকাশ করা হয়।
- pH - ওয়াইনের pH স্তর।
- সালফেটস - ওয়াইনে সালফেটের সংখ্যা, g/dm^3 এ প্রকাশ করা হয়।
- অ্যালকোহল - ওয়াইনের অ্যালকোহল সামগ্রী, % ভলিউমে প্রকাশ করা হয়েছে।
- গুণমান - ওয়াইনের মানের রেটিং, 0 থেকে 10 এর স্কেলে।
5. প্রাপ্তবয়স্ক আদমশুমারি আয়
এই এক্সেল ডেটাসেট হল মার্কিন যুক্তরাষ্ট্রে বসবাসকারী ব্যক্তিদের সম্পর্কে তথ্যের একটি সংগ্রহ, যা 1994 সালের আদমশুমারি ডাটাবেস থেকে নেওয়া হয়েছে। এটি প্রতিটি ব্যক্তির সম্পর্কে বিভিন্ন জনসংখ্যাগত, সামাজিক এবং অর্থনৈতিক বৈশিষ্ট্য ধারণ করে।
এই ডেটাসেটে অন্তর্ভুক্ত কিছু বৈশিষ্ট্য:
বয়স
ওয়ার্কক্লাস - প্রাইভেট, সেলফ-এমপি-নট-ইনক, সেলফ-এমপি-ইঙ্ক, ফেডারেল-গভ, লোকাল-গভ, স্টেট-গভ, বিনা বেতন, কখনও-কাজ করা হয়নি।
fnlwgt
শিক্ষা - স্নাতক, কিছু-কলেজ, 11 তম, এইচএস-গ্রেড, প্রফেসর-স্কুল, Assoc-acdm, Assoc-voc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool.
শিক্ষা-সংখ্যা
বৈবাহিক-স্থিতি - বিবাহিত-সিভি-পত্নী, তালাকপ্রাপ্ত, কখনও বিবাহিত নয়, বিচ্ছিন্ন, বিধবা, বিবাহিত-স্বামী-অনুপস্থিত, বিবাহিত-এএফ-পত্নী।
পেশা - টেক-সাপোর্ট, ক্রাফ্ট-মেরামত, অন্যান্য-পরিষেবা, বিক্রয়, নির্বাহী-ব্যবস্থাপক, প্রফেসর-স্পেশালিটি, হ্যান্ডলার-ক্লিনার, মেশিন-অপ-ইন্সপক্ট, অ্যাডএম-ক্লারিক্যাল, ফার্মিং-ফিশিং, পরিবহন-চলন্ত, ব্যক্তিগত-হাউস- সার্ভ, প্রতিরক্ষামূলক-সার্ভ, সশস্ত্র-বাহিনী।
সম্পর্ক - স্ত্রী, নিজের সন্তান, স্বামী, পরিবারে নয়, অন্য আত্মীয়, অবিবাহিত।
জাতি - সাদা, এশিয়ান-প্যাক-আইল্যান্ডার, আমের-ইন্ডিয়ান-এস্কিমো, অন্যান্য, কালো।
লিঙ্গ - পুরুষ বা মহিলা।
"আয়" অ্যাট্রিবিউট হল টার্গেট ভেরিয়েবল এবং ডেটাসেটটি ডেটা অ্যানালিটিক্স নতুনদের জন্য খুবই উপযোগী।
6. বোস্টন হাউজিং
বোস্টন হাউজিং ডেটাসেটে বোস্টন, ম্যাসাচুসেটস এলাকার আবাসন সম্পর্কিত তথ্য রয়েছে। এতে প্রায় 506টি সারি এবং 14টি কলাম ডেটা রয়েছে।
ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:
- CRIM - শহর অনুসারে মাথাপিছু অপরাধের হার।
- ZN - আবাসিক জমির অনুপাত 25,000 বর্গফুটের বেশি লটের জন্য জোন করা হয়েছে।
- INDUS - শহর প্রতি অ-খুচরা ব্যবসার একর অনুপাত।
- CHAS - চার্লস রিভার ডামি পরিবর্তনশীল (= 1 যদি ট্র্যাক্ট নদীকে আবদ্ধ করে; অন্যথায় 0)।
- NOX - নাইট্রিক অক্সাইড ঘনত্ব (প্রতি 10 মিলিয়ন অংশ)।
- RM - প্রতি বাসস্থানে ঘরের গড় সংখ্যা।
- AGE - 1940 সালের আগে নির্মিত মালিক-অধিকৃত ইউনিটগুলির অনুপাত।
- DIS - পাঁচটি বোস্টন কর্মসংস্থান কেন্দ্রের ওজনযুক্ত দূরত্ব।
- RAD - রেডিয়াল হাইওয়েতে অ্যাক্সেসযোগ্যতার সূচক।
- ট্যাক্স - $10,000 প্রতি পূর্ণ-মূল্যের সম্পত্তি করের হার।
- PTRATIO - শহর অনুসারে ছাত্র-শিক্ষক অনুপাত।
- B - 1000(Bk - 0.63)^2 যেখানে -Bk হল শহর অনুসারে কালোদের অনুপাত।
- LSTAT - জনসংখ্যার শতাংশ নিম্ন অবস্থা।
- MEDV - $1000 এর মধ্যে মালিক-অধিকৃত বাড়ির গড় মান।
এই ডেটাসেটটি ডেটা বিশ্লেষণে ব্যবহার করা যেতে পারে বাড়ির দামের বিভিন্ন বৈশিষ্ট্য এবং হাউজিং মার্কেটের মধ্যে সম্পর্ক বিশ্লেষণ করতে, ডেটা বিশ্লেষণ করতে এবং অন্তর্দৃষ্টি তৈরি করতে।
7. স্তন ক্যান্সার উইসকনসিন ডেটাসেট
এই এক্সেল ডেটাসেটটি স্তন ক্যান্সারের টিউমার সম্পর্কে তথ্য নিয়ে গঠিত এবং প্রাথমিকভাবে ডাঃ উইলিয়াম এইচ. ওলবার্গ তৈরি করেছিলেন। ডেটাসেটটি গবেষক এবং মেশিন লার্নিং অনুশীলনকারীদের টিউমারগুলিকে ম্যালিগন্যান্ট (ক্যান্সারযুক্ত) বা সৌম্য (অ-ক্যান্সার) হিসাবে শ্রেণীবদ্ধ করতে সহায়তা করার জন্য তৈরি করা হয়েছিল।
এই ডেটাসেটে অন্তর্ভুক্ত কিছু ভেরিয়েবল:
- আইডি নাম্বার
- রোগ নির্ণয় (M = ম্যালিগন্যান্ট, B = সৌম্য)।
- ব্যাসার্ধ (কেন্দ্র থেকে ঘেরের বিন্দু পর্যন্ত দূরত্বের গড়)।
- টেক্সচার (ধূসর-স্কেল মানগুলির আদর্শ বিচ্যুতি)।
- পরিধি
- এলাকা
- মসৃণতা (ব্যাসার্ধের দৈর্ঘ্যের স্থানীয় পরিবর্তন)।
- কম্প্যাক্টনেস (ঘের^2 / এলাকা - 1.0)।
- অবতলতা (কনট্যুরের অবতল অংশের তীব্রতা)।
- অবতল বিন্দু (কনট্যুরের অবতল অংশের সংখ্যা)।
- প্রতিসাম্য
- ফ্র্যাক্টাল ডাইমেনশন ("কোস্টলাইন অ্যাপ্রোক্সিমেশন" - 1)।
8. অনলাইন ক্রেতাদের ক্রয় অভিপ্রায়
অনলাইন শপার্স পারচেজিং ইনটেনশন ডেটাসেট হল অনলাইন কেনাকাটার প্রেক্ষাপটে কেনাকাটার ধরণ এবং ভোক্তাদের আচরণ সম্পর্কিত ডেটার একটি সংগ্রহ। এটি অনলাইন ক্রেতাদের সমীক্ষা পরিচালনা করে এবং তাদের প্রতিক্রিয়া থেকে ডেটা সংগ্রহ করে তৈরি করা হয়েছিল।
এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:
- প্রশাসনিক - প্রশাসনিক উদ্দেশ্যে ব্যবহারকারী দ্বারা পরিদর্শন করা ওয়েবসাইটের পৃষ্ঠার সংখ্যা
- প্রশাসনিক_সময়কাল - ওয়েবসাইটের প্রশাসনিক পৃষ্ঠাগুলিতে ব্যবহারকারীর দ্বারা ব্যয় করা মোট সময়
- তথ্যমূলক - তথ্যগত উদ্দেশ্যে ব্যবহারকারী দ্বারা পরিদর্শন করা ওয়েবসাইটের পৃষ্ঠার সংখ্যা
- তথ্যগত_সময়কাল - ওয়েবসাইটের তথ্যমূলক পৃষ্ঠাগুলিতে ব্যবহারকারীর দ্বারা ব্যয় করা মোট সময়
- পণ্য সম্পর্কিত - পণ্য-সম্পর্কিত উদ্দেশ্যে ব্যবহারকারী দ্বারা পরিদর্শন করা ওয়েবসাইটের পৃষ্ঠার সংখ্যা
- ProductRelated_Duration - ওয়েবসাইটের পণ্য-সম্পর্কিত পৃষ্ঠাগুলিতে ব্যবহারকারীর দ্বারা ব্যয় করা মোট সময়
- BounceRates - দর্শকদের শতাংশ যারা ওয়েবসাইটে প্রবেশ করে এবং অন্য কোনো পৃষ্ঠা না দেখে চলে যায়
- ExitRates - দর্শকদের শতকরা শতাংশ যারা ওয়েবসাইটটি দেখার পর একটি নির্দিষ্ট পৃষ্ঠা থেকে প্রস্থান করে
- PageValues - লেনদেনের আগে ব্যবহারকারী দ্বারা দেখা পৃষ্ঠাগুলির গড় মান৷
- বিশেষ দিবস - একটি বিশেষ দিনে পরিদর্শনের নৈকট্য (যেমন, মা দিবস, ভালোবাসা দিবস, ইত্যাদি)
এই এক্সেল ডেটাসেটটি ই-কমার্স এবং অনলাইন মার্কেটিং সম্পর্কিত গবেষণা এবং বিশ্লেষণে ব্যবহৃত হয়। এটি ব্যবসাগুলিকে সেই কারণগুলি বুঝতে সাহায্য করতে পারে যা গ্রাহকের আচরণকে চালিত করে এবং ডেটা বিশ্লেষণের নতুনদের জন্যও এটি কার্যকর।
9. ব্যাংক মার্কেটিং
এই জনপ্রিয় ডেটাসেটটি একটি পর্তুগিজ ব্যাংকিং প্রতিষ্ঠানের জন্য বিপণন প্রচারাভিযানগুলি অধ্যয়ন করার জন্য। এটিতে ব্যাঙ্কের বিপণন প্রচারাভিযানের পাশাপাশি গ্রাহক জনসংখ্যা এবং অর্থনৈতিক সূচকগুলি সম্পর্কে তথ্য রয়েছে৷
এই ডেটাসেটে অন্তর্ভুক্ত কিছু ভেরিয়েবল:
- বয়স - গ্রাহকের বয়স (সাংখ্যিক)
- চাকরি - কাজের ধরন
- বৈবাহিক - বৈবাহিক অবস্থা
- শিক্ষা - শিক্ষার স্তর
- ডিফল্ট - ডিফল্ট ক্রেডিট আছে?
- ব্যালেন্স - গড় বার্ষিক ব্যালেন্স, ইউরোতে।
- হাউজিং - একটি আবাসন ঋণ আছে?
- ঋণ - একটি ব্যক্তিগত ঋণ আছে?
- যোগাযোগ - যোগাযোগ যোগাযোগের ধরন।
- দিন - মাসের দিন যোগাযোগ.
- আউটপুট ভেরিয়েবলটি বোঝায় যে গ্রাহক ব্যাঙ্কের সাথে যোগাযোগ করার পরে একটি মেয়াদী আমানতে সাবস্ক্রাইব করেছেন কিনা।
10. অ্যাভোকাডোর দাম
অ্যাভোকাডো প্রাইস ডেটাসেট মার্কিন যুক্তরাষ্ট্রে অ্যাভোকাডোর দামের সাথে সম্পর্কিত ডেটা নিয়ে গঠিত। হ্যাস অ্যাভোকাডো বোর্ড এবং ইউনাইটেড স্টেটস ডিপার্টমেন্ট অফ এগ্রিকালচার (USDA) এর মতো বিভিন্ন উত্স থেকে ডেটা সংগ্রহ করা হয়েছে।
এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:
- তারিখ - পর্যবেক্ষণের তারিখ।
- গড় মূল্য - একটি একক অ্যাভোকাডোর গড় মূল্য।
- মোট আয়তন - মোট অ্যাভোকাডো বিক্রি হয়েছে।
- PLU (প্রাইস লুক-আপ) কোড - একটি নির্দিষ্ট ধরনের অ্যাভোকাডো সনাক্ত করতে ব্যবহৃত একটি কোড।
- প্রকার - প্রচলিত বা জৈব
- অঞ্চল - পর্যবেক্ষণের শহর বা অঞ্চল।
এটি খাদ্য শিল্পের ব্যবসার দ্বারা অ্যাভোকাডো কেনা এবং বিক্রির বিষয়ে কৌশলগত সিদ্ধান্ত নিতেও ব্যবহার করা যেতে পারে।
11. অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বই 2009 - 2019৷
এই Excel ডেটাসেটটি 2009 থেকে 2019 সালের মধ্যে প্রতি বছরের জন্য Amazon-এ সেরা 50টি সর্বাধিক বিক্রিত বই সম্পর্কিত ডেটার একটি সংগ্রহ৷
ডেটাসেটে নিম্নলিখিত ভেরিয়েবলগুলি রয়েছে:
- নাম - বইয়ের শিরোনাম।
- লেখক - বইটির লেখকের নাম।
- ইউজার রেটিং - অ্যামাজন ব্যবহারকারীদের দেওয়া বইটির গড় রেটিং।
- রিভিউ - অ্যামাজনে বইটির মোট রিভিউর সংখ্যা।
- মূল্য- বইটির মূল্য US ডলারে।
- সাল - যে বছর বইটি প্রকাশিত হয়েছিল।
- ধরণ - বইয়ের ধরণ।
অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বইগুলি এক দশক ধরে অ্যামাজনে বই বিক্রির প্রবণতা অন্বেষণ করতে ব্যবহার করা যেতে পারে এবং এটি ডেটা বিশ্লেষণের নতুনদের জন্য দরকারী৷
12। ফিফা বিশ্বকাপ
ফিফা বিশ্বকাপের ডেটাসেট হল ফিফা বিশ্বকাপের সাথে সম্পর্কিত ডেটার একটি সংগ্রহ যা প্রতি চার বছর অন্তর অনুষ্ঠিত হয়। এটি 1930 থেকে 2014 পর্যন্ত প্রতিটি বিশ্বকাপ টুর্নামেন্টের তথ্য রয়েছে।
এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:
- বছর - টুর্নামেন্টের বছর।
- দেশ - টুর্নামেন্টের আয়োজক দেশ।
- বিজয়ী - যে দল টুর্নামেন্ট জিতেছে।
- রানার্স-আপ - যে দলটি রানার্স-আপ হয়েছে।
- তৃতীয় - যে দলটি তৃতীয় স্থানে শেষ করেছে।
- চতুর্থ - যে দলটি চতুর্থ স্থানে শেষ করেছে।
- গোলস্কোরড - টুর্নামেন্টে মোট গোলের সংখ্যা।
- যোগ্য দল - টুর্নামেন্টের জন্য যোগ্যতা অর্জনকারী দলের মোট সংখ্যা।
- উপস্থিতি - ম্যাচগুলিতে অংশগ্রহণকারী মোট দর্শকের সংখ্যা।
ডেটাসেটটি সময়ের সাথে বিশ্বকাপের প্রবণতা বিশ্লেষণ করতে ব্যবহার করা যেতে পারে, যেমন অংশগ্রহণকারী দলের সংখ্যা বা গোলের সংখ্যার পরিবর্তন।
13. নিউ ইয়র্ক সিটি এয়ারবিএনবি ওপেন ডেটা
এই এক্সেল ডেটাসেট নিউ ইয়র্ক সিটিতে Airbnb তালিকা এবং মেট্রিক্স সম্পর্কে সর্বজনীন তথ্য নিয়ে গঠিত। 2019 নিউ ইয়র্ক সিটি Airbnb ওপেন ডেটাতে শহরের প্রায় 50,000 Airbnb তালিকার তথ্য রয়েছে এবং শহরের উপর ভাড়ার প্রভাব সম্পর্কে স্বচ্ছতা ও বোঝার জন্য নিউইয়র্ক সিটি সরকার জনসাধারণের জন্য উপলব্ধ করেছে।
ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:
- আইডি - প্রতিটি Airbnb তালিকার জন্য একটি অনন্য শনাক্তকারী।
- নাম - Airbnb তালিকার নাম।
- Host_id - Airbnb হোস্টের জন্য একটি অনন্য শনাক্তকারী।
- হোস্ট_নাম - Airbnb হোস্টের নাম।
- Neighbourhood_group - Airbnb তালিকার বরো।
- প্রতিবেশী - Airbnb তালিকার প্রতিবেশী।
- অক্ষাংশ - Airbnb তালিকার অক্ষাংশ।
- দ্রাঘিমাংশ - Airbnb তালিকার দ্রাঘিমাংশ।
- রুম_টাইপ - ভাড়ার জন্য উপলব্ধ রুমের ধরন (যেমন ব্যক্তিগত রুম, পুরো বাড়ি/অ্যাপ্ট, শেয়ার্ড রুম)।
- মূল্য - Airbnb তালিকা ভাড়া করার জন্য রাতের মূল্য।
14. ওয়ার্ল্ড হ্যাপিনেস রিপোর্ট
এই ডেটাসেটে 150 টিরও বেশি দেশের সুখের স্তরের তথ্য অন্তর্ভুক্ত রয়েছে, যেমন অর্থনৈতিক, সামাজিক এবং স্বাস্থ্যের কারণ যা সুখে অবদান রাখে। ডেটা এক্সপ্লোরেশন, ভিজ্যুয়ালাইজেশন, এবং রিগ্রেশন অ্যানালাইসিস অনুশীলন করার জন্য এটি ডেটা অ্যানালিটিক্স নতুনদের জন্য দরকারী।
এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:
- দেশের নাম - দেশের নাম।
- বছর - জরিপের বছর।
- জীবন মই - 0-10 স্কেলের উপর ভিত্তি করে গড় জীবন সন্তুষ্টি স্কোর।
- মাথাপিছু লগ জিডিপি - মাথাপিছু জিডিপির প্রাকৃতিক লগারিদম, ক্রয় ক্ষমতা সমতা (পিপিপি) এর জন্য স্থির 2017 আন্তর্জাতিক ডলারে সামঞ্জস্য করা হয়েছে।
- জন্মের সময় সুস্থ জীবন প্রত্যাশিত - পূর্ণ স্বাস্থ্যে বেঁচে থাকার জন্য প্রত্যাশিত বছরের সংখ্যা, দুর্বল স্বাস্থ্যের জন্য অতিবাহিত বছরের জন্য সামঞ্জস্য করা।
15। স্টকের মূল্য
এই ডেটাসেটে অ্যাপল, গুগল এবং অ্যামাজনের মতো বিভিন্ন কোম্পানির দৈনিক স্টক মূল্য অন্তর্ভুক্ত রয়েছে। এটি সময় সিরিজ বিশ্লেষণ অনুশীলন এবং ভবিষ্যতের স্টক মূল্য ভবিষ্যদ্বাণী করার জন্য দরকারী।
এই ডেটাসেটের ভেরিয়েবলগুলি:
- তারিখ - যে তারিখে স্টক মূল্য রেকর্ড করা হয়েছিল।
- খোলা - স্টক খোলার মূল্য.
- উচ্চ - ট্রেডিং দিনের সময় স্টক সর্বোচ্চ মূল্য.
- কম - ট্রেডিং দিনের সময় স্টকের সর্বনিম্ন মূল্য।
- ক্লোজ - স্টকের ক্লোজিং প্রাইস।
- Adj Close - স্টকের সামঞ্জস্যপূর্ণ সমাপনী মূল্য।
- আয়তন - দিনে লেনদেন হওয়া শেয়ারের সংখ্যা।
এই এক্সেল ডেটাসেটের জন্য সাধারণ অনুশীলন প্রশ্ন
সুপারস্টোর বিক্রয়
- দোকান দ্বারা উত্পন্ন মোট রাজস্ব কি?
- কোন শ্রেণীর পণ্য বিক্রয়ে সবচেয়ে বেশি অবদান রাখে?
- গত এক বছরে বিক্রির প্রবণতা কেমন ছিল?
- কোন অঞ্চলে সবচেয়ে বেশি বিক্রি এবং কোনটি সবচেয়ে কম?
- দোকানের গড় লাভ মার্জিন কত?
আইরিস
- ডেটাসেটে আইরিসের প্রতিটি প্রজাতির বন্টন কী?
- পাপড়ির দৈর্ঘ্য এবং পাপড়ি প্রস্থের মধ্যে পারস্পরিক সম্পর্ক কী?
- আইরিসের প্রতিটি প্রজাতির গড় সেপালের দৈর্ঘ্য কত?
- আইরিসের কোন প্রজাতির পাপড়ির ক্ষেত্রফল সবচেয়ে বেশি?
- আইরিসের প্রতিটি প্রজাতির জন্য কতটি পর্যবেক্ষণ রয়েছে?
টাইটানিক
- যাত্রীদের বেঁচে থাকার হার কত?
- যাত্রীদের গড় বয়স কত?
- পুরুষ ও মহিলা যাত্রীর অনুপাত কত?
- কোন শ্রেণীর যাত্রীদের বেঁচে থাকার হার সবচেয়ে বেশি ছিল?
- যাত্রীদের দেওয়া ভাড়ার বণ্টন কি?
ওয়াইন গুণমান
- পিএইচ এবং অ্যালকোহল সামগ্রীর মধ্যে পারস্পরিক সম্পর্ক কী?
- কোন ধরনের ওয়াইন (লাল বা সাদা) উচ্চতর মধ্যম মানের রেটিং আছে?
- প্রতিটি ধরণের ওয়াইনের জন্য মধ্যম উদ্বায়ী অম্লতা কী?
- ডেটাসেটে প্রতিটি ওয়াইন প্রকারের অনুপাত কত?
- প্রতিটি ওয়াইন ধরনের জন্য সাইট্রিক অ্যাসিড বিতরণ কি?
প্রাপ্তবয়স্ক আদমশুমারি আয়
- যারা $50K এর বেশি আয় করেন তাদের অনুপাত কত?
- যারা $50K এর বেশি আয় করেন তাদের গড় বয়স কত?
- বয়স এবং শিক্ষা স্তরের মধ্যে পারস্পরিক সম্পর্ক কি?
- $50K এর বেশি উপার্জনকারী পুরুষ এবং মহিলাদের অনুপাত কত?
- যারা $50K এর বেশি আয় করেন তাদের জন্য প্রতি সপ্তাহে কাজের মধ্যবর্তী ঘন্টা কত?
বোস্টন হাউজিং
- কক্ষের সংখ্যা এবং মালিক-অধিকৃত বাড়ির মধ্যম মানের মধ্যে পারস্পরিক সম্পর্ক কী?
- মালিক-অধিকৃত বাড়ির মধ্যম মানের সাথে কোন ভেরিয়েবলের সর্বোচ্চ সম্পর্ক রয়েছে?
- বাড়ির গড় বয়স কত?
- শহর অনুসারে ছাত্র-শিক্ষক অনুপাতের বন্টন কত?
- কোন শহরে মালিক-অধিকৃত বাড়ির গড় মান সবচেয়ে বেশি?
স্তন ক্যান্সার উইসকনসিন ডেটাসেট
- সৌম্য এবং ম্যালিগন্যান্ট টিউমারের অনুপাত কত?
- টিউমার ব্যাসার্ধ এবং ঘের মধ্যে পারস্পরিক সম্পর্ক কি?
- টিউমারের গড় মসৃণতা কত?
- টিউমারের অবতলতার বন্টন কি?
- টিউমারের মাঝারি এলাকা কি?
অনলাইন ক্রেতাদের ক্রয় অভিপ্রায়
- একটি ক্রয় করা দর্শকদের অনুপাত কি?
- ভিজিটরদের দ্বারা পরিদর্শন করা পৃষ্ঠার সংখ্যা বন্টন কি?
- ভিজিটরদের দ্বারা ওয়েবসাইটে ব্যয় করা গড় সময় কত?
- বাউন্স রেট এবং রাজস্বের মধ্যে পারস্পরিক সম্পর্ক কী?
- দর্শকদের দ্বারা ব্যবহৃত অপারেটিং সিস্টেমের বিতরণ কি?
ব্যাংক মার্কেটিং
- মেয়াদী আমানতে সদস্যতা নেওয়া লোকেদের অনুপাত কত?
- বয়স এবং ভারসাম্য মধ্যে পারস্পরিক সম্পর্ক কি?
- গ্রাহকদের কাজের ধরন বন্টন কি?
- কলের গড় সময়কাল কত?
- প্রতি মাসে করা কলের অনুপাত কত?
অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বই 2009 – 2019৷
- বইগুলোর গড় রেটিং কত?
- বইয়ের প্রাপ্ত রিভিউ সংখ্যার বন্টন কত?
- কোন বইয়ের দাম সবচেয়ে বেশি?
- বইয়ের রেটিং এবং দামের মধ্যে পারস্পরিক সম্পর্ক কী?
- বইয়ের ঘরানার বন্টন কি?
ফিফা বিশ্বকাপ
- প্রতি খেলায় গড় গোলের সংখ্যা কত?
- ড্রতে শেষ হওয়া গেমগুলির অনুপাত কত?
- কোন দেশ সবচেয়ে বেশি বিশ্বকাপ শিরোপা জিতেছে?
- টুর্নামেন্টে খেলোয়াড়দের গড় বয়স কত?
- প্রতিটি খেলার জন্য উপস্থিতির বন্টন কি?
নিউ ইয়র্ক সিটি এয়ারবিএনবি ওপেন ডেটা
- তালিকার গড় মূল্য কত?
- তালিকার জন্য উপলব্ধ রুম ধরনের বিতরণ কি?
- কোন আশেপাশের সবচেয়ে তালিকা আছে?
- পর্যালোচনার সংখ্যা এবং তালিকার দামের মধ্যে পারস্পরিক সম্পর্ক কী?
- তালিকার জন্য বাতিলকরণ নীতির বন্টন কি?
ওয়ার্ল্ড হ্যাপিনেস রিপোর্ট
- প্রতিটি দেশের জন্য সুখ স্কোর বিতরণ কি?
- কোন দেশে সর্বোচ্চ সুখের স্কোর আছে?
- মাথাপিছু জিডিপি এবং সুখের স্কোরের মধ্যে পারস্পরিক সম্পর্ক কী?
- সুখের জন্য অবদান রাখে এমন উপাদানগুলির বন্টন কী?
- পৃথিবীর কোন অঞ্চলে সুখের গড় গড় সর্বোচ্চ?
স্টকের মূল্য
- স্টকের দৈনিক গড় রিটার্ন কত?
- দৈনিক ট্রেডিং ভলিউম বন্টন কি? অ্যাভোকাডোর দাম
- অ্যাভোকাডোর গড় দাম কত?
- অঞ্চলভেদে গড় মূল্য বণ্টনকে কী বলে?
- কোন অঞ্চলে সর্বোচ্চ এবং সর্বনিম্ন গড় মূল্য রয়েছে?
- মোট আয়তন এবং গড় মূল্যের মধ্যে পারস্পরিক সম্পর্ক কী?
- বছরে মোট আয়তনের বন্টন কত?
সর্বশেষ ভাবনা
এক্সেল ডেটা অ্যানালিটিক্স নতুনদের জন্য বিস্তৃত সরঞ্জাম সরবরাহ করে এবং আপনি এই নিবন্ধে তালিকাভুক্ত এক্সেল ডেটাসেটগুলি ব্যবহার করে আপনার দক্ষতা উন্নত করতে পারেন।
উপরের প্রশ্নের উত্তর দেওয়ার জন্য আপনি বিভিন্ন ধরনের ভিজ্যুয়ালাইজেশন যেমন লাইন চার্ট, বার চার্ট, স্ক্যাটার প্লট, হিস্টোগ্রাম এবং পাই চার্ট তৈরি করতে পারেন।
এই নিবন্ধটির প্রধান চিত্রটিহ্যাকারনুন-এর এআই স্টেবল ডিফিউশন মডেলের মাধ্যমে তৈরি করা হয়েছে প্রম্পট 'এক্সেল ডেটাসেট' ব্যবহার করে।
আরও ডেটাসেট তালিকা: