paint-brush
ডেটা অ্যানালিটিক্স নতুনদের জন্য 15 এক্সেল ডেটাসেটদ্বারা@datasets
231,822 পড়া
231,822 পড়া

ডেটা অ্যানালিটিক্স নতুনদের জন্য 15 এক্সেল ডেটাসেট

দ্বারা Open Datasets Compiled by HackerNoon15m2023/03/19
Read on Terminal Reader
Read this story w/o Javascript

অতিদীর্ঘ; পড়তে

এক্সেল ডেটা বিশ্লেষণের জন্য একটি অপরিহার্য হাতিয়ার এবং সঠিক ডেটাসেট এবং কৌশলগুলির সাথে, নতুনরা অন্তর্দৃষ্টি উন্মোচন করতে এবং জ্ঞাত সিদ্ধান্ত নিতে শিখতে পারে। এই নিবন্ধে, আমরা ডেটা অ্যানালিটিক্স নতুনদের জন্য 15টি এক্সেল ডেটাসেটের একটি তালিকা সংকলন করেছি। এই এক্সেল ডেটাসেটগুলি আর্থিক বিশ্লেষণ, বাজার বিশ্লেষণ এবং সময় সিরিজ বিশ্লেষণের মতো বিষয়গুলিকে কভার করে, বাস্তব-বিশ্বের পরিস্থিতিতে অন্তর্দৃষ্টি পেতে ব্যবহার করা যেতে পারে।
featured image - ডেটা অ্যানালিটিক্স নতুনদের জন্য 15 এক্সেল ডেটাসেট
Open Datasets Compiled by HackerNoon HackerNoon profile picture

এক্সেল ডেটা বিশ্লেষণের জন্য একটি অপরিহার্য হাতিয়ার এবং সঠিক ডেটাসেট এবং কৌশলগুলির সাহায্যে, নতুনরা অন্তর্দৃষ্টি উন্মোচন করতে এবং জ্ঞাত সিদ্ধান্ত নিতে শিখতে পারে। এর স্বজ্ঞাত ইন্টারফেস এবং শক্তিশালী কার্যকারিতা ব্যবহারকারীদের ডেটা ম্যানিপুলেশন, ডেটা ভিজ্যুয়ালাইজেশন এবং পরিসংখ্যানগত বিশ্লেষণের মতো বিস্তৃত প্রক্রিয়াগুলি সম্পাদন করতে দেয়।

"এক্সেল ডেটাসেট" কি?

এক্সেল ডেটাসেটগুলি হল ডেটার সংগ্রহ যা একটি এক্সেল স্প্রেডশীটে সংরক্ষিত এবং সংগঠিত হয়, যা একটি সাধারণভাবে ব্যবহৃত সফ্টওয়্যার যা ব্যবহারকারীদের একটি কাঠামোগত বিন্যাসে ডেটা তৈরি, ম্যানিপুলেট এবং বিশ্লেষণ করতে সক্ষম করে। এই ডেটাসেট দুটি প্রধান ফর্ম্যাটে আসতে পারে: Excel(.xlsx) এবং কমা বিভাজিত মান (CSV)। এক্সেল ফরম্যাট সূত্র এবং ভিজ্যুয়ালাইজেশনের ব্যবহার সহ জটিল ডেটা সংগঠিত এবং বিশ্লেষণের জন্য আরও উন্নত বৈশিষ্ট্য প্রদান করে, অন্যদিকে CSV একটি সহজ ফর্ম্যাট অফার করে যা বিস্তৃত সফ্টওয়্যার অ্যাপ্লিকেশনের সাথে সামঞ্জস্যপূর্ণ, যা শেয়ার করা সহজ করে তোলে। বিভিন্ন প্রোগ্রামের মধ্যে ডেটা।


এই নিবন্ধে, আমরা ডেটা অ্যানালিটিক্স বিগিনারদের জন্য 15টি এক্সেল ডেটাসেটের একটি তালিকা সংকলন করেছি। এই এক্সেল ডেটাসেটগুলি আর্থিক বিশ্লেষণ, বাজার বিশ্লেষণ এবং সময় সিরিজ বিশ্লেষণের মতো বিষয়গুলিকে কভার করে, নতুনরা বাস্তব-বিশ্বের পরিস্থিতিতে অন্তর্দৃষ্টি অর্জনের সাথে সাথে ডেটা ক্লিনিং, পিভট টেবিল এবং চার্টের মতো ডেটা বিশ্লেষণ কৌশলগুলি অনুশীলন করতে পারে।

ডেটা অ্যানালিটিক্স নতুনদের জন্য এক্সেল ডেটাসেটের তালিকা

  1. সুপারস্টোর বিক্রয়
  2. আইরিস
  3. টাইটানিক
  4. ওয়াইন গুণমান
  5. প্রাপ্তবয়স্ক আদমশুমারি আয়
  6. বোস্টন হাউজিং
  7. স্তন ক্যান্সার উইসকনসিন ডেটাসেট
  8. অনলাইন ক্রেতাদের ক্রয় অভিপ্রায়
  9. ব্যাংক মার্কেটিং
  10. অ্যাভোকাডোর দাম
  11. অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বই 2009 – 2019৷
  12. ফিফা বিশ্বকাপ
  13. নিউ ইয়র্ক সিটি এয়ারবিএনবি ওপেন ডেটা
  14. ওয়ার্ল্ড হ্যাপিনেস রিপোর্ট
  15. স্টকের মূল্য

1. সুপারস্টোর বিক্রয়

সুপারস্টোর বিক্রয় ডেটা একটি কাল্পনিক খুচরা কোম্পানির জন্য পণ্য, অর্ডার এবং গ্রাহকদের তথ্য সহ বিক্রয় ডেটা সরবরাহ করে। এটি প্রায়ই ডেটা বিশ্লেষণ অনুশীলন করতে ব্যবহৃত হয়।


এই এক্সেল ডেটাসেটে নিম্নলিখিত ভেরিয়েবলগুলি রয়েছে:


  • অর্ডার আইডি - প্রতিটি অর্ডারের জন্য একটি অনন্য শনাক্তকারী।
  • গ্রাহক আইডি - প্রতিটি গ্রাহকের জন্য একটি অনন্য শনাক্তকারী।
  • অর্ডারের তারিখ - অর্ডার বসানোর তারিখ।
  • জাহাজের তারিখ - অর্ডারটি পাঠানোর তারিখ।
  • শিপ মোড - অর্ডারের জন্য শিপিং মোড (যেমন স্ট্যান্ডার্ড, একই দিন)।
  • সেগমেন্ট - গ্রাহক সেগমেন্ট (যেমন ভোক্তা, কর্পোরেট, হোম অফিস)।
  • অঞ্চল - গ্রাহক যে অঞ্চলে অবস্থিত (যেমন পশ্চিম, মধ্য, পূর্ব)।
  • বিভাগ - ক্রয়কৃত পণ্যের বিভাগ (যেমন আসবাবপত্র, প্রযুক্তি, অফিস সরবরাহ)।
  • সাব-ক্যাটাগরি - কেনা পণ্যের সাব-ক্যাটাগরি (যেমন চেয়ার, ডেস্কটপ, পেপার)।
  • পণ্যের নাম - কেনা পণ্যের নাম।
  • বিক্রয় - ক্রয়কৃত পণ্যের বিক্রয় আয়।
  • পরিমাণ - কেনা পণ্যের ইউনিট সংখ্যা।
  • ডিসকাউন্ট - ক্রয়কৃত পণ্যে প্রযোজ্য ডিসকাউন্ট।
  • লাভ - ক্রয়কৃত পণ্য দ্বারা উত্পন্ন লাভ।


2. আইরিস

এই ডেটাসেটে সেপালের দৈর্ঘ্য, সেপালের প্রস্থ, পাপড়ির দৈর্ঘ্য এবং 150টি আইরিস ফুলের পাপড়ির প্রস্থের পরিমাপ রয়েছে, যা 3টি ভিন্ন প্রজাতির অন্তর্ভুক্ত: সেটোসা, ভার্সিকলার এবং ভার্জিনিকা। আইরিস ডেটাসেটে 150টি সারি এবং 5টি কলাম রয়েছে, যা প্রতিটি ফুলের প্রজাতির জন্য একটি কলাম সহ ডেটাফ্রেম হিসাবে সংরক্ষণ করা হয়।


এর ভেরিয়েবলের বর্ণনার মধ্যে রয়েছে:


  • Sepal.Length - sepal.length সেপালের দৈর্ঘ্যকে সেন্টিমিটারে উপস্থাপন করে।
  • Sepal.Width - sepal.width সেপালের প্রস্থকে সেন্টিমিটারে উপস্থাপন করে।
  • Petal.Length - পাপড়ির দৈর্ঘ্য সেন্টিমিটারে পাপড়ির দৈর্ঘ্যকে প্রতিনিধিত্ব করে।
  • প্রজাতি - প্রজাতির পরিবর্তনশীল তিনটি সম্ভাব্য মান সহ আইরিস ফুলের প্রজাতিকে প্রতিনিধিত্ব করে: সেটোসা, ভার্সিকলার এবং ভার্জিনিকা।


এক্সেলের আইরিস ডেটাসেটের একটি ব্যবহার হল আইরিস ফুলের বিভিন্ন বৈশিষ্ট্যের মধ্যে সম্পর্ক বিশ্লেষণ করা এবং বৈশিষ্ট্যের মানগুলির উপর ভিত্তি করে ফুলের প্রজাতিকে শ্রেণীবদ্ধ করা। পারস্পরিক সম্পর্ক বিশ্লেষণ, অনুমানমূলক পরিসংখ্যান এবং ভবিষ্যদ্বাণীমূলক মডেলিংয়ের মতো কৌশলগুলি ব্যবহার করে এটি করা যেতে পারে।


আপনি ক্লিক করে কাগল-এ এই এক্সেল ডেটাসেটটি ডাউনলোড করতে পারেন এখানে .

3. টাইটানিক

এই জনপ্রিয় ওপেন-সোর্স ডেটাসেটটি 15 এপ্রিল, 1912 এ ডুবে যাওয়ার সময় টাইটানিক জাহাজে থাকা যাত্রীদের তথ্য সরবরাহ করে। এটি ডেটা পরিস্কার এবং প্রিপ্রসেসিং, বর্ণনামূলক পরিসংখ্যান, ডেটা ভিজ্যুয়ালাইজেশন এবং ভবিষ্যদ্বাণীমূলক মডেলিং-এ আগ্রহী ডেটা বিশ্লেষণ নতুনদের দ্বারা ব্যবহার করা যেতে পারে।

ডেটাসেটে অন্তর্ভুক্ত কিছু ভেরিয়েবল:


  • প্যাসেঞ্জারআইডি - প্রতিটি যাত্রীর জন্য একটি অনন্য শনাক্তকারী।
  • বেঁচে গেছে - এটি দেখায় যে যাত্রী বেঁচে আছে কি না (0 = না, 1 = হ্যাঁ)।
  • Pclass - একজন যাত্রীর শ্রেণী (1 = 1ম, 2 = 2য়, 3 = 3য়)।
  • নাম - একজন যাত্রীর নাম।
  • লিঙ্গ - একজন যাত্রীর লিঙ্গ।
  • বয়স - একজন যাত্রীর বয়স।
  • SibSp - জাহাজে থাকা ভাইবোন/স্বামীর সংখ্যা।
  • পারচ - জাহাজে থাকা বাবা-মা/সন্তানের সংখ্যা।
  • টিকিট - টিকিটের নম্বর।
  • ভাড়া - টিকিটের জন্য দেওয়া ভাড়া।
  • কেবিন - কেবিন নম্বর।
  • এমবার্কড - যাত্রার বন্দর (C = Cherbourg, Q = Queenstown, S = Southampton)।

4. ওয়াইন গুণমান

ওয়াইন কোয়ালিটির ডেটাসেটে লাল এবং সাদা ওয়াইনের নমুনার তথ্য রয়েছে। এই ডেটাসেটের লক্ষ্য হল পিএইচ, ঘনত্ব, অ্যালকোহল সামগ্রী এবং সাইট্রিক অ্যাসিড সামগ্রীর মতো রাসায়নিক বৈশিষ্ট্যের উপর ভিত্তি করে ওয়াইনের গুণমানকে শ্রেণীবদ্ধ করা।


এই এক্সেল ডেটাসেটে অন্তর্ভুক্ত সাধারণ ভেরিয়েবল:


  • স্থির অম্লতা - ওয়াইনে স্থির অ্যাসিডের সংখ্যা, g/dm^3 এ প্রকাশ করা হয়।
  • উদ্বায়ী অম্লতা - ওয়াইনে উদ্বায়ী অ্যাসিডের সংখ্যা, g/dm^3 এ প্রকাশ করা হয়।
  • সাইট্রিক অ্যাসিড - ওয়াইনে সাইট্রিক অ্যাসিডের পরিমাণ, g/dm^3 এ প্রকাশ করা হয়।
  • অবশিষ্ট চিনি - ওয়াইনে অবশিষ্ট চিনির পরিমাণ, g/dm^3 এ প্রকাশ করা হয়
  • ক্লোরাইড - ওয়াইনে ক্লোরাইডের পরিমাণ, g/dm^3 এ প্রকাশ করা হয়।
  • বিনামূল্যে সালফার ডাই অক্সাইড - ওয়াইনে বিনামূল্যে সালফার ডাই অক্সাইডের পরিমাণ, mg/dm^3 এ প্রকাশ করা হয়।
  • মোট সালফার ডাই অক্সাইড - ওয়াইনে মোট সালফার ডাই অক্সাইডের পরিমাণ, mg/dm^3 এ প্রকাশ করা হয়।
  • ঘনত্ব - ওয়াইনের ঘনত্ব, g/cm^3 এ প্রকাশ করা হয়।
  • pH - ওয়াইনের pH স্তর।
  • সালফেটস - ওয়াইনে সালফেটের সংখ্যা, g/dm^3 এ প্রকাশ করা হয়।
  • অ্যালকোহল - ওয়াইনের অ্যালকোহল সামগ্রী, % ভলিউমে প্রকাশ করা হয়েছে।
  • গুণমান - ওয়াইনের মানের রেটিং, 0 থেকে 10 এর স্কেলে।

5. প্রাপ্তবয়স্ক আদমশুমারি আয়

এই এক্সেল ডেটাসেট হল মার্কিন যুক্তরাষ্ট্রে বসবাসকারী ব্যক্তিদের সম্পর্কে তথ্যের একটি সংগ্রহ, যা 1994 সালের আদমশুমারি ডাটাবেস থেকে নেওয়া হয়েছে। এটি প্রতিটি ব্যক্তির সম্পর্কে বিভিন্ন জনসংখ্যাগত, সামাজিক এবং অর্থনৈতিক বৈশিষ্ট্য ধারণ করে।


এই ডেটাসেটে অন্তর্ভুক্ত কিছু বৈশিষ্ট্য:


  • বয়স

  • ওয়ার্কক্লাস - প্রাইভেট, সেলফ-এমপি-নট-ইনক, সেলফ-এমপি-ইঙ্ক, ফেডারেল-গভ, লোকাল-গভ, স্টেট-গভ, বিনা বেতন, কখনও-কাজ করা হয়নি।

  • fnlwgt

  • শিক্ষা - স্নাতক, কিছু-কলেজ, 11 তম, এইচএস-গ্রেড, প্রফেসর-স্কুল, Assoc-acdm, Assoc-voc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool.

  • শিক্ষা-সংখ্যা

  • বৈবাহিক-স্থিতি - বিবাহিত-সিভি-পত্নী, তালাকপ্রাপ্ত, কখনও বিবাহিত নয়, বিচ্ছিন্ন, বিধবা, বিবাহিত-স্বামী-অনুপস্থিত, বিবাহিত-এএফ-পত্নী।

  • পেশা - টেক-সাপোর্ট, ক্রাফ্ট-মেরামত, অন্যান্য-পরিষেবা, বিক্রয়, নির্বাহী-ব্যবস্থাপক, প্রফেসর-স্পেশালিটি, হ্যান্ডলার-ক্লিনার, মেশিন-অপ-ইন্সপক্ট, অ্যাডএম-ক্লারিক্যাল, ফার্মিং-ফিশিং, পরিবহন-চলন্ত, ব্যক্তিগত-হাউস- সার্ভ, প্রতিরক্ষামূলক-সার্ভ, সশস্ত্র-বাহিনী।

  • সম্পর্ক - স্ত্রী, নিজের সন্তান, স্বামী, পরিবারে নয়, অন্য আত্মীয়, অবিবাহিত।

  • জাতি - সাদা, এশিয়ান-প্যাক-আইল্যান্ডার, আমের-ইন্ডিয়ান-এস্কিমো, অন্যান্য, কালো।

  • লিঙ্গ - পুরুষ বা মহিলা।


"আয়" অ্যাট্রিবিউট হল টার্গেট ভেরিয়েবল এবং ডেটাসেটটি ডেটা অ্যানালিটিক্স নতুনদের জন্য খুবই উপযোগী।


6. বোস্টন হাউজিং

বোস্টন হাউজিং ডেটাসেটে বোস্টন, ম্যাসাচুসেটস এলাকার আবাসন সম্পর্কিত তথ্য রয়েছে। এতে প্রায় 506টি সারি এবং 14টি কলাম ডেটা রয়েছে।


ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:


  • CRIM - শহর অনুসারে মাথাপিছু অপরাধের হার।
  • ZN - আবাসিক জমির অনুপাত 25,000 বর্গফুটের বেশি লটের জন্য জোন করা হয়েছে।
  • INDUS - শহর প্রতি অ-খুচরা ব্যবসার একর অনুপাত।
  • CHAS - চার্লস রিভার ডামি পরিবর্তনশীল (= 1 যদি ট্র্যাক্ট নদীকে আবদ্ধ করে; অন্যথায় 0)।
  • NOX - নাইট্রিক অক্সাইড ঘনত্ব (প্রতি 10 মিলিয়ন অংশ)।
  • RM - প্রতি বাসস্থানে ঘরের গড় সংখ্যা।
  • AGE - 1940 সালের আগে নির্মিত মালিক-অধিকৃত ইউনিটগুলির অনুপাত।
  • DIS - পাঁচটি বোস্টন কর্মসংস্থান কেন্দ্রের ওজনযুক্ত দূরত্ব।
  • RAD - রেডিয়াল হাইওয়েতে অ্যাক্সেসযোগ্যতার সূচক।
  • ট্যাক্স - $10,000 প্রতি পূর্ণ-মূল্যের সম্পত্তি করের হার।
  • PTRATIO - শহর অনুসারে ছাত্র-শিক্ষক অনুপাত।
  • B - 1000(Bk - 0.63)^2 যেখানে -Bk হল শহর অনুসারে কালোদের অনুপাত।
  • LSTAT - জনসংখ্যার শতাংশ নিম্ন অবস্থা।
  • MEDV - $1000 এর মধ্যে মালিক-অধিকৃত বাড়ির গড় মান।


এই ডেটাসেটটি ডেটা বিশ্লেষণে ব্যবহার করা যেতে পারে বাড়ির দামের বিভিন্ন বৈশিষ্ট্য এবং হাউজিং মার্কেটের মধ্যে সম্পর্ক বিশ্লেষণ করতে, ডেটা বিশ্লেষণ করতে এবং অন্তর্দৃষ্টি তৈরি করতে।

7. স্তন ক্যান্সার উইসকনসিন ডেটাসেট

এই এক্সেল ডেটাসেটটি স্তন ক্যান্সারের টিউমার সম্পর্কে তথ্য নিয়ে গঠিত এবং প্রাথমিকভাবে ডাঃ উইলিয়াম এইচ. ওলবার্গ তৈরি করেছিলেন। ডেটাসেটটি গবেষক এবং মেশিন লার্নিং অনুশীলনকারীদের টিউমারগুলিকে ম্যালিগন্যান্ট (ক্যান্সারযুক্ত) বা সৌম্য (অ-ক্যান্সার) হিসাবে শ্রেণীবদ্ধ করতে সহায়তা করার জন্য তৈরি করা হয়েছিল।


এই ডেটাসেটে অন্তর্ভুক্ত কিছু ভেরিয়েবল:


  • আইডি নাম্বার
  • রোগ নির্ণয় (M = ম্যালিগন্যান্ট, B = সৌম্য)।
  • ব্যাসার্ধ (কেন্দ্র থেকে ঘেরের বিন্দু পর্যন্ত দূরত্বের গড়)।
  • টেক্সচার (ধূসর-স্কেল মানগুলির আদর্শ বিচ্যুতি)।
  • পরিধি
  • এলাকা
  • মসৃণতা (ব্যাসার্ধের দৈর্ঘ্যের স্থানীয় পরিবর্তন)।
  • কম্প্যাক্টনেস (ঘের^2 / এলাকা - 1.0)।
  • অবতলতা (কনট্যুরের অবতল অংশের তীব্রতা)।
  • অবতল বিন্দু (কনট্যুরের অবতল অংশের সংখ্যা)।
  • প্রতিসাম্য
  • ফ্র্যাক্টাল ডাইমেনশন ("কোস্টলাইন অ্যাপ্রোক্সিমেশন" - 1)।

8. অনলাইন ক্রেতাদের ক্রয় অভিপ্রায়

অনলাইন শপার্স পারচেজিং ইনটেনশন ডেটাসেট হল অনলাইন কেনাকাটার প্রেক্ষাপটে কেনাকাটার ধরণ এবং ভোক্তাদের আচরণ সম্পর্কিত ডেটার একটি সংগ্রহ। এটি অনলাইন ক্রেতাদের সমীক্ষা পরিচালনা করে এবং তাদের প্রতিক্রিয়া থেকে ডেটা সংগ্রহ করে তৈরি করা হয়েছিল।


এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:


  • প্রশাসনিক - প্রশাসনিক উদ্দেশ্যে ব্যবহারকারী দ্বারা পরিদর্শন করা ওয়েবসাইটের পৃষ্ঠার সংখ্যা
  • প্রশাসনিক_সময়কাল - ওয়েবসাইটের প্রশাসনিক পৃষ্ঠাগুলিতে ব্যবহারকারীর দ্বারা ব্যয় করা মোট সময়
  • তথ্যমূলক - তথ্যগত উদ্দেশ্যে ব্যবহারকারী দ্বারা পরিদর্শন করা ওয়েবসাইটের পৃষ্ঠার সংখ্যা
  • তথ্যগত_সময়কাল - ওয়েবসাইটের তথ্যমূলক পৃষ্ঠাগুলিতে ব্যবহারকারীর দ্বারা ব্যয় করা মোট সময়
  • পণ্য সম্পর্কিত - পণ্য-সম্পর্কিত উদ্দেশ্যে ব্যবহারকারী দ্বারা পরিদর্শন করা ওয়েবসাইটের পৃষ্ঠার সংখ্যা
  • ProductRelated_Duration - ওয়েবসাইটের পণ্য-সম্পর্কিত পৃষ্ঠাগুলিতে ব্যবহারকারীর দ্বারা ব্যয় করা মোট সময়
  • BounceRates - দর্শকদের শতাংশ যারা ওয়েবসাইটে প্রবেশ করে এবং অন্য কোনো পৃষ্ঠা না দেখে চলে যায়
  • ExitRates - দর্শকদের শতকরা শতাংশ যারা ওয়েবসাইটটি দেখার পর একটি নির্দিষ্ট পৃষ্ঠা থেকে প্রস্থান করে
  • PageValues - লেনদেনের আগে ব্যবহারকারী দ্বারা দেখা পৃষ্ঠাগুলির গড় মান৷
  • বিশেষ দিবস - একটি বিশেষ দিনে পরিদর্শনের নৈকট্য (যেমন, মা দিবস, ভালোবাসা দিবস, ইত্যাদি)


এই এক্সেল ডেটাসেটটি ই-কমার্স এবং অনলাইন মার্কেটিং সম্পর্কিত গবেষণা এবং বিশ্লেষণে ব্যবহৃত হয়। এটি ব্যবসাগুলিকে সেই কারণগুলি বুঝতে সাহায্য করতে পারে যা গ্রাহকের আচরণকে চালিত করে এবং ডেটা বিশ্লেষণের নতুনদের জন্যও এটি কার্যকর।

9. ব্যাংক মার্কেটিং

এই জনপ্রিয় ডেটাসেটটি একটি পর্তুগিজ ব্যাংকিং প্রতিষ্ঠানের জন্য বিপণন প্রচারাভিযানগুলি অধ্যয়ন করার জন্য। এটিতে ব্যাঙ্কের বিপণন প্রচারাভিযানের পাশাপাশি গ্রাহক জনসংখ্যা এবং অর্থনৈতিক সূচকগুলি সম্পর্কে তথ্য রয়েছে৷


এই ডেটাসেটে অন্তর্ভুক্ত কিছু ভেরিয়েবল:


  • বয়স - গ্রাহকের বয়স (সাংখ্যিক)
  • চাকরি - কাজের ধরন
  • বৈবাহিক - বৈবাহিক অবস্থা
  • শিক্ষা - শিক্ষার স্তর
  • ডিফল্ট - ডিফল্ট ক্রেডিট আছে?
  • ব্যালেন্স - গড় বার্ষিক ব্যালেন্স, ইউরোতে।
  • হাউজিং - একটি আবাসন ঋণ আছে?
  • ঋণ - একটি ব্যক্তিগত ঋণ আছে?
  • যোগাযোগ - যোগাযোগ যোগাযোগের ধরন।
  • দিন - মাসের দিন যোগাযোগ.
  • আউটপুট ভেরিয়েবলটি বোঝায় যে গ্রাহক ব্যাঙ্কের সাথে যোগাযোগ করার পরে একটি মেয়াদী আমানতে সাবস্ক্রাইব করেছেন কিনা।

10. অ্যাভোকাডোর দাম

অ্যাভোকাডো প্রাইস ডেটাসেট মার্কিন যুক্তরাষ্ট্রে অ্যাভোকাডোর দামের সাথে সম্পর্কিত ডেটা নিয়ে গঠিত। হ্যাস অ্যাভোকাডো বোর্ড এবং ইউনাইটেড স্টেটস ডিপার্টমেন্ট অফ এগ্রিকালচার (USDA) এর মতো বিভিন্ন উত্স থেকে ডেটা সংগ্রহ করা হয়েছে।


এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:


  • তারিখ - পর্যবেক্ষণের তারিখ।
  • গড় মূল্য - একটি একক অ্যাভোকাডোর গড় মূল্য।
  • মোট আয়তন - মোট অ্যাভোকাডো বিক্রি হয়েছে।
  • PLU (প্রাইস লুক-আপ) কোড - একটি নির্দিষ্ট ধরনের অ্যাভোকাডো সনাক্ত করতে ব্যবহৃত একটি কোড।
  • প্রকার - প্রচলিত বা জৈব
  • অঞ্চল - পর্যবেক্ষণের শহর বা অঞ্চল।


এটি খাদ্য শিল্পের ব্যবসার দ্বারা অ্যাভোকাডো কেনা এবং বিক্রির বিষয়ে কৌশলগত সিদ্ধান্ত নিতেও ব্যবহার করা যেতে পারে।

11. অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বই 2009 - 2019৷

এই Excel ডেটাসেটটি 2009 থেকে 2019 সালের মধ্যে প্রতি বছরের জন্য Amazon-এ সেরা 50টি সর্বাধিক বিক্রিত বই সম্পর্কিত ডেটার একটি সংগ্রহ৷


ডেটাসেটে নিম্নলিখিত ভেরিয়েবলগুলি রয়েছে:


  • নাম - বইয়ের শিরোনাম।
  • লেখক - বইটির লেখকের নাম।
  • ইউজার রেটিং - অ্যামাজন ব্যবহারকারীদের দেওয়া বইটির গড় রেটিং।
  • রিভিউ - অ্যামাজনে বইটির মোট রিভিউর সংখ্যা।
  • মূল্য- বইটির মূল্য US ডলারে।
  • সাল - যে বছর বইটি প্রকাশিত হয়েছিল।
  • ধরণ - বইয়ের ধরণ।


অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বইগুলি এক দশক ধরে অ্যামাজনে বই বিক্রির প্রবণতা অন্বেষণ করতে ব্যবহার করা যেতে পারে এবং এটি ডেটা বিশ্লেষণের নতুনদের জন্য দরকারী৷


12। ফিফা বিশ্বকাপ

ফিফা বিশ্বকাপের ডেটাসেট হল ফিফা বিশ্বকাপের সাথে সম্পর্কিত ডেটার একটি সংগ্রহ যা প্রতি চার বছর অন্তর অনুষ্ঠিত হয়। এটি 1930 থেকে 2014 পর্যন্ত প্রতিটি বিশ্বকাপ টুর্নামেন্টের তথ্য রয়েছে।


এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:


  • বছর - টুর্নামেন্টের বছর।
  • দেশ - টুর্নামেন্টের আয়োজক দেশ।
  • বিজয়ী - যে দল টুর্নামেন্ট জিতেছে।
  • রানার্স-আপ - যে দলটি রানার্স-আপ হয়েছে।
  • তৃতীয় - যে দলটি তৃতীয় স্থানে শেষ করেছে।
  • চতুর্থ - যে দলটি চতুর্থ স্থানে শেষ করেছে।
  • গোলস্কোরড - টুর্নামেন্টে মোট গোলের সংখ্যা।
  • যোগ্য দল - টুর্নামেন্টের জন্য যোগ্যতা অর্জনকারী দলের মোট সংখ্যা।
  • উপস্থিতি - ম্যাচগুলিতে অংশগ্রহণকারী মোট দর্শকের সংখ্যা।


ডেটাসেটটি সময়ের সাথে বিশ্বকাপের প্রবণতা বিশ্লেষণ করতে ব্যবহার করা যেতে পারে, যেমন অংশগ্রহণকারী দলের সংখ্যা বা গোলের সংখ্যার পরিবর্তন।

13. নিউ ইয়র্ক সিটি এয়ারবিএনবি ওপেন ডেটা

এই এক্সেল ডেটাসেট নিউ ইয়র্ক সিটিতে Airbnb তালিকা এবং মেট্রিক্স সম্পর্কে সর্বজনীন তথ্য নিয়ে গঠিত। 2019 নিউ ইয়র্ক সিটি Airbnb ওপেন ডেটাতে শহরের প্রায় 50,000 Airbnb তালিকার তথ্য রয়েছে এবং শহরের উপর ভাড়ার প্রভাব সম্পর্কে স্বচ্ছতা ও বোঝার জন্য নিউইয়র্ক সিটি সরকার জনসাধারণের জন্য উপলব্ধ করেছে।


ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:


  • আইডি - প্রতিটি Airbnb তালিকার জন্য একটি অনন্য শনাক্তকারী।
  • নাম - Airbnb তালিকার নাম।
  • Host_id - Airbnb হোস্টের জন্য একটি অনন্য শনাক্তকারী।
  • হোস্ট_নাম - Airbnb হোস্টের নাম।
  • Neighbourhood_group - Airbnb তালিকার বরো।
  • প্রতিবেশী - Airbnb তালিকার প্রতিবেশী।
  • অক্ষাংশ - Airbnb তালিকার অক্ষাংশ।
  • দ্রাঘিমাংশ - Airbnb তালিকার দ্রাঘিমাংশ।
  • রুম_টাইপ - ভাড়ার জন্য উপলব্ধ রুমের ধরন (যেমন ব্যক্তিগত রুম, পুরো বাড়ি/অ্যাপ্ট, শেয়ার্ড রুম)।
  • মূল্য - Airbnb তালিকা ভাড়া করার জন্য রাতের মূল্য।

14. ওয়ার্ল্ড হ্যাপিনেস রিপোর্ট

এই ডেটাসেটে 150 টিরও বেশি দেশের সুখের স্তরের তথ্য অন্তর্ভুক্ত রয়েছে, যেমন অর্থনৈতিক, সামাজিক এবং স্বাস্থ্যের কারণ যা সুখে অবদান রাখে। ডেটা এক্সপ্লোরেশন, ভিজ্যুয়ালাইজেশন, এবং রিগ্রেশন অ্যানালাইসিস অনুশীলন করার জন্য এটি ডেটা অ্যানালিটিক্স নতুনদের জন্য দরকারী।


এই ডেটাসেটের কিছু ভেরিয়েবলের মধ্যে রয়েছে:


  • দেশের নাম - দেশের নাম।
  • বছর - জরিপের বছর।
  • জীবন মই - 0-10 স্কেলের উপর ভিত্তি করে গড় জীবন সন্তুষ্টি স্কোর।
  • মাথাপিছু লগ জিডিপি - মাথাপিছু জিডিপির প্রাকৃতিক লগারিদম, ক্রয় ক্ষমতা সমতা (পিপিপি) এর জন্য স্থির 2017 আন্তর্জাতিক ডলারে সামঞ্জস্য করা হয়েছে।
  • জন্মের সময় সুস্থ জীবন প্রত্যাশিত - পূর্ণ স্বাস্থ্যে বেঁচে থাকার জন্য প্রত্যাশিত বছরের সংখ্যা, দুর্বল স্বাস্থ্যের জন্য অতিবাহিত বছরের জন্য সামঞ্জস্য করা।

15। স্টকের মূল্য

এই ডেটাসেটে অ্যাপল, গুগল এবং অ্যামাজনের মতো বিভিন্ন কোম্পানির দৈনিক স্টক মূল্য অন্তর্ভুক্ত রয়েছে। এটি সময় সিরিজ বিশ্লেষণ অনুশীলন এবং ভবিষ্যতের স্টক মূল্য ভবিষ্যদ্বাণী করার জন্য দরকারী।


এই ডেটাসেটের ভেরিয়েবলগুলি:


  • তারিখ - যে তারিখে স্টক মূল্য রেকর্ড করা হয়েছিল।
  • খোলা - স্টক খোলার মূল্য.
  • উচ্চ - ট্রেডিং দিনের সময় স্টক সর্বোচ্চ মূল্য.
  • কম - ট্রেডিং দিনের সময় স্টকের সর্বনিম্ন মূল্য।
  • ক্লোজ - স্টকের ক্লোজিং প্রাইস।
  • Adj Close - স্টকের সামঞ্জস্যপূর্ণ সমাপনী মূল্য।
  • আয়তন - দিনে লেনদেন হওয়া শেয়ারের সংখ্যা।


এই এক্সেল ডেটাসেটের জন্য সাধারণ অনুশীলন প্রশ্ন

সুপারস্টোর বিক্রয়

  • দোকান দ্বারা উত্পন্ন মোট রাজস্ব কি?
  • কোন শ্রেণীর পণ্য বিক্রয়ে সবচেয়ে বেশি অবদান রাখে?
  • গত এক বছরে বিক্রির প্রবণতা কেমন ছিল?
  • কোন অঞ্চলে সবচেয়ে বেশি বিক্রি এবং কোনটি সবচেয়ে কম?
  • দোকানের গড় লাভ মার্জিন কত?

আইরিস

  • ডেটাসেটে আইরিসের প্রতিটি প্রজাতির বন্টন কী?
  • পাপড়ির দৈর্ঘ্য এবং পাপড়ি প্রস্থের মধ্যে পারস্পরিক সম্পর্ক কী?
  • আইরিসের প্রতিটি প্রজাতির গড় সেপালের দৈর্ঘ্য কত?
  • আইরিসের কোন প্রজাতির পাপড়ির ক্ষেত্রফল সবচেয়ে বেশি?
  • আইরিসের প্রতিটি প্রজাতির জন্য কতটি পর্যবেক্ষণ রয়েছে?

টাইটানিক

  • যাত্রীদের বেঁচে থাকার হার কত?
  • যাত্রীদের গড় বয়স কত?
  • পুরুষ ও মহিলা যাত্রীর অনুপাত কত?
  • কোন শ্রেণীর যাত্রীদের বেঁচে থাকার হার সবচেয়ে বেশি ছিল?
  • যাত্রীদের দেওয়া ভাড়ার বণ্টন কি?

ওয়াইন গুণমান

  • পিএইচ এবং অ্যালকোহল সামগ্রীর মধ্যে পারস্পরিক সম্পর্ক কী?
  • কোন ধরনের ওয়াইন (লাল বা সাদা) উচ্চতর মধ্যম মানের রেটিং আছে?
  • প্রতিটি ধরণের ওয়াইনের জন্য মধ্যম উদ্বায়ী অম্লতা কী?
  • ডেটাসেটে প্রতিটি ওয়াইন প্রকারের অনুপাত কত?
  • প্রতিটি ওয়াইন ধরনের জন্য সাইট্রিক অ্যাসিড বিতরণ কি?

প্রাপ্তবয়স্ক আদমশুমারি আয়

  • যারা $50K এর বেশি আয় করেন তাদের অনুপাত কত?
  • যারা $50K এর বেশি আয় করেন তাদের গড় বয়স কত?
  • বয়স এবং শিক্ষা স্তরের মধ্যে পারস্পরিক সম্পর্ক কি?
  • $50K এর বেশি উপার্জনকারী পুরুষ এবং মহিলাদের অনুপাত কত?
  • যারা $50K এর বেশি আয় করেন তাদের জন্য প্রতি সপ্তাহে কাজের মধ্যবর্তী ঘন্টা কত?

বোস্টন হাউজিং

  • কক্ষের সংখ্যা এবং মালিক-অধিকৃত বাড়ির মধ্যম মানের মধ্যে পারস্পরিক সম্পর্ক কী?
  • মালিক-অধিকৃত বাড়ির মধ্যম মানের সাথে কোন ভেরিয়েবলের সর্বোচ্চ সম্পর্ক রয়েছে?
  • বাড়ির গড় বয়স কত?
  • শহর অনুসারে ছাত্র-শিক্ষক অনুপাতের বন্টন কত?
  • কোন শহরে মালিক-অধিকৃত বাড়ির গড় মান সবচেয়ে বেশি?

স্তন ক্যান্সার উইসকনসিন ডেটাসেট

  • সৌম্য এবং ম্যালিগন্যান্ট টিউমারের অনুপাত কত?
  • টিউমার ব্যাসার্ধ এবং ঘের মধ্যে পারস্পরিক সম্পর্ক কি?
  • টিউমারের গড় মসৃণতা কত?
  • টিউমারের অবতলতার বন্টন কি?
  • টিউমারের মাঝারি এলাকা কি?

অনলাইন ক্রেতাদের ক্রয় অভিপ্রায়

  • একটি ক্রয় করা দর্শকদের অনুপাত কি?
  • ভিজিটরদের দ্বারা পরিদর্শন করা পৃষ্ঠার সংখ্যা বন্টন কি?
  • ভিজিটরদের দ্বারা ওয়েবসাইটে ব্যয় করা গড় সময় কত?
  • বাউন্স রেট এবং রাজস্বের মধ্যে পারস্পরিক সম্পর্ক কী?
  • দর্শকদের দ্বারা ব্যবহৃত অপারেটিং সিস্টেমের বিতরণ কি?

ব্যাংক মার্কেটিং

  • মেয়াদী আমানতে সদস্যতা নেওয়া লোকেদের অনুপাত কত?
  • বয়স এবং ভারসাম্য মধ্যে পারস্পরিক সম্পর্ক কি?
  • গ্রাহকদের কাজের ধরন বন্টন কি?
  • কলের গড় সময়কাল কত?
  • প্রতি মাসে করা কলের অনুপাত কত?

অ্যামাজন শীর্ষ 50টি বেস্ট সেলিং বই 2009 – 2019৷

  • বইগুলোর গড় রেটিং কত?
  • বইয়ের প্রাপ্ত রিভিউ সংখ্যার বন্টন কত?
  • কোন বইয়ের দাম সবচেয়ে বেশি?
  • বইয়ের রেটিং এবং দামের মধ্যে পারস্পরিক সম্পর্ক কী?
  • বইয়ের ঘরানার বন্টন কি?

ফিফা বিশ্বকাপ

  • প্রতি খেলায় গড় গোলের সংখ্যা কত?
  • ড্রতে শেষ হওয়া গেমগুলির অনুপাত কত?
  • কোন দেশ সবচেয়ে বেশি বিশ্বকাপ শিরোপা জিতেছে?
  • টুর্নামেন্টে খেলোয়াড়দের গড় বয়স কত?
  • প্রতিটি খেলার জন্য উপস্থিতির বন্টন কি?

নিউ ইয়র্ক সিটি এয়ারবিএনবি ওপেন ডেটা

  • তালিকার গড় মূল্য কত?
  • তালিকার জন্য উপলব্ধ রুম ধরনের বিতরণ কি?
  • কোন আশেপাশের সবচেয়ে তালিকা আছে?
  • পর্যালোচনার সংখ্যা এবং তালিকার দামের মধ্যে পারস্পরিক সম্পর্ক কী?
  • তালিকার জন্য বাতিলকরণ নীতির বন্টন কি?

ওয়ার্ল্ড হ্যাপিনেস রিপোর্ট

  • প্রতিটি দেশের জন্য সুখ স্কোর বিতরণ কি?
  • কোন দেশে সর্বোচ্চ সুখের স্কোর আছে?
  • মাথাপিছু জিডিপি এবং সুখের স্কোরের মধ্যে পারস্পরিক সম্পর্ক কী?
  • সুখের জন্য অবদান রাখে এমন উপাদানগুলির বন্টন কী?
  • পৃথিবীর কোন অঞ্চলে সুখের গড় গড় সর্বোচ্চ?

স্টকের মূল্য

  • স্টকের দৈনিক গড় রিটার্ন কত?
  • দৈনিক ট্রেডিং ভলিউম বন্টন কি? অ্যাভোকাডোর দাম
  • অ্যাভোকাডোর গড় দাম কত?
  • অঞ্চলভেদে গড় মূল্য বণ্টনকে কী বলে?
  • কোন অঞ্চলে সর্বোচ্চ এবং সর্বনিম্ন গড় মূল্য রয়েছে?
  • মোট আয়তন এবং গড় মূল্যের মধ্যে পারস্পরিক সম্পর্ক কী?
  • বছরে মোট আয়তনের বন্টন কত?

সর্বশেষ ভাবনা

এক্সেল ডেটা অ্যানালিটিক্স নতুনদের জন্য বিস্তৃত সরঞ্জাম সরবরাহ করে এবং আপনি এই নিবন্ধে তালিকাভুক্ত এক্সেল ডেটাসেটগুলি ব্যবহার করে আপনার দক্ষতা উন্নত করতে পারেন।


উপরের প্রশ্নের উত্তর দেওয়ার জন্য আপনি বিভিন্ন ধরনের ভিজ্যুয়ালাইজেশন যেমন লাইন চার্ট, বার চার্ট, স্ক্যাটার প্লট, হিস্টোগ্রাম এবং পাই চার্ট তৈরি করতে পারেন।


এই নিবন্ধটির প্রধান চিত্রটিহ্যাকারনুন-এর এআই স্টেবল ডিফিউশন মডেলের মাধ্যমে তৈরি করা হয়েছে প্রম্পট 'এক্সেল ডেটাসেট' ব্যবহার করে।


আরও ডেটাসেট তালিকা:

  1. মূকনাট্য ডেটাসেট
  2. পাওয়ার BI ডেটাসেট
  3. কেরাস ডেটাসেট