paint-brush
Veri Analizine Yeni Başlayanlar için 15 Excel Veri Kümesiile@datasets
231,822 okumalar
231,822 okumalar

Veri Analizine Yeni Başlayanlar için 15 Excel Veri Kümesi

Çok uzun; Okumak

Excel, veri analizi için vazgeçilmez bir araçtır ve doğru veri kümeleri ve tekniklerle yeni başlayanlar içgörüleri ortaya çıkarmayı ve bilinçli kararlar almayı öğrenebilir. Bu yazımızda Veri Analitiğine Yeni Başlayanlar için 15 Excel Veri Kümesinin bir listesini derledik. Finansal analiz, piyasa analizi ve zaman serisi analizi gibi konuları kapsayan bu Excel veri kümeleri, gerçek dünya senaryolarına ilişkin öngörüler elde etmek için kullanılabilir.
featured image - Veri Analizine Yeni Başlayanlar için 15 Excel Veri Kümesi
Open Datasets Compiled by HackerNoon HackerNoon profile picture

Excel, veri analizi için vazgeçilmez bir araçtır ve doğru veri kümeleri ve tekniklerle yeni başlayanlar içgörüleri ortaya çıkarmayı ve bilinçli kararlar almayı öğrenebilir. Sezgisel arayüzü ve güçlü işlevselliği, kullanıcıların veri manipülasyonu, veri görselleştirmesi ve istatistiksel analiz gibi çok çeşitli işlemleri gerçekleştirmesine olanak tanır.

“Excel Veri Kümeleri” nedir?

Excel veri kümeleri, kullanıcıların verileri yapılandırılmış bir biçimde oluşturmasına, işlemesine ve analiz etmesine olanak tanıyan, yaygın olarak kullanılan bir yazılım olan Excel elektronik tablosunda depolanan ve düzenlenen veri koleksiyonlarıdır. Bu veri kümeleri iki ana biçimde gelebilir: Excel(.xlsx) ve Virgülle Ayrılmış Değerler (CSV). Excel formatı, formüllerin ve görselleştirmelerin kullanımı da dahil olmak üzere karmaşık verileri düzenlemek ve analiz etmek için daha gelişmiş özellikler sağlarken CSV, çok çeşitli yazılım uygulamalarıyla uyumlu, paylaşımı kolaylaştıran daha basit bir format sunar. Farklı programlar arasındaki veriler.


Bu yazımızda Veri Analitiğine Yeni Başlayanlar için 15 Excel Veri Kümesinin bir listesini derledik. Finansal analiz, piyasa analizi ve zaman serisi analizi gibi konuları kapsayan bu Excel veri kümeleri ile yeni başlayanlar, gerçek dünya senaryolarına ilişkin içgörüler kazanırken veri temizleme, pivot tablolar ve grafikler gibi veri analizi tekniklerini uygulayabilir.

Veri Analizine Yeni Başlayanlar için Excel Veri Kümelerinin Listesi

  1. Süpermarket Satışları
  2. İris
  3. Titanik
  4. Şarap Kalitesi
  5. Yetişkin Nüfus Sayımı Geliri
  6. Boston Konutları
  7. Meme Kanseri Wisconsin Veri Kümesi
  8. Çevrimiçi Alışveriş Yapanların Satın Alma Niyeti
  9. Banka Pazarlama
  10. Avokado Fiyatları
  11. Amazon'un En Çok Satan 50 Kitabı 2009 – 2019
  12. FIFA Dünya Kupası
  13. New York Şehri Airbnb Açık Verileri
  14. Dünya Mutluluk Raporu
  15. Hisse senedi fiyatı

1. Süpermarket Satışları

Süper Mağaza Satış verileri, kurgusal bir perakende şirketi için ürünler, siparişler ve müşterilerle ilgili bilgiler de dahil olmak üzere satış verilerini sağlar. Genellikle veri analitiğini uygulamak için kullanılır.


Bu Excel veri kümesi aşağıdaki değişkenleri içerir:


  • Sipariş Kimliği - Her sipariş için benzersiz bir tanımlayıcı.
  • Müşteri Kimliği - Her müşteri için benzersiz bir tanımlayıcı.
  • Sipariş Tarihi - Siparişin verildiği tarih.
  • Gönderim Tarihi - Siparişin gönderildiği tarih.
  • Gönderim Modu - Siparişin gönderim modu (ör. standart, aynı gün).
  • Segment - Müşteri segmenti (örn. Tüketici, Kurumsal, Ev Ofis).
  • Bölge - Müşterinin bulunduğu bölge (örn. Batı, Orta, Doğu).
  • Kategori - Satın alınan ürünün kategorisi (örn. Mobilya, Teknoloji, Ofis Malzemeleri).
  • Alt Kategori - Satın alınan ürünün alt kategorisi (örn. Sandalye, Masaüstü, Kağıt).
  • Ürün Adı - Satın alınan ürünün adı.
  • Satışlar - Satın alınan ürünün satış geliri.
  • Miktar - Satın alınan ürünün birim sayısı.
  • İndirim - Satın alınan ürüne uygulanan indirim.
  • Kâr -Satın alınan üründen elde edilen kâr.


2. İris

Bu veri seti, setosa, versicolor ve virginica olmak üzere 3 farklı türe ait olan 150 iris çiçeğinin çanak yaprağı uzunluğu, çanak yaprağı genişliği, taç yaprağı uzunluğu ve taç yaprağı genişliği ölçümlerini içerir. İris veri kümesinde, her çiçeğin türü için bir sütun da dahil olmak üzere bir veri çerçevesi olarak depolanan 150 satır ve 5 sütun bulunur.


Değişkenlerinin açıklaması şunları içerir:


  • Sepal.Length - Sepal.length, sepal uzunluğunu santimetre cinsinden temsil eder.
  • Sepal.Width - Sepal.width, sepalin genişliğini santimetre cinsinden temsil eder.
  • Petal.Length - Petal.length, taç yaprağının uzunluğunu santimetre cinsinden temsil eder.
  • Türler - Tür değişkeni, üç olası değerle iris çiçeğinin türünü temsil eder: setosa, versicolor ve virginica.


İris veri kümesinin Excel'deki kullanım örneklerinden biri, İris çiçeğinin farklı özellikleri arasındaki ilişkiyi analiz etmek ve çiçek türlerini özellik değerlerine göre sınıflandırmaktır. Bu, korelasyon analizi, çıkarımsal istatistikler ve tahmine dayalı modelleme gibi teknikler kullanılarak yapılabilir.


Bu Excel veri kümesini Kaggle'da tıklayarak da indirebilirsiniz. Burada .

3. Titanik

Bu popüler açık kaynaklı veri seti, 15 Nisan 1912'de battığında Titanic gemisindeki yolcular hakkında bilgi sağlar. Veri temizleme ve ön işleme, tanımlayıcı istatistikler, veri görselleştirme ve tahmine dayalı modellemeyle ilgilenen veri analitiğine yeni başlayanlar tarafından kullanılabilir.

Veri setinde yer alan değişkenlerden bazıları:


  • PassengerId - Her yolcu için benzersiz bir tanımlayıcı.
  • Hayatta Kaldı - Yolcunun hayatta kalıp kalmadığını gösterir (0 = Hayır, 1 = Evet).
  • Pclass - A yolcu sınıfı (1 = 1., 2 = 2., 3 = 3.).
  • Ad – Bir yolcunun adı.
  • Cinsiyet – Bir yolcunun cinsiyeti.
  • Yaş - Bir yolcunun yaşı.
  • SibSp - Gemideki kardeş/eş sayısı.
  • Parch - Gemideki ebeveyn/çocuk sayısı.
  • Bilet - Bilet numarası.
  • Ücret - Bilet için ödenen ücret.
  • Kabin - Kabin numarası.
  • Gemiye binilmiş - Gemiye binme limanı (C = Cherbourg, Q = Queenstown, S = Southampton).

4. Şarap Kalitesi

Şarap Kalitesi veri seti, kırmızı ve beyaz şarap örneklerine ilişkin bilgiler içerir. Bu veri seti, şarabın kalitesini pH, yoğunluk, alkol içeriği ve sitrik asit içeriği gibi kimyasal özelliklere göre sınıflandırmayı amaçlamaktadır.


Bu Excel veri kümesinde yer alan ortak değişkenler:


  • Sabit Asitlik - Şaraptaki sabit asitlerin sayısı, g/dm^3 cinsinden ifade edilir.
  • Uçucu Asitlik - Şaraptaki uçucu asitlerin sayısı, g/dm^3 cinsinden ifade edilir.
  • Sitrik Asit - Şaraptaki sitrik asit miktarı, g/dm^3 cinsinden ifade edilir.
  • Artık Şeker - Şarapta g/dm^3 cinsinden ifade edilen artık şeker miktarı
  • Klorürler - Şaraptaki g/dm^3 cinsinden ifade edilen klorür miktarı.
  • Serbest Sülfür Dioksit - Şaraptaki mg/dm^3 cinsinden ifade edilen serbest kükürt dioksit miktarı.
  • Toplam Kükürt Dioksit - Şaraptaki mg/dm^3 cinsinden ifade edilen toplam kükürt dioksit miktarı.
  • Yoğunluk - Şarabın g/cm^3 cinsinden ifade edilen yoğunluğu.
  • pH - Şarabın pH seviyesi.
  • Sülfatlar - Şaraptaki sülfatların sayısı, g/dm^3 cinsinden ifade edilir.
  • Alkol - Şarabın alkol içeriği, % hacim olarak ifade edilir.
  • Kalite - Şarabın 0'dan 10'a kadar olan kalite derecesi.

5. Yetişkin Nüfus Sayımı Geliri

Bu Excel veri kümesi, Amerika Birleşik Devletleri'nde yaşayan bireyler hakkında 1994 Nüfus Sayımı veritabanından çıkarılan bir bilgi koleksiyonudur. Her bireyin çeşitli demografik, sosyal ve ekonomik özelliklerini içerir.


Bu veri kümesinde yer alan özelliklerden bazıları:


  • yaş

  • İşçi sınıfı - Özel, Kendi kendine çalışan-inc, Kendi-emp-inc, Federal-devlet, Yerel-devlet, Eyalet-devlet, Ödemesiz, Hiç çalışmamış.

  • fnlwgt

  • Eğitim - Lisans, Bazı-kolej, 11., HS-grad, Prof-okul, Assoc-acdm, Assoc-voc, 9., 7.-8., 12., Yüksek Lisans, 1.-4., 10., Doktora, 5.-6., Okul Öncesi.

  • Eğitim-numarası

  • medeni durum - Evli-vatandaş-eş, Boşanmış, Hiç evlenmemiş, Ayrılmış, Dul, Evli-eş-yok, Evli-AF-eş.

  • meslek - Teknik destek, Zanaat-onarım, Diğer hizmetler, Satış, Yönetici-yönetim, Prof-uzmanlık, Taşıyıcılar-temizleyiciler, Makine-op-denetim, Yönetici-büro, Tarım-balıkçılık, Nakliye-taşıma, Özel ev- serv, Koruyucu-servis, Silahlı Kuvvetler.

  • ilişki - Karısı, Kendi çocuğu, Kocası, Aile içinde olmayan, Diğer akrabası, Evlenmemiş.

  • ırk - Beyaz, Asya-Pac-Adalı, Amerika-Kızılderili-Eskimo, Diğer, Siyah.

  • cinsiyet - Erkek veya kadın.


"Gelir" özelliği hedef değişkendir ve veri kümesi, veri analitiğine yeni başlayanlar için çok faydalıdır.


6. Boston Konutları

Boston Konut veri seti, Boston, Massachusetts bölgesindeki konutlara ilişkin bilgilerden oluşur. Yaklaşık 506 satır ve 14 sütun veriden oluşur.


Veri kümesindeki değişkenlerden bazıları şunlardır:


  • CRIM - Şehirlere göre kişi başına düşen suç oranı.
  • ZN - 25.000 m²'nin üzerindeki parseller için imar edilen konut arazilerinin oranı.
  • INDUS - Kasaba başına perakende olmayan iş alanlarının oranı.
  • CHAS - Charles Nehri kukla değişkeni (= eğer bölge nehri sınırlıyorsa 1; aksi takdirde 0).
  • NOX - Nitrik oksit konsantrasyonu (10 milyonda bir parça).
  • RM – Konut başına düşen ortalama oda sayısı.
  • YAŞ – 1940'tan önce inşa edilen, sahibi tarafından kullanılan birimlerin oranı.
  • DIS - Boston'daki beş iş bulma merkezine olan ağırlıklı mesafeler.
  • RAD - Radyal otoyollara erişilebilirlik endeksi.
  • VERGİ - 10.000 $ başına tam değerli emlak vergisi oranı.
  • PTRATIO - Kasabalara göre öğrenci-öğretmen oranı.
  • B - 1000(Bk - 0,63)^2 burada -Bk kasabaya göre siyahların oranıdır.
  • LSTAT - Nüfusun daha düşük durumunun yüzdesi.
  • MEDV - Sahibi tarafından kullanılan evlerin ortalama değeri 1000$'dır.


Bu veri seti, ev fiyatlarının çeşitli özellikleri ile konut piyasası arasındaki ilişkiyi analiz etmek, veri analizi gerçekleştirmek ve içgörüler oluşturmak için veri analitiğinde kullanılabilir.

7. Meme Kanseri Wisconsin Veri Kümesi

Bu Excel veri seti meme kanseri tümörleri hakkındaki bilgileri içerir ve ilk olarak Dr. William H. Wolberg tarafından oluşturulmuştur. Veri seti, araştırmacılara ve makine öğrenimi uygulayıcılarına, tümörleri kötü huylu (kanserli) veya iyi huylu (kanserli olmayan) olarak sınıflandırmada yardımcı olmak için oluşturuldu.


Bu veri setinde yer alan değişkenlerden bazıları:


  • kimlik Numarası
  • Teşhis (M = kötü huylu, B = iyi huylu).
  • Yarıçap (merkezden çevre üzerindeki noktalara olan mesafelerin ortalaması).
  • Doku (gri tonlamalı değerlerin standart sapması).
  • Çevre
  • Alan
  • Pürüzsüzlük (yarıçap uzunluklarındaki yerel değişim).
  • Kompaktlık (çevre^2 / alan - 1,0).
  • İçbükeylik (konturun içbükey kısımlarının ciddiyeti).
  • İçbükey noktalar (konturun içbükey kısımlarının sayısı).
  • Simetri
  • Fraktal boyut ("kıyı şeridi yaklaşımı" - 1).

8. Çevrimiçi Alışveriş Yapanların Satın Alma Niyeti

Çevrimiçi Alışveriş Yapanların Satın Alma Niyeti veri kümesi, çevrimiçi alışveriş bağlamında satın alma kalıpları ve tüketici davranışlarıyla ilgili bir veri topluluğudur. Çevrimiçi alışveriş yapanlarla anketler yapılarak ve onların yanıtlarından veri toplanarak oluşturuldu.


Bu veri kümesindeki değişkenlerden bazıları şunlardır:


  • Yönetimsel - Kullanıcının yönetimsel amaçlarla ziyaret ettiği web sitesi sayfalarının sayısı
  • Administrative_Duration - Kullanıcının web sitesinin yönetim sayfalarında geçirdiği toplam süre
  • Bilgilendirici - Kullanıcının bilgilendirme amacıyla ziyaret ettiği web sitesi sayfalarının sayısı
  • Informational_Duration - Kullanıcının web sitesinin bilgilendirici sayfalarında geçirdiği toplam süre
  • ProductRelated - Kullanıcının ürünle ilgili amaçlarla ziyaret ettiği web sitesi sayfalarının sayısı
  • ProductRelated_Duration - Kullanıcının web sitesinin ürünle ilgili sayfalarında geçirdiği toplam süre
  • BounceRates - Web sitesine giren ve diğer sayfaları görüntülemeden ayrılan ziyaretçilerin yüzdesi
  • ExitRates - Belirli bir sayfayı ziyaret ettikten sonra web sitesinden çıkan ziyaretçilerin yüzdesi
  • PageValues - Kullanıcının işlemden önce görüntülediği sayfaların ortalama değeri
  • SpecialDay - Ziyaretin özel bir güne yakınlığı (örneğin Anneler Günü, Sevgililer Günü vb.)


Bu Excel veri kümesi, e-ticaret ve çevrimiçi pazarlamayla ilgili araştırma ve analizlerde kullanılır. İşletmelerin müşteri davranışını yönlendiren faktörleri anlamalarına yardımcı olabilir ve aynı zamanda veri analitiğine yeni başlayanlar için de faydalıdır.

9. Banka Pazarlama

Bu popüler veri kümesi, Portekizli bir bankacılık kurumunun pazarlama kampanyalarını incelemek içindir. Bankanın pazarlama kampanyalarının yanı sıra müşteri demografik bilgileri ve ekonomik göstergeler hakkında bilgiler içerir.


Bu veri setinde yer alan değişkenlerden bazıları:


  • Yaş - Müşterinin yaşı (sayısal)
  • İş - İşin türü
  • Medeni - Medeni durumu
  • Eğitim - Eğitim düzeyi
  • Varsayılan - Kredi temerrüde düşmüş mü?
  • Bakiye - Avro cinsinden ortalama yıllık bakiye.
  • Konut - Konut krediniz var mı?
  • Kredi - Bireysel krediniz var mı?
  • İletişim - İletişim iletişim türü.
  • Gün - İletişime geçilen ayın günü.
  • Çıktı değişkeni, müşterinin banka ile iletişime geçtikten sonra vadeli mevduata abone olup olmadığını ifade etmektedir.

10. Avokado Fiyatları

Avokado Fiyatları veri seti Amerika Birleşik Devletleri'ndeki avokado fiyatlarına ilişkin verilerden oluşmaktadır. Veriler Hass Avocado Board ve Amerika Birleşik Devletleri Tarım Bakanlığı (USDA) gibi çeşitli kaynaklardan toplanıyor.


Bu veri kümesindeki değişkenlerden bazıları şunlardır:


  • Tarih - Gözlemin tarihi.
  • AveragePrice – Tek bir avokadonun ortalama fiyatı.
  • Toplam Hacim - Satılan avokadoların toplam sayısı.
  • PLU (Fiyat Arama) kodu - Belirli bir avokado türünü tanımlamak için kullanılan kod.
  • Tür - Geleneksel veya organik
  • Bölge - Gözlemin yapıldığı şehir veya bölge.


Ayrıca gıda endüstrisindeki işletmeler tarafından avokado alım satımı konusunda stratejik kararlar almak için de kullanılabilir.

11. Amazon'un En Çok Satan 50 Kitabı 2009 - 2019

Bu Excel veri kümesi, 2009 ile 2019 yılları arasındaki her yıl için Amazon'da en çok satan 50 kitapla ilgili verilerin bir koleksiyonudur.


Veri kümesi aşağıdaki değişkenleri içerir:


  • Ad - Kitabın başlığı.
  • Yazar - Kitabın yazarının adı.
  • Kullanıcı Derecelendirmesi - Kitabın Amazon kullanıcıları tarafından sağlanan ortalama derecelendirmesi.
  • İncelemeler - Kitabın Amazon'da aldığı toplam yorum sayısı.
  • Fiyat - Kitabın ABD doları cinsinden fiyatı.
  • Yıl - Kitabın yayınlandığı yıl.
  • Tür - Kitabın türü.


Amazon En Çok Satan 50 Kitap, Amazon'da on yıl boyunca kitap satışlarındaki trendleri keşfetmek için kullanılabilir ve veri analitiğine yeni başlayanlar için faydalıdır.


12. FIFA Dünya Kupası

FIFA Dünya Kupası veri seti, her dört yılda bir düzenlenen FIFA Dünya Kupası ile ilgili verilerin bir koleksiyonudur. 1930'dan 2014'e kadar her Dünya Kupası turnuvasına ilişkin bilgiler içerir.


Bu veri kümesindeki değişkenlerden bazıları şunlardır:


  • Yıl - Turnuvanın yılı.
  • Ülke – Turnuvanın ev sahibi ülkesi.
  • Kazanan - Turnuvayı kazanan takım.
  • İkinciler - İkinci olarak bitiren takım.
  • Üçüncü - Üçüncü sırada bitiren takım.
  • Dördüncü - Dördüncü sırada bitiren takım.
  • Goalscored - Turnuvada atılan toplam gol sayısı.
  • QualifiedTakımlar - Turnuvaya katılmaya hak kazanan toplam takım sayısı.
  • Seyirci - Maçlara katılan toplam seyirci sayısı.


Veri seti, katılan takım sayısındaki değişiklikler veya atılan gol sayısı gibi Dünya Kupası'ndaki zaman içindeki eğilimleri analiz etmek için kullanılabilir.

13. New York Şehri Airbnb Açık Verileri

Bu Excel veri kümesi, New York City'deki Airbnb listeleri ve ölçümleri hakkındaki kamuya açık bilgilerden oluşur. 2019 New York Şehri Airbnb Açık Verileri, şehirdeki yaklaşık 50.000 Airbnb kaydı hakkında bilgi içerir ve kiralamaların şehir üzerindeki etkisinin şeffaflığını ve anlaşılmasını teşvik etmek için New York Şehri hükümeti tarafından kamuoyuna sunulur.


Veri kümesindeki değişkenlerden bazıları şunlardır:


  • Kimlik - Her Airbnb kaydı için benzersiz bir tanımlayıcı.
  • Ad - Airbnb kaydının adı.
  • Host_id - Airbnb ev sahibinin benzersiz tanımlayıcısı.
  • Host_name - Airbnb ev sahibinin adı.
  • Neighbourhood_group - Airbnb listesinin ilçesi.
  • Mahalle - Airbnb kaydının bulunduğu mahalle.
  • Enlem - Airbnb listesinin enlemi.
  • Boylam - Airbnb listesinin boylamı.
  • Room_type - Kiralanabilecek oda tipi (örn. özel oda, evin/dairenin tamamı, ortak oda).
  • Fiyat - Airbnb kaydını kiralamak için gecelik fiyat.

14. Dünya Mutluluk Raporu

Bu veri seti, mutluluğa katkıda bulunan ekonomik, sosyal ve sağlık faktörleri gibi 150'den fazla ülkenin mutluluk düzeylerine ilişkin bilgileri içerir. Veri analizine yeni başlayanlar için veri araştırması, görselleştirme ve regresyon analizi uygulamaları açısından faydalıdır.


Bu veri kümesindeki değişkenlerden bazıları şunlardır:


  • Ülke adı - Ülkenin adı.
  • Yıl - Anketin yapıldığı yıl.
  • Hayat Merdiveni - 0-10 arası bir ölçeğe dayalı ortalama yaşam memnuniyeti puanı.
  • Kişi başına düşen GSYİH log - Kişi başına GSYİH'nin doğal logaritması, satın alma gücü paritesine (SAGP) göre sabit 2017 uluslararası doları cinsinden ayarlanmıştır.
  • Doğumda sağlıklı yaşam beklentisi - Sağlıksız geçirilen yıllara göre düzeltilmiş, tam sağlıkla yaşanacak beklenen yıl sayısı.

15. Hisse senedi fiyatı

Bu veri seti Apple, Google ve Amazon gibi çeşitli şirketlerin günlük hisse senedi fiyatlarını içermektedir. Zaman serisi analizi uygulamak ve gelecekteki hisse senedi fiyatlarını tahmin etmek için kullanışlıdır.


Bu veri kümesindeki değişkenler:


  • Tarih - Hisse senedi fiyatının kaydedildiği tarih.
  • Açık - Hisse senedinin açılış fiyatı.
  • Yüksek - Hisse senedinin işlem günündeki en yüksek fiyatı.
  • Düşük - Hisse senedinin işlem günündeki en düşük fiyatı.
  • Kapanış - Hisse senedinin kapanış fiyatı.
  • Adj Close - Hisse senedinin düzeltilmiş kapanış fiyatı.
  • Hacim - Gün içinde işlem gören hisselerin sayısı.


Bu Excel Veri Kümeleri İçin Ortak Uygulama Soruları

Süpermarket Satışları

  • Mağazanın toplam geliri ne kadar?
  • Hangi ürün kategorisi satışa en çok katkı sağlıyor?
  • Geçtiğimiz yıl satış trendi nasıldı?
  • Satışlar en çok hangi bölgede, en düşük hangi bölgede?
  • Mağazanın ortalama kar marjı nedir?

İris

  • Her bir iris türünün veri kümesindeki dağılımı nedir?
  • Yaprak uzunluğu ile taç yaprağı genişliği arasındaki ilişki nedir?
  • Her iris türünün ortalama sepal uzunluğu nedir?
  • Hangi iris türü en büyük taç yaprağı alanına sahiptir?
  • Her iris türü için kaç gözlem vardır?

Titanik

  • Yolcuların hayatta kalma oranı nedir?
  • Yolcuların ortalama yaşı kaç?
  • Erkek ve kadın yolcuların oranı nedir?
  • Hangi sınıftaki yolcular en yüksek hayatta kalma oranına sahipti?
  • Yolcuların ödediği ücretin dağılımı nasıldır?

Şarap Kalitesi

  • PH ile alkol içeriği arasındaki ilişki nedir?
  • Hangi şarap türü (kırmızı veya beyaz) daha yüksek ortalama kalite derecesine sahiptir?
  • Her bir şarap türü için ortalama uçucu asitlik nedir?
  • Veri kümesindeki her şarap türünün oranı nedir?
  • Her şarap türü için sitrik asit dağılımı nedir?

Yetişkin Nüfus Sayımı Geliri

  • 50 bin dolardan fazla kazananların oranı nedir?
  • 50.000 dolardan fazla kazanan insanların ortalama yaşı kaçtır?
  • Yaş ile eğitim düzeyi arasındaki ilişki nedir?
  • 50 bin dolardan fazla kazanan kadın ve erkeklerin oranı nedir?
  • 50.000 dolardan fazla kazanan insanlar için haftada ortalama çalışma saati nedir?

Boston Konutları

  • Oda sayısı ile sahibi tarafından kullanılan evlerin ortalama değeri arasındaki ilişki nedir?
  • Sahibinin oturduğu konutların medyan değeri ile en yüksek korelasyona sahip değişken hangisidir?
  • Evlerin ortalama yaşı kaç?
  • Öğrenci-öğretmen oranının ilçelere göre dağılımı nedir?
  • Sahibi tarafından kullanılan evlerin ortalama değeri en yüksek olan şehir hangisidir?

Meme Kanseri Wisconsin Veri Kümesi

  • İyi huylu ve kötü huylu tümörlerin oranı nedir?
  • Tümör yarıçapı ile çevre arasındaki ilişki nedir?
  • Tümörlerin ortalama düzgünlüğü nedir?
  • Tümörlerin içbükeylik dağılımı nasıldır?
  • Tümörlerin ortanca alanı nedir?

Çevrimiçi Alışveriş Yapanların Satın Alma Niyeti

  • Alışveriş yapan ziyaretçilerin oranı nedir?
  • Ziyaretçilerin ziyaret ettiği sayfa sayılarının dağılımı nasıldır?
  • Ziyaretçilerin sitede geçirdiği ortalama süre nedir?
  • Hemen çıkma oranı ile gelir arasındaki ilişki nedir?
  • Ziyaretçilerin kullandığı işletim sisteminin dağılımı nedir?

Banka Pazarlama

  • Vadeli mevduata abone olanların oranı nedir?
  • Yaş ile denge arasındaki ilişki nedir?
  • Müşterilerin iş türüne göre dağılımı nasıldır?
  • Görüşmelerin ortalama süresi ne kadar?
  • Her ay yapılan aramaların oranı nedir?

Amazon'un En Çok Satan 50 Kitabı 2009 – 2019

  • Kitapların ortalama puanı nedir?
  • Kitaplara gelen eleştiri sayılarının dağılımı nasıldır?
  • Hangi kitap en yüksek fiyata sahip?
  • Kitapların derecelendirmesi ile fiyatı arasındaki ilişki nedir?
  • Kitapların tür dağılımı nasıldır?

FIFA Dünya Kupası

  • Maç başına atılan ortalama gol sayısı nedir?
  • Beraberlikle sonuçlanan maçların oranı nedir?
  • Dünya Kupası'nda en çok şampiyonluğu hangi ülke kazandı?
  • Turnuvadaki oyuncuların ortalama yaşı kaç?
  • Her maça seyirci dağılımı nasıl?

New York Şehri Airbnb Açık Verileri

  • İlanların ortalama fiyatı nedir?
  • Kayıtlara uygun oda tiplerinin dağılımı nedir?
  • En çok ilan hangi mahallede var?
  • Yorum sayısı ile ilanların fiyatı arasındaki ilişki nedir?
  • İlanlara ilişkin iptal politikalarının dağılımı nasıldır?

Dünya Mutluluk Raporu

  • Mutluluk puanlarının ülkelere göre dağılımı nedir?
  • Mutluluk puanı en yüksek ülke hangisi?
  • Kişi başına düşen GSYİH ile mutluluk puanı arasındaki ilişki nedir?
  • Mutluluğa katkıda bulunan faktörlerin dağılımı nedir?
  • Dünyanın hangi bölgesi en yüksek ortalama mutluluk puanına sahip?

Hisse senedi fiyatı

  • Hisse senedinin günlük ortalama getirisi nedir?
  • Günlük işlem hacminin dağılımı nedir? Avokado Fiyatları
  • Avokadonun ortalama fiyatı nedir?
  • Ortalama fiyatın bölgelere göre dağılımı nasıldır?
  • Ortalama fiyatın en yüksek ve en düşük olduğu bölge hangisidir?
  • Toplam hacim ile ortalama fiyat arasındaki korelasyon nedir?
  • Toplam hacmin yıllara göre dağılımı nasıldır?

Son düşünceler

Excel, veri analitiğine yeni başlayanlar için çok çeşitli araçlar sunar ve bu makalede listelenen Excel veri kümelerini kullanarak becerilerinizi geliştirebilirsiniz.


Yukarıdaki soruları yanıtlamak için çizgi grafikler, çubuk grafikler, dağılım grafikleri, histogramlar ve pasta grafikleri gibi çeşitli görselleştirme türleri de oluşturabilirsiniz.


Bu makalenin ana görseli, 'Excel veri kümeleri' istemi kullanılarakHackerNoon'un AI Stabil Difüzyon modeli aracılığıyla oluşturuldu.


Daha Fazla Veri Kümesi Listesi:

  1. Tableau Veri Kümeleri
  2. Power BI Veri Kümeleri
  3. Keras Veri Kümeleri