Özellik görseli Midjourney Diffusion ile "Bir piton hakim, dijital fantezi sanatı" istemiyle oluşturuldu.
Veri bilimi istatistik, programlama ve iletişimin kesiştiği yerdir. Bir veri bilimcisi bir soru sorar ve bu soruyu çeşitli karmaşıklıktaki mekanizmalar aracılığıyla yanıtlamak için verileri kullanır. Her veri türüne hangi testlerin ve yöntemlerin uygulanacağını bilecek bilgi ve araç setine sahiptirler. Ve verilerden yanıtlar çıkarma ve bu yanıtları genel günlük iletişim biçimine aktarma becerisine sahipler.
Veriler basitten son derece karmaşık olana kadar değişebilir. “Temiz” olabileceği gibi “dağınık” da olabilir. Bazen bir sorumuz oluyor ama elimizde veri yok. Bir veri bilimcisi ve/veya analisti, özel araçlar kullanarak dağınık verileri temiz verilere dönüştürmelidir. Onlar da gelişebilirler'
Okuyucularımızın bu konunun neresine düştüğünü değerlendirmek için HackerNoon'un haftalık anketleri (10/4/2023 - 16/4/2023) kullanıldı. HackerNoon topluluğuna, en popüler seçeneklerden bazıları göz önüne alındığında, en güçlü veri bilimi araçlarının ne olduğu soruldu ve 374 kişi yanıt verdi. Sonuçlar aşağıdaki resimde görülebilir:
Neden seçebileceğiniz bu kadar çok araç var?
Anketteki her aracın öne çıkan bazı noktalarını görelim. Elbette burada tartışılmayan daha fazla araç var 😆
❌ Açık kaynaktır.
✅ Microsoft tarzında kullanıcı dostudur!
❌ Karmaşık veri bilimi projeleri için yeterince gelişmiş değildir.
✅ Kolayca dışa aktarılabilen şık çizelgeler ve grafikler oluşturur.
Hepimiz Excel'e aşinayız. Elbette veri işleme, temizleme ve görselleştirme gibi günlük görevler için harikadır ancak daha gelişmiş projeler için yeterli değildir. Gösterge tabloları ve raporlar oluşturma konusunda ustalaşabilir ve hatta Excel'de özel API'ler bile oluşturabilirsiniz.
✅ Açık kaynaktır.
❌ Önemli bir öğrenme eğrisine sahiptir.
✅ Düzenli ve özelleştirilebilir grafikler, tablolar ve çıktılar oluşturabilir.
❌Daha gelişmiş makine öğrenimi araçlarının bazılarında sınırlandırılabilir.
✅İstatistik temelli problemler için uzmanlaşmıştır.
Veri analitiği ve veri bilimi için mükemmel olan, çok yönlü, açık kaynaklı bir programdır.
** “Misyonumuz veri bilimi, bilimsel araştırma ve teknik iletişim için açık kaynaklı yazılım oluşturmaktır. Bunu, ekonomik araçlardan bağımsız olarak herkesin bilgi üretimini ve tüketimini artırmak için yapıyoruz.” -- Posit \ Python'a benzer şekilde, R programlama dilinin çok yönlülüğü çok büyüktür ve veri bilimcilerinin birden fazla yaklaşım kullanarak karmaşık görevleri gerçekleştirmesine olanak tanır. Programcıların yararlanabileceği özel görevleri üstlenmek için kütüphaneler ve paketler sürekli olarak geliştirilmektedir. Ve eğer aradığınız paket onlarda yoksa, kendiniz geliştirin !
R ve Python'u birlikte kullanabilirsiniz . R ve Python programcılarıyla ortak bir proje üzerinde çalışıyorsanız buna bakın.
❌ Açık kaynaktır.
✅ Güzel raporlar oluşturur.
❌ Kullanımı kolay gibi görünebilir ancak gizli bir karmaşıklığa sahiptir.
✅ Veri tartışması ve manipülasyonu için idealdir.
❌ Karmaşık veri bilimi projeleri için sınırlı yetenekler.
✅ Çeşitli kaynaklardan veri kazıyabilir.
Power BI gerçekten parlıyor
✅ Açık kaynaktır.
❌ Önemli bir öğrenme eğrisine sahiptir.
✅ Düzenli grafikler, tablolar ve çıktılar oluşturabilir.
✅ TensorFlow, Scikit-learn, NumPy, Pandas, PyTorch vb. gibi çok sayıda veri bilimi kütüphanesine sahiptir.
✅ Öğrenme çabalarınızı daha ileriye taşıyan çok amaçlı bir programlama dilidir.
Python ile çalışmak için sanal bir ortamın nasıl kurulacağını öğrenmek isteyeceksiniz ve muhtemelen işinizi gerçekleştirmek için Jupyter Notebook gibi bir bilgi işlem platformu seçmek isteyeceksiniz.
❌ açık kaynak.
✅ Güzel gösterge tabloları oluşturur.
❌ Temizleme ve karıştırma gibi veri ön işleme yetenekleri sınırlıdır.
✅ Veri analitiği için idealdir.
❌ Karmaşık veri bilimi projeleri için sınırlı yetenekler.
✅ Raporlar ve gösterge tabloları başkalarıyla kolayca paylaşılabilir.
Anketimiz Python'un veri bilimi araçları için verilen seçenekler arasında en üst sıraya çıktığını gösterdi. Hem veri bilimi alanı içindeki hem de dışındaki çok yönlülüğü göz önüne alındığında, bu hiç de sürpriz değildi. Python öğrenmesi kolay bir programlama dili olarak lanse ediliyor. Dürüst olalım, bilgisayar kodlamaya tamamen yeni başlıyorsanız, ilk başta " kolay " olmayacak, ancak pratik yaptıkça sonunda sizin için ikinci doğanız haline gelecektir.
Lütfen düşüncelerinizi yorumlarda paylaşın ve katılabileceğiniz diğer HackerNoon Anketlerini takip edin.