paint-brush
Python setzt sich durch: 57 % wählen Python als ihr bevorzugtes Data-Science-Toolvon@jessblaq
1,168 Lesungen
1,168 Lesungen

Python setzt sich durch: 57 % wählen Python als ihr bevorzugtes Data-Science-Tool

von Jessica Blaquiere5m2023/04/19
Read on Terminal Reader
Read this story w/o Javascript

Zu lang; Lesen

Die HackerNoon-Community wurde angesichts einiger der beliebtesten Optionen nach ihrem leistungsstarken Data-Science-Tool gefragt und 374 Personen antworteten. Python wurde von über 50 % der Leser zum bevorzugten Tool für Data Science gewählt. RStudio wurde nur von 9 % der Befragten ausgewählt.
featured image - Python setzt sich durch: 57 % wählen Python als ihr bevorzugtes Data-Science-Tool
Jessica Blaquiere HackerNoon profile picture
0-item
1-item


Das Feature-Bild wurde mit Midjourney Diffusion mit der Aufforderung „Eine Python setzt sich durch, digitale Fantasy-Kunst“ erstellt.


Über Data Science

In der Datenwissenschaft überschneiden sich Statistik, Programmierung und Kommunikation. Ein Datenwissenschaftler stellt eine Frage und verwendet Daten, um diese Frage durch Mechanismen unterschiedlicher Komplexität zu beantworten. Sie verfügen über das Wissen und die Werkzeuge, um zu wissen, welche Tests und Methoden auf jeden Datentyp angewendet werden müssen. Und sie haben die Fähigkeit, Antworten aus Daten zu extrahieren und diese Antworten in einer allgemeinen, alltäglichen Form der Kommunikation weiterzugeben.


Die Daten können von einfach bis äußerst komplex reichen. Es kann „sauber“ und „unordentlich“ sein. Manchmal haben wir eine Frage, aber uns fehlen die Daten. Ein Datenwissenschaftler und/oder Analyst muss mithilfe spezieller Tools chaotische Daten in saubere Daten umwandeln. Sie können sich auch entwickeln ' Schaben 'Programme, die darauf ausgelegt sind, Daten abzurufen, wenn sie nicht über das verfügen, was sie zur Beantwortung ihrer Frage benötigen. Sobald die Daten erfasst und in nutzbarer Form vorliegen, werden sie über Programme und Tools wie Python, RStudio usw. in statistische Tests und Modelle übertragen. Doch welche Tools sind die besten?


Leser von HackerNoon


Quelle: Giphy


Die wöchentlichen Umfragen von HackerNoon (10.4.2023 bis 16.4.2023) wurden verwendet, um zu beurteilen, wo unsere Leser zu diesem Thema stehen. Die HackerNoon-Community wurde angesichts einiger der beliebtesten Optionen nach ihrem leistungsstarken Data-Science-Tool gefragt und 374 Personen antworteten. Die Ergebnisse sind im Bild unten zu sehen:



  • [ ] Über 50 % der HackerNoon-Leser, die größtenteils aus der Technologie-Community stammen, wählten Python als ihr bevorzugtes Data-Science-Tool. Das ist gar nicht so überraschend. Python ist Open Source, was es für alle zugänglich macht 🙂🙃🙂🙃🙂🙃🙂🙃🙂🙃🙂🙃


Quelle: Giphy


  • [ ] 18 % ausgewählt Excel als ihr bevorzugtes Data-Science-Tool.
  • [ ] Power BI wurde nur von 9 % der Umfrageteilnehmer gewählt**.**
  • [ ] Auch ein Open-Source-Tool, RStudio erhielt nur 9 % der Stimmen.
  • [ ] Letztendlich haben sich nur 5 % dafür entschieden Tableau als ihr bevorzugtes Werkzeug für die Datenwissenschaft



Werkzeuge

Warum gibt es so viele Tools zur Auswahl? Dieses Feld mit der Zeit immer komplexer geworden ist, so natürlich auch die Auswahl der Werkzeuge. Es gibt so viele Strömungen der Datenwissenschaft, dass jeder für sich selbst entscheiden muss, welches Tool für ihn das richtige ist. Und realistisch gesehen werden Sie mehrere Tools gleichzeitig verwenden.


Sehen wir uns einige Highlights der einzelnen Tools aus der Umfrage an. Natürlich gibt es noch weitere Tools, die hier nicht besprochen werden 😆


Excel

❌ Open Source.

✅ Ist im Microsoft-Stil benutzerfreundlich!

❌ Ist für komplexe Data-Science-Projekte nicht weit genug fortgeschritten.

✅ Erstellt stilvolle Diagramme und Grafiken, die einfach exportiert werden können.


Außer dieser Umfrage offenbar! Quelle: Giphy


Wir alle kennen Excel. Sicher, es eignet sich hervorragend für alltägliche Aufgaben wie Datenbearbeitung, Bereinigung und Visualisierungen, aber für fortgeschrittenere Projekte reicht es nicht aus. Sie können mit der Erstellung von Dashboards und Berichten experimentieren und sogar spezielle APIs in Excel einrichten.


Rstudio

✅ Open Source.

❌ Hat eine erhebliche Lernkurve.

✅ Kann übersichtliche und anpassbare Grafiken, Tabellen und Ausgaben erstellen.

❌ Kann bei einigen der fortgeschritteneren Tools für maschinelles Lernen eingeschränkt sein.

✅ Spezialisiert auf statistische Probleme.


Ein vielseitiges Open-Source-Programm, das sich hervorragend für Datenanalyse und Datenwissenschaft eignet RStudio , das jetzt den glänzenden neuen Namen trägt Setzen .


** „Unsere Mission ist es, Open-Source-Software für Datenwissenschaft, wissenschaftliche Forschung und technische Kommunikation zu entwickeln. Wir tun dies, um die Produktion und den Konsum von Wissen durch alle zu verbessern, unabhängig von den wirtschaftlichen Mitteln.“ -- Posit \ Ähnlich wie bei Python ist die Vielseitigkeit der Programmiersprache R enorm und ermöglicht es Datenwissenschaftlern, komplexe Aufgaben mit mehreren Ansätzen auszuführen. Bibliotheken und Pakete werden ständig weiterentwickelt, um spezielle Aufgaben zu übernehmen, die Programmierer nutzen können. Und wenn sie nicht das Paket haben, das Sie suchen, entwickeln Sie selbst eines !


Sie könnenR und Python gleichzeitig verwenden . Schauen Sie sich dies an, wenn Sie an einem Gemeinschaftsprojekt mit R- und Python-Programmierern arbeiten.


Power BI

❌ Open Source.

✅ Erstellt schöne Berichte.

❌ Kann einfach zu bedienen erscheinen, birgt jedoch eine versteckte Komplexität.

✅ Ideal für die Datenverarbeitung und -manipulation.

❌ Begrenzte Fähigkeiten für komplexe Data-Science-Projekte.

✅ Kann Daten aus verschiedenen Quellen extrahieren.


Power BI glänzt wirklich als Datenvisualisierungs- und Berichtstool und kein Arbeitstier für die Datenwissenschaft. Es verfügt über die Fähigkeit, spezielle Datenmanipulationen durch maßgeschneiderte codierte Operationen wie reguläre Ausdrücke usw. durchzuführen. Wenn Sie jedoch an einem komplexen Data-Science-Projekt arbeiten, würden Sie Power BI in der Endphase des Projekts wahrscheinlich eher verwenden eines Präsentationstools.


Python

✅ Open Source.

❌ Hat eine erhebliche Lernkurve.

✅ Kann übersichtliche Grafiken, Tabellen und Ausgaben erstellen.

✅ Verfügt über zahlreiche Data-Science-Bibliotheken wie TensorFlow, Scikit-learn, NumPy, Pandas, PyTorch usw.

✅ Ist eine vielseitige Programmiersprache, die Ihre Lernanstrengungen erweitert.


Python ist eine objektorientierte, vielseitige Programmiersprache. Sie ist als leicht zu erlernende und vielseitige Programmiersprache bekannt. Aufgrund seiner Vielseitigkeit gibt es eine riesige Community von Programmierern, sodass die Bildungsressourcen nie enden. Es gibt eine Fülle von Data-Science-Bibliotheken die gebrauchsfertig sind.


Um mit Python zu arbeiten, möchten Sie lernen, wie Sie eine virtuelle Umgebung einrichten, und Sie möchten wahrscheinlich eine Computerplattform wie Jupyter Notebook auswählen, auf der Sie Ihre Arbeit ausführen können.


Tableau

❌ Open Source.

✅ Erstellt wunderschöne Dashboards.

❌ Begrenzte Datenvorverarbeitungsfähigkeiten wie Bereinigen und Wrangling.

✅ Ideal für Datenanalysen.

❌ Begrenzte Fähigkeiten für komplexe Data-Science-Projekte.

✅ Berichte und Dashboards können problemlos mit anderen geteilt werden.


Tableau ist eine hervorragende Datenanalyse- und Visualisierungssoftware, die aufgrund ihrer Kosten häufig in größeren Teams eingesetzt wird. Es kann schöne und intuitive Dashboards im Präsentationsstil erstellen, die verschiedene Aspekte Ihrer Daten hervorheben können. Es ist jedoch sicherlich kein Arbeitstier, da es eher auf die Berichtsphasen und nicht auf die Anfangs- und Mittelphasen eines Datenprojekts spezialisiert ist.



Abschließende Gedanken

Unsere Umfrage ergab, dass Python an der Spitze der Auswahl an Data-Science-Tools steht. Angesichts der Vielseitigkeit, sowohl innerhalb als auch außerhalb des Bereichs der Datenwissenschaft, war dies keine Überraschung. Python wird als leicht zu erlernende Programmiersprache angepriesen. Seien wir ehrlich: Wenn Sie ein absoluter Anfänger in der Computerprogrammierung sind, wird es zunächst nicht „ einfach “ sein, aber mit etwas Übung wird es Ihnen irgendwann zur zweiten Natur werden.



Bitte teilen Sie Ihre Gedanken in den Kommentaren mit und halten Sie Ausschau nach anderen HackerNoon-Umfragen, an denen Sie teilnehmen können.