paint-brush
数据分析 101:迈入数据驱动世界的第一步经过@cjson
5,386 讀數
5,386 讀數

数据分析 101:迈入数据驱动世界的第一步

经过 C.J Okoli6m2023/09/30
Read on Terminal Reader

太長; 讀書

每个企业都有自己的目标,而实现这些目标的途径通常在于数据;这就是为什么我们的数据今天如此重要,因为通过良好的分析,您可以将统计数据转化为结果。 我是杰森,我对数据世界很感兴趣。我希望我能帮助您了解这个领域的含义。
featured image - 数据分析 101:迈入数据驱动世界的第一步
C.J Okoli HackerNoon profile picture
0-item

一、简介

数据就是一切。在我们日益数字化的世界中,最大的货币是数据。曾经有黄金,然后有石油,现在我们有了数据。日常生活需要在不同的时刻做出决策,而为了做出最佳决策,我们需要利用数据。


您可能会问我们如何利用这些数据?这就是数据分析的用武之地。在接下来的几段中,我将回答这个问题,并引导您了解数据分析的含义。

二.什么是数据分析?

定义任何事物都是困难的。在我说数据分析是什么之前,让我先说一下它不是什么:数据科学。尽管相关,但这是两个不同的过程。我将两者混为一谈,这就是我花了这么长时间才深入研究分析世界的原因。


数据科学是一个广泛的领域,包含数据分析的各个方面,但其范围也扩展到机器学习和预测建模,以及利用统计技术——这确保了我保持健康的距离!


另一方面,数据分析更专注于检查数据以支持战术决策和改进日常运营。这两个领域对于利用数据推动业务成功都至关重要,但它们并不相同。


检查数据并从中得出结论就是分析的目的。这些结论往往以优化业务绩效、效率和利润为中心。实际上,每当您解释数据以做出战略指导决策时,您就戴上了数据分析师的帽子。


为了便于理解,可以将其视为 Netflix 用来阻止我们整夜睡眠的秘密公式。


数据分析有多种方法,一般有 4 种类型的数据分析,包括查看发生了什么(描述性分析)、为什么发生某事(诊断分析)、将要发生什么(预测性分析)以及下一步应该做什么(规范性分析)。


此外,作为数据分析师,您将使用多种分析方法和技术来处理数据和提取信息。


一种流行的方法是回归分析,它涉及检查相互依赖的变量之间的联系,以确定一个变量的变化如何影响另一个变量。


对于当今科技领域有关数据的所有讨论,您可能会认为这是全新的,但数据分析并不是昨天才开始存在的,尽管许多领域都以现代发展为中心。


早在 18 世纪和 19 世纪,早期的统计分析就已经形成了丰富的历史背景。


纵观历史演变,从 20 世纪中叶的早期计算时代,到 20 世纪 80 年代 Microsoft Excel 等电子表格软件的推出,再到世纪之交的互联网和大数据大爆炸,一路走来通过数据科学、机器学习和人工智能 (AI) 的力量,今天的预测分析,我们看到了技术进步带来的转变以及该领域如何得到极大扩展。

三.数据基础知识

数据是事实的集合。数据质量是处理数据的一个关键方面,关键在于我们的数据对于当前任务的准确性、一致性、完整性、可靠性和相关性。将数据想象为我们决策过程的构建模块。


当我们的数据具有高质量时(即无错误、长期保持一致、没有间隙且来源可靠),它就为明智的决策和高效的流程奠定了坚实的基础。


您可以将其视为为您的商务之旅提供可靠的 GPS。干净的数据不仅可以节省您在数据清理方面的时间和精力,还可以在您的团队和利益相关者之间建立信任,使每个人对数据可以提供的见解和决策更有信心。


此外,它还是一种省钱的工具,可以防止投资、营销和运营方面出现代价高昂的错误。


此外,拥有干净的数据就像磨砺你的分析工具一样,它可以确保你的模型和预测准确可靠。此外,在某些行业中,必须满足合规性要求并维护道德数据实践。

四.数据分析过程

数据分析生命周期代表典型数据分析项目中涉及的一系列阶段和活动。它概述了从定义问题到提供可行见解的步骤。 Google 的数据分析课程规定了 6 个步骤:询问、准备、处理、分析、共享和行动。

五、工具和技术

区分领域的一种方法是通过它们的工具。医生有听诊器、手术刀和温度计,而分析师有电子表格、SQL 和可视化工具。这些是一些常见的数据分析工具。


电子表格是用于计算和组织数据的软件。 Excel 是最常见的电子表格应用程序。结构化查询语言 - SQL(发音为“sequel”)是一种为管理数据库而构建的编程语言。


R 是一种专为统计计算而设计的编程语言,还具有数据可视化功能。 Python 是 R 的流行替代品,因为除了统计计算之外,它还有许多其他用途。


此外,可视化工具可以使理解复杂的数据集、促进数据交互和发现见解比过去更加方便。数据可视化涉及将原始数据转换为可视化表示,因此 Tableau 和 Power BI 等专业工具至关重要。

六.案例分析

我想通过 Netflix 来强调数据分析在内容市场中的重要性。考虑一下这个伪检查:当您在 Netflix 的搜索栏中输入“权力的游戏”时,它会在您完成输入之前填写单词,即使他们没有该节目,但 Netflix 会继续返回他们的节目。


对我来说,第一个结果是《巫师》。你认为这是为什么?为什么要建议另一部奇幻节目,基于不同的虚构书籍系列,以中世纪魔法和剑的世界为背景?为什么不推荐“女子监狱”?


这就是数据分析的作用。除了内容建议之外,可以肯定的是,洛斯加托斯的制片人和高管预计《权力的游戏》的观众和那些在签署数百万美元制作 Netflix 原创作品之前愿意向《巫师》扔硬币的观众之间存在重叠。


有数据,经过分析,并据此做出决定。

七.数据隐私和道德

凭借我的法律背景,对道德数据处理和分析的考虑对我来说特别有趣,但我今天只是想介绍数据分析,数据隐私的重要性需要在另一天深入讨论,特别是因为他们可以听到我们说的一切!

八.数据分析入门

对于任何有兴趣了解更多有关数据分析或刚刚开始的人,您可以查看这些很酷的资源:


Google 数据分析专业证书:这是一门很棒的初学者课程,可为您的数据分析之旅奠定基础。


数据非洲女性 (WiDA) 社区:WiDA 正在帮助女性培养数据驱动技能,以从事数据驱动型职业。


数据分析:它是什么、如何使用以及 4 种基本技术:一篇 Investopedia 文章详细讨论了数据分析的技术细节。

九.结论

每个企业都有自己的目标,而实现这些目标的途径通常在于数据;这就是为什么我们的数据今天如此重要,因为通过良好的分析,您可以将统计数据转化为结果。


我是 Jason,我对数据世界很感兴趣。我希望我已经帮助您了解这个领域的内容。


如果您发现本文很有趣,或者您刚刚开始,那么祝您在进一步探索和练习技能时好运。要了解更多信息,您可以阅读专门针对四种数据分析类型中的任何一种的文章 - 我有点偏向预测分析!


最后,每次做出决定时,不要忘记像数据分析师一样思考;我希望您能获得许多令人惊奇的见解!