在为小型和大型企业构建数据和分析平台的第一线工作了十多年之后,我亲眼目睹了人员、流程和技术的复杂舞蹈。从数据工程师和科学家到云计算和机器学习工具,我已经深深扎根于数据世界。然而,尽管我们尽了最大努力并采取了复杂的方法,但一个持续存在的问题始终困扰着我:为什么从原始数据到可操作的业务洞察的过程仍然如此缓慢?
我的职业生涯拥有丰富的经验,包括制定数据解决方案和指导数据货币化计划。然而,在这幅挂毯之下却隐藏着一股不满的情绪。我们将数据转化为业务洞察的速度和效率从来都不太符合我的愿景。这种不安促使我超越传统的方法论。
当我开始重新构想可操作洞察生成的整个生命周期→业务问题转化为分析问题到分析解决方案再到业务解决方案时,关键点就出现了。我们怎样才能不仅改进而且彻底改变从原始数据到富有洞察力、可操作的情报的每一步?我意识到,答案在于利用人工智能的力量并将其嵌入到生命周期的每个阶段。
将数据转化为理解:这一切都始于将原始数据转化为可理解、可搜索的格式。这不仅仅涉及数据;还涉及数据。它是关于创建一种语言,以弥合数据与寻求数据智慧的业务用户之间的差距。源自技术元数据的启发式方法(现有术语、数据配置文件等)与行业、领域和业务使用相结合,作为大型语言模型的提示,以自动生成业务术语表。
语义数据模型的诞生:通过人工智能,我设想了一种模型,其中数据不仅被存储,而且以有意义的方式互连,反映了人类对信息网络的理解。将企业数据生态系统重新想象为本体,并使其像语义网络一样工作。虽然这保留了数据资产之间关系的真实性,但消除了对传统数据管道的需求。
分析目录——业务概念和相关分析角度的存储库:在这里,人工智能有助于利用主题专家的商业智能,发展一个动态存储库,其中包含丰富的行业特定见解和业务术语。该目录不是静态的;它会不断成长和适应,就像我们自己对影响业务指标的新兴模式/因素的理解一样。
在商业语言对话:采用大型语言模型 (LLM) 中,我看到了将复杂的业务查询转化为精确的分析需求的潜力(业务概念和相关的分析角度选择导致维度和度量的识别),从而在商业世界中架起桥梁与数据领域。
以外科手术般的精确度精确定位数据:确定特定业务查询所需的确切数据就像大海捞针一样。第 4 步的语义模型和输出作为人工智能的上下文,改变了这一点,使搜索准确高效。
自动化代码生成:利用 LLM 和步骤 5 的上下文来生成联合 SQL 和 Python 代码是一个游戏规则改变者,减少了手动工作并加速了从问题到洞察的旅程。但是,生成的代码应经过语法、逻辑和安全验证,以确保符合企业标准。
从代码到清晰:最后一步是以清晰、易于理解的格式提供见解,直接响应初始查询。神奇的事情就在这里发生——数据转变为决策。以可视化和规范性见解的形式描述数据。
最初是为了加快数据决策之旅,现在已成为重新定义业务分析格局的个人使命。借助人工智能,我不仅简化了流程,还简化了流程。我正在创建一个新的范例,其中数据分析像对话一样直观,像简单查询一样易于访问,并且像不断发展的业务环境一样动态。
也发布在这里。