AI 药物发现呈爆炸式增长。
无论是否过度炒作,人工智能药物发现的投资从 2014 年的 4.5 亿美元跃升至 2021 年的 580 亿美元。所有制药巨头,包括拜耳、阿斯利康、武田、赛诺菲、默克和辉瑞,都加大了支出,希望创造新时代的人工智能解决方案,将为流程带来成本效益、速度和精度。
长期以来,传统的药物发现一直是出了名的困难。将一种新药推向市场至少需要 10 年,花费13 亿美元。而这仅适用于在临床试验中取得成功的药物(只有十分之一)。
因此,我们对寻找发现和设计药物的新方法产生了兴趣。
AI 已经帮助确定了有前途的候选疗法,而且不需要数年,而是数月甚至数天。
在本文中,我们将探讨 AI 药物发现如何改变行业。我们将研究成功案例、AI 优势和局限性。我们走吧。
毒品是如何被发现的
药物发现过程通常始于科学家确定体内与疾病有关的靶标,例如特定蛋白质或激素。然后他们使用不同的方法来寻找一个可能的解决方案,一个候选药物,包括:
- 筛选现有化合物:科学家可以筛选他们之前制造的化合物库(天然产物或化学物质),以检查它们是否具有所需的活性或与目标的相互作用。
- 从头设计药物:他们可以使用计算机建模和模拟来开发可以完成这项工作的新型化合物。这种方法用于制造小分子药物,这些药物是化学合成的小于 1,500 道尔顿的化合物。
- 生物制品:研究人员还可以生成抗体、酶或蛋白质等生物分子来充当药物。这涉及从可与目标相互作用的活生物体中分离或合成分子。与小分子相比,此类分子通常更大、更复杂。
- 重新利用:科学家可以查看为其他用途开发的化合物,看看它们是否具有治疗相关疾病的潜力。
一旦发现了潜在的候选药物(称为先导化合物),就会在细胞或动物中进行测试,然后进入包括三个阶段的临床试验,从一小群健康志愿者开始,然后进行到更大的患有具体情况。
人工智能如何应用
人工智能涵盖各种技术和方法,涉及使用复杂的计算方法来模仿人类智能的要素,例如视觉感知、语音识别、决策制定和语言理解。
人工智能始于 1950 年代,只是一系列简单的“如果,则规则”,并在开发出更复杂的算法后二十年后进入医疗保健领域。自 2000 年代深度学习问世以来,人工智能在医疗保健领域的应用得到了扩展。
一些人工智能技术正在赋能药物设计。
机器学习
机器学习 (ML)侧重于训练计算机算法从数据中学习并提高其性能,而无需明确编程。
ML 解决方案包含各种分支,每个分支都有自己独特的特征和方法。这些分支包括有监督和无监督学习,以及强化学习,在每个分支中,都有用于实现特定目标的各种算法技术,例如线性回归、神经网络和支持向量机。 ML 有许多不同的应用领域,其中之一是 AI 药物发现领域,它可以实现以下功能:
- 化合物的虚拟筛选以确定潜在的候选药物
- 药物疗效和毒性的预测模型
- 确定药物开发的新目标
- 分析从活生物体收集的大规模基因组和蛋白质组数据(DNA 序列、基因表达水平、蛋白质结构等)
- 优化药物剂量和治疗方案
- 患者对治疗反应的预测模型
深度学习
深度学习 (DL) 是基于使用人工神经网络 (ANN) 的 ML 的一个子集。人工神经网络由相互连接的节点或“神经元”组成,这些节点通过称为“突触”的通路连接。就像在人脑中一样,这些神经元协同工作以处理信息并做出预测或决策。神经网络拥有的互连神经元层数越多,它就越“深”。
与只能在结构化数据中识别模式的监督和半监督学习算法不同,深度学习模型能够处理大量非结构化数据,并在几乎不需要人工监督的情况下做出更高级的预测。
在 AI 药物发现中,DL 用于:
- 改进了化合物库的虚拟筛选,以识别更有可能与目标结合的命中
- 基于图像的分析以了解与疾病相关的表型、疾病机制或药物毒性
- 更准确地预测药物在体内的吸收、分布、代谢和排泄方式(药代动力学特性)
- 预测药物-靶标相互作用和结合亲和力
- 预测占目前确定的大部分药物靶点的蛋白质结构
- 生成具有所需物理、化学和生物活性特性的新型类药化合物
- 临床试验流程和方案设计的自动化
自然语言处理 (NLP)
NLP 依赖于语言学、数学和计算机科学(包括 DL 模型)的技术组合来分析、理解和生成人类语言。 AI 药物发现研究通常使用 NLP 从结构化和非结构化数据中提取信息以完成以下任务:
- 科学文献的文本挖掘,以确定化学/药物实体、它们的目标和新的疾病相关途径之间的关联
- 从非结构化电子健康记录 (EHR) 中提取结构化信息,例如患者人口统计、诊断和药物治疗
- 通过分析来自社交媒体、新闻文章和其他来源的文本数据来识别药物不良事件
- 根据协议确定临床试验资格标准并将患者与试验相匹配
- 药物信息汇总
为什么 AI 药物发现现在成为热门话题
在过去几年中,制药行业的公司已采取措施将 AI 纳入其研究方法。这包括建立内部 AI 团队,聘请 AI 医疗保健专业人员和数据分析师,支持专注于 AI 的初创公司,以及与技术公司或研究中心合作。
多种因素共同推动了这一趋势。
计算机的日益强大和新的 AI 发展
最近的技术进步已经改变了 AI 药物发现研究的传统重点。
由于该行业的大多数公司(根据BiopharmaTrend AI 报告,到 2022 年大约有 150 家)继续忙于设计小分子,这些小分子很容易在计算上表示并进行大规模比较,因此人们对人工智能的新应用也越来越感兴趣在药物发现方面。
许多公司开始采用 AI 来设计生物制品(77 家公司)并发现指示疾病存在或进展的生物标志物 (59)。其他人专注于构建包罗万象的 AI 药物发现平台、识别新目标或创建本体——不同实体(如化合物、蛋白质和疾病)之间关系的结构化表示。
扩大对人工智能工具的访问
由于人工智能人才短缺的情况没有缓解的迹象,人工智能药物发现的准入门槛实际上已经降低。技术供应商和制药巨头正在发布越来越复杂的人工智能平台,包括随时可用的无代码和拖放系统,使非人工智能专家能够将人工智能集成到他们的研究中。这些发展在行业加速采用人工智能方面发挥着重要作用。
人工智能支持的成功案例
学术界和业界开展的 AI 药物发现项目已经在药物发现的整个价值链中取得了首批成功的成果。例子包括:
- DeepMind 已经构建了人工智能系统 AlphaFold,它可以在几秒钟内根据蛋白质的一维氨基酸序列预测蛋白质的 3D 结构,而不是通常需要几个月或几年的时间。该系统用于预测超过 2 亿种属于动物、植物、细菌、真菌和其他生物的蛋白质结构。
- 华盛顿大学的研究人员开发了一种深度学习模型,该模型使用游戏计算机在 10 分钟内计算出蛋白质结构。
- Deep Genomics利用AI技术筛选了2400多种疾病和100,000个突变,预测了Wilson病突变的确切致病机制,并在18个月内创造了DG12P1药物。
- Aladdin 发布了专有的 AI 药物发现平台,用于虚拟筛选、先导化合物命中、先导化合物优化和临床前阶段的商业用途。该平台帮助 Aladdin 确定了许多药物化合物,用于治疗与年龄有关的疾病。
- IBM 开发了具有认知计算功能的 Watson 系统,制药行业使用该系统将患者与适合其病情的临床试验相匹配。在一项针对乳腺癌的临床试验中,该平台显示入组人数增加了 80%,试验匹配时间也减少了。
- AbCelera 用了不到三个月的时间开发出一种用于中和 COVID-19 病毒变体的单克隆抗体,并获得美国食品和药物管理局 (FDA) 的批准。
- BenevolentAI 已将其知识图谱与 AI 工具相结合,在几天内发现 baricitinib 作为一种潜在的 COVID-19 治疗方法。
- BioXcel Therapeutics 加速了右美托咪定作为精神分裂症和双相情感障碍患者镇静剂的发现。该公司在首次人体试验后不到四年内就获得了 FDA 批准其专有的右美托咪定 (IgalmiTM) 舌下膜。
- Exscientia 使用人工智能设计了三种小分子,用于在两年内进入临床试验(用于治疗阿尔茨海默病精神病、强迫症和免疫肿瘤学)。
- 2023 年初,Insilico 在第一个 AI 设计的新分子的 1 期临床试验中报告了积极的顶线结果,该分子是 AI 发现的治疗特发性肺纤维化( IPF )的新靶点。
- 2021年, 13个AI衍生生物药进入临床阶段,治疗领域包括COVID-19、肿瘤学、神经学等。
人工智能药物发现的好处和挑战
AI 是一种强大的工具,有望彻底改变制药行业。凭借其分析大量数据和做出预测的能力,人工智能可以通过以下方式帮助研究人员克服长期阻碍药物发现过程的障碍:
- 缩短发现和临床前阶段的时间
- 更准确地预测药物的疗效和安全性
- 对药物作用和疾病的新的、意想不到的见解
- 新的研究线和新的研发策略
- 通过更快的分析和自动化节省成本
据 Insider Intelligence 称,AI 可为制药行业节省高达 70% 的药物发现成本。人工智能在药物发现方面的潜力确实令人兴奋,但要充分利用它,首先需要解决一些障碍。
数据
谈到人工智能,它总是归结为输入数据。不允许整合的数据孤岛和遗留系统是任何领域人工智能研究的重大障碍。在制药行业,问题可能更为突出。
制药公司传统上不善于共享数据,无论是临床研究的结果还是去识别化的患者信息,而他们拥有的大量数据可能会为原始研究人员从未考虑过的问题提供答案。
当最终涉及共享数据时,它通常是不完整的、不一致的或有偏见的,就像用于预测对药物发现至关重要的蛋白质-配体结合亲和力的数据集一样。在某些情况下,数据甚至可能无法反映整个人口,人工智能模型在现实场景中可能存在不足。
复杂
生物系统的绝对复杂性使得基于人工智能的分析和预测其行为的时间和空间变化变得困难。
生物系统中存在大量复杂和动态的相互作用,其中蛋白质、基因和细胞等每个元素都可以具有多种功能,并受到多种因素的影响,包括遗传变异、环境条件和疾病状态。
不同元素之间的相互作用也可以是非线性的,这意味着一个元素的微小变化可能导致整个系统发生巨大变化。例如,控制细胞分裂的单个基因可能对肿瘤的生长产生很大影响,或者多种蛋白质之间的相互作用可能导致高度特异性和复杂结构的发展,例如细胞的细胞骨架。
另一个挑战是缺乏合格的员工来处理人工智能药物发现工具。
可解释性
在 AI 药物发现中使用神经网络已经突破了可能的界限,但缺乏它们的可解释性构成了重大挑战。被称为黑匣子的人工智能模型可能会产生最准确的预测,但即使是工程师也无法解释其背后的原因。这在深度学习中尤其具有挑战性,因为随着层数的增加,理解每一层输出的复杂性也会增加。
这种缺乏透明度会导致有缺陷的解决方案,并降低研究人员、医疗专业人员和监管机构对人工智能的信任。为了应对这一挑战,人们越来越需要开发可解释、值得信赖的人工智能。
包起来
正在改变患者游戏规则的新药不断涌现。
在 1980 年代 HIV 被确定为 AIDS 的原因后仅仅 15 年,制药业就开发了一种多药疗法,可以让受病毒影响的人过上正常的生活。诺华的格列卫延长了白血病患者的生命。来自 Vertex Pharmaceuticals 的 Incivek 使丙型肝炎治愈率提高了一倍。默克公司的 Keytruda 可将患者接受手术切除黑色素瘤后癌症复发的风险降低 35%。
但并非所有新药都是生而平等的。
最近在德国对 200 多种新药进行的分析表明,只有 25% 的药物比现有疗法具有显着优势。其余药物产生的益处很小或没有,或者它们的影响不确定。
鉴于药物发现的成本高昂和耗时的性质,制药行业显然需要重大变革。这就是人工智能药物发现可以发挥作用的地方。人工智能很有可能做出超越加速临床时间的变革性贡献。
考虑您自己的 AI 药物发现项目?给我们写信。凭借多年为医疗保健创建 AI 解决方案的经验,我们是您合适的合作伙伴。