paint-brush
生成式人工智能和生物技术的未来 - 采访年度初创公司提名者 NExtNet Inc.经过@nextnetinc
275 讀數

生成式人工智能和生物技术的未来 - 采访年度初创公司提名者 NExtNet Inc.

经过 NExTNet Inc.6m2023/08/24
Read on Terminal Reader

太長; 讀書

生物医学知识巨大且增长迅速。公开的知识是互不相关的——不可能识别隐藏在这种互不相关的知识深处的模式/关联。公司的内部知识也与之脱节。这对生物医学行业的科学家提出了重大挑战,因为他们: 1)错过重要且潜在相关的知识 2)无法及时了解最新情况或跟上新知识 3)在没有完整洞察力的情况下做出决策 在 NExTNet,我们正在构建一流的生成/语言人工智能堆栈,使科学家能够识别隐藏在不同的多模态数据集中的模式,范围从科学论文和临床试验报告到基因测序和蛋白质表达图谱——以便他们能够快速找到埋藏在海量信息中的线索。
featured image - 生成式人工智能和生物技术的未来 - 采访年度初创公司提名者 NExtNet Inc.
NExTNet Inc. HackerNoon profile picture
0-item

嘿黑客们,


NExTNet Inc.获得了在美国旧金山举行的 HackerNoon 年度初创公司奖提名。


在这里为我们投票。


请阅读下面有关我们的更多信息,了解为什么我们值得您投票。


您也参加 SOTY 2023 吗?如果是这样, 请点击此处填写此采访。


认识 NExTNet Inc.

少搜索。发现更多。


NExTNet是一家由风险投资支持的硅谷企业软件初创公司,为生物技术和制药领域的关键任务应用开发生成式人工智能技术。我们的使命是组织和整合世界生物医学知识并使其易于获取。想象 NExTNet = Oracle x Palantir。在这里认识我们的团队。


我的角色

2017 年底,我创立了Mekonos,这是一家快速发展的生物技术平台公司,开发突破性的硅芯片技术,以加速个性化医疗的发展。想象一下 Nvidia 在生物技术领域的表现。我于 2020 年底创立了NExTNet ,当时我对获取埋藏在多模式和不同生物医学数据和信息中的分散知识的极高技术障碍感到沮丧。我们的目标是实现世界生物医学知识的民主化,以加速药物发现和开发。人类已知的疾病超过 23,500 种,其中约 3% 具有某种形式的治愈或治疗方法。



我们如何颠覆人工智能和生物医学行业的交叉点




全球大约 95% 的数据是在过去 5-10 年中生成的。高分辨率、多模式生物医学数据(数以千万计的科学出版物、专利、拨款、测序数据、基因和蛋白质表达、药物化合物、生化途径、疾病、成像等)的大规模出现导致了大量的人类知识分散在数据孤岛中。查询所有这些知识已经变得非常复杂。




在 NExTNet,我们使用专有的大型语言模型堆栈来挖掘文本中的科学内容(例如已发表的文献、临床试验记录、专利)与其他公共和专有数据库(基因测序、蛋白质表达、疾病、途径、病原体)之间的关联、药物、成像...)并将它们在语义上链接到世界上增长最快的科学语义网络。查询和访问如此分散的知识的技术障碍非常高:普通研究人员需要通过掌握无数的 R 库、学习一整套 Python 包或使用诸如如 SQL、SPARQL 等。


NExTNet 的云原生平台使这些研究人员和科学家能够用简单的自然语言提出和回答复杂的问题,而无需掌握编码、查询语言或神秘的统计数据。我们的商业和技术突破使科学家能够识别隐藏在不同的多模式数据集中的模式,从科学论文和临床试验报告到基因测序和蛋白质表达图谱,以便他们能够快速找到埋藏在海量信息中的线索通过我们的图形用户界面 (GUI)。我们正在破坏语言和生成人工智能以及生物医学行业的交叉点。


从人群中脱颖而出


生命科学研发的知识发现是一个处于萌芽状态的市场。当今生物医学的关键问题:


  • 生物医学知识正在以指数速度增长。

  • 随着不同数据(例如,科学文本、来自测序、基因编辑和其他实验等的分子数据)数量的增加,研究人员越来越难以跟上最新技术水平。

  • 由于在不了解命令行界面的情况下,访问深埋在所有这些多模式数据孤岛中的知识的技术障碍非常具有挑战性,因此在做出决策时没有关键见解和遗漏的知识。


在 NExTNet,我们的价值比竞争对手增加了 10 倍,这是因为我们最先进的生成式 AI 管道不仅可以读取数以千万计的科学文本(完整的同行评审出版物、摘要、专利、资助等),还可以分析一个庞大的分子数据库(基因、蛋白质和途径)语料库,以及在这些不同数据(公共领域和专有数据)中隐藏的关联和模式的挖掘。我们的竞争对手仅限于文本挖掘,而没有扩展到其他数据模式。


我们对 2023 年药物发现和开发/生物医学研究行业的预测/思考


  • 作为一家初创公司,我们专注于药物发现和开发市场,因为在临床前阶段进行任何临床试验之前至少要花费 3-7 年的时间。还有大量风险投资资金投资于人工智能药物发现公司(Atomwise、Insilico、Benevolent AI、Exscientia、Insitro、Recursion 等拥有自己的治疗产品线)。


  • 考虑到将药物推向市场的重大风险以及较长的开发时间(可能长达十年甚至更长)、与 FDA 等监管机构的合作以及共同开发伙伴关系的较长周期(例如预付款+里程碑+特许权使用费),我们很早就决定只专注于软件开发,而不是让其他开发尖端疗法的生物技术和制药公司在 NExTNet 的语义知识网络之上'contextualize'他们的专有数据 --> 询问并回答复杂的生物学问题以推进他们的药物开发工作。像 Benchling 这样的公司作为一家企业软件公司迄今为止已经取得了巨大的成功。


  • 为了让大家了解药物发现和开发的巨大成本:30 年前,将一种药物推向市场需要约 3 亿美元,而今天则需要约 2.4 亿美元(考虑到通货膨胀)。这并不是因为特定分子的发现和开发过程的任何一个阶段都变得更加昂贵。事实上,其中许多阶段的生产率都得到了有意义的提高——因此,如果有的话,将药物推向市场的总成本应该会变得更便宜。将药物推向市场的成本如此之高的真正原因是,我们在每个阶段投入的大多数药物都失败了,漏斗变得越来越宽,缩小到越来越少的药物数量。下一阶段。


  • 这显然是我们在一个阶段观察所述特征(例如,理解分子作用机制、生物过程等)并预测下一阶段将取得成功的能力的失败。这就是更好的预测性机器学习模型(例如自然语言人工智能)可以发挥巨大作用的地方。


  • 此外,传统上,疾病是通过其症状及其在体内的位置来诊断的,而不是通过特定患者特有的潜在分子机制、途径或生物过程来诊断。在疾病进展的早期确定目标并发现其与途径的联系有助于在因果阶段而不是症状阶段进行干预。因此,许多处方药通常对患者不起作用。


用什么词来形容 2023 年“人工智能与生物医药产业的交叉点”的状态?

语言人工智能


为什么我们决定参加 HackerNoon 的年度初创公司奖


我们被邀请了! :)


最后的想法

生物医学知识巨大且增长迅速。公开可用的知识是断开的——不可能识别隐藏在这种断开的知识深处的模式/关联。公司的内部知识也与之脱节。这对生物医学行业的科学家提出了重大挑战,因为他们:


  • 错过重要且潜在相关的知识

  • 无法跟上最新情况或跟上新知识

  • 决策是在没有完整洞察力的情况下做出的


在 NExTNet,我们正在构建一流的生成/语言人工智能堆栈,使科学家能够识别隐藏在不同的多模式数据集中的模式,范围从科学论文和临床试验报告到基因测序和蛋白质表达图谱——以便他们能够快速找到埋藏在海量信息中的线索。


这里免费注册,开始您的生物医学知识发现之旅。