Jan 01, 1970
人工智能可观测性和大型语言模型 (LLM) 评估平台Arize AI本周在 Google Cloud Next '24 上推出了即时变量监控和分析。
此次亮相正值人们迫切需要的时候。尽管企业竞相部署基础模型,以在日益由人工智能驱动的世界中保持竞争力,但幻觉和反应准确性仍然是生产部署的障碍。
Arize 的新提示变量监控功能可帮助 AI 工程师和机器学习团队自动检测提示变量中的错误并查明有问题的数据集。通过对 LLM 驱动的应用程序中使用的提示进行自省和改进,团队可以确保生成的输出符合准确性、相关性和正确性等指标的预期。今天还推出了其他上下文窗口管理工具,允许进一步检查。
Arize AI 首席执行官兼联合创始人 Jason Lopatecki 表示:“如今调试 LLM 系统实在是太麻烦了。通过分析 AI 系统如何响应大量提示并提供对模型行为的更深入洞察,Arize 的新提示变量分析工具有望帮助 AI 工程师在生产中获得更成功的结果——通过训练和反馈循环来指导持续改进。”
Arize AI是一个 AI 可观察性和 LLM 评估平台,可帮助团队在生产中交付和维护更成功的 AI。Arize 的自动监控和可观察性平台使团队能够在问题出现时快速检测问题、找出问题发生的原因,并提高传统 ML 和RAG LLM等生成用例的整体性能。Arize 总部位于加利福尼亚州伯克利。