标普全球推出面向金融业的突破性人工智能基准测试

标普全球推出面向金融业的突破性人工智能基准测试

领先的金融情报提供商标普全球(S&P Global)周三悄悄宣布推出Kensho的标普人工智能基准(S&P AI BENCHMARKS)。这一创新解决方案旨在为评估大型语言模型 (LLM) 在复杂金融和定量应用中的性能设定新标准。

该基准测试工具由标普全球专注于人工智能的部门Kensho开发,用于评估法学硕士处理定量推理、从财务文件中提取数据和展示特定领域知识等任务的能力。然后,结果将显示在排行榜上,提供每个模型功能的透明视图。

S&P Global 首席 AI 官兼 Kensho 首席执行官 Bhavesh Dayalji 在接受 VentureBeat 采访时表示:“S&P AI BENCHMARKS 将 Kensho 的尖端 AI 研究和工程与 S&P Global 领先的金融情报能力相结合。“我们希望该解决方案成为了解LLM在复杂财务推理中的表现的行业标准,并鼓励FinAI领域更广泛的创新。”

标普人工智能基准测试的推出正值金融服务行业的关键时刻,越来越多的机构探索生成式人工智能和LLM在简化运营和获得竞争优势方面的潜力。然而,由于缺乏标准化基准,组织很难评估不同模型对其特定用例的适用性。

推动创新和明智决策

“像我们这样的基准测试解决方案对于帮助我们行业的机构和专业人士确定他们应该将哪些 LLM 用于他们的特定用例至关重要,”Dayalji 解释道。我们相信,S&P AI Benchmarks还将通过帮助金融专业人士确定每个模型在哪些方面表现良好以及如何增加最大价值来推动创新。

标普人工智能基准方法由多元化的专家团队开发和验证,其中包括来自标普全球各部门的工程师、研究人员、学者和金融专业人士。该评估集由 600 个问题组成,旨在严格测试 LLM 在三个关键类别中的表现。

人工智能在金融领域应用的里程碑

行业分析师认为,标准普尔人工智能基准的推出可能标志着人工智能在金融领域采用的一个重要里程碑。随着更先进的人工智能渗透到金融行业,拥有可靠且透明的基准测试工具对于希望就部署哪些模型做出明智决策的公司至关重要。S&P Global 的解决方案有助于加速 LLM 的负责任采用,并推动 FinAI 领域的创新。

展望未来,标普全球预计标普人工智能基准将在塑造金融服务业人工智能的未来方面发挥关键作用。“我们的愿景是看到LLM变得更加有效,更好地适应我们所处行业的需求,而像我们这样的解决方案将帮助我们实现这一目标,”Dayalji说。“我们鼓励所有模型提供商参与,以便我们能够继续发展我们的框架。”

随着金融业在快速发展的人工智能和生成式人工智能领域中航行,Kensho 的 S&P AI Benchmarks 等工具有望成为必不可少的指南,帮助组织利用这些技术的力量,同时确保准确性、透明度和负责任的部署。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5871.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Cohere 推出 Command R+,这是一款强大的企业 LLM,可击败 GPT-4 Turbo

下一篇

超越炒作:企业将Gen AI视为增长的关键推动力

微信公众号

微信公众号