Microsoft 在最新的 VentureBeat AI 影响之旅中深入探讨数据完整性

Microsoft 在最新的 VentureBeat AI 影响之旅中深入探讨数据完整性

数据完整性——从头到尾的透明度、准确性、一致性、相关性和整个生命周期的无偏见——对于生成式人工智能应用程序的成功至关重要。在波士顿举行的 VentureBeat AI Impact Tour 的第三站,VentureBeat 首席执行官 Matt Marshall 欢迎 Microsoft 的全球行业副总裁 Kathleen Mitford 以及来自 Biogen 和 State Street Financial 的数据科学专家就他们如何确保其 gen AI 应用程序的数据完整性以及跨行业的风险范围进行对话。

米特福德说,归根结底,是建立合乎道德、负责任的人工智能原则。

“这个空间是新的。这个领域正在快速发展。我们需要采取负责任的态度,并知道它现在并不完美,“她说。“我们将继续学习,继续推出我们负责任的人工智能原则,不仅针对Microsoft,还针对我们如何与客户互动,我们允许使用Azure OpenAI的用例类型,以及我们如何与生态系统互动的原则,因此,作为一个技术生态系统,我们都有我们都在努力实现的标准原则。”

自上而下的数据完整性

透明度和道德是负责任的人工智能的核心原则,但这也意味着对数据的管理方式负责,因为这直接影响数据质量和人工智能的成功。Mitford 解释说,这种责任超出了 IT 部门的范围;这是每个领导者的责任。

“当你考虑数据时,甚至在达到数据完整性之前,公司有哪些投资来确保他们拥有与他们试图解决的业务问题相一致的正确数据?”她说。“这需要一个高管级别的讨论,以确保执行团队在这方面进行投资,确保他们优先考虑将成为其业务最高优先级的领域和用例。”

数据通常是作为制作应用程序的副产品生成的,并且在应用程序消失很久之后,数据仍然存在。它是一种具有内在价值的持久资产,但通常不是以这种方式管理的,道富金融执行副总裁、首席数据官兼全球市场、风险、财务和企业首席信息官卡罗琳·阿诺德(Caroline Arnold)说。

“它必须从战略上进行管理,”她说。“你要明白,你拥有的皇冠上的宝石是什么?你如何管理它们?如何防止这些数据产生噪音?拥有这种所有权非常重要。对于商界的很多人来说,这是新的。数据创建者拥有数据。他们拥有数据的治理、数据的质量,并了解其他人如何使用和消费这些数据。

在这个转折点上,这种战略重点也是必不可少的,因为生成式人工智能正在吸引整个企业团队的想象力。客户经常来到 Microsoft,他们已经对如何利用这项技术提出了全面的想法。

“有了所有这些机会,你需要领导团队的指导,了解这将对业务产生哪些影响,”米特福德解释说。

论各行各业的数据完整性

金融和生物技术是世界上监管最严格的两个行业,长期以来一直对数据隐私和准确性要求严格,但生成式人工智能及其需要来自组织内部和外部来源的大量数据,增加了一个全新的皱纹。

在渤健,他们一直在与英国生物银行和美国的All of Us研究等财团合作,渤健数据科学和应用机器学习主管Dave Clifford说。这两项研究都是巨大而有价值的数据来源,但也需要大量的归一化来解决方差问题,并确保数据全面可靠和一致。

“作为一个科学家社区和算法开发人员社区,我们可以在其中一些工具和技术上做得更好,”克利福德说。“如果我们认真对待数据完整性,我们需要认真确保我们都同意数据完整性可以和应该是什么样子,并且我们与公共和私营部门合作来产生这些资源。

米特福德同意,管理复杂性需要一个生态系统。在Microsoft的案例中,负责任的人工智能意味着比以往任何时候都更紧密地与客户合作,以了解行业特定的细微差别,以确保数据完整性。该公司在数据解决方案方面投入了大量资金,例如其人工智能驱动的分析平台Fabric,该平台是SaaS解决方案的基础,使客户能够有效地管理数据,无论数据来源如何。

“我们已经与行业领导者就不同类型的数据进行了合作,它驻留在何处,是否有财团来管理这些数据,”米特福德说。“我们已经与这些财团合作,以确保我们在构建时考虑他们的信息。然后,我们正在与技术生态系统密切合作,构建标准连接器以引入它。让您的数据资产井井有条,这是能够从 AI 中获得价值的关键一步。

关于生成式人工智能的民主化

Mitford说,由于他们作为人工智能创新者和市场领导者具有独特的定位,Microsoft认为负责任的人工智能的很大一部分也在确保他们帮助推动技术向前发展。他们已将其编码在最近宣布的人工智能访问原则中,这些原则管理着他们的人工智能生态系统,确保公平,促进创新和促进竞争。

这些原则包括向世界各地的软件应用程序开发人员广泛提供 AI 模型和开发工具,提供用于访问和使用 Microsoft Azure 上托管的 AI 模型的公共 API,不使用来自训练、构建、部署或使用 Microsoft Azure 中开发人员的 AI 模型的任何非公开信息或数据来与这些模型竞争, 以及通过使 Azure 客户能够轻松导出和传输其数据,使他们能够切换到其他云提供商。

“在Microsoft,我们的使命是让地球上的每个人和每个组织都能取得更多成就,”她说。“这也适用于我们对人工智能所做的工作,而不仅仅是最富有的公司或最富有的国家。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5950.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

改善 LLM 的决策:两种当代方法

下一篇

Reka 发布了 Reka Core,这是其多模态语言模型,可与 GPT-4 和 Claude 3 Opus 竞争

微信公众号

微信公众号