数据中心运营:AI 和 ML 如何提高效率和弹性

数据中心运营:AI 和 ML 如何提高效率和弹性

数据中心必须提供更精细的实时数据,以保持零售商的运营弹性、响应迅速和在线,尽管存在潜在的安全和中断威胁。不可预测的供应链、长期的劳动力短缺、螺旋式的通货膨胀和能源成本只是零售业首席信息官和高级管理团队在优化数据中心时面临的一些挑战。

人工智能和机器学习 (ML) 可以帮助确定如何重新设计现有数据中心,使其不那么僵化、孤立且更可靠。使用 AI 和 ML 的主要目标之一是排查本地和云中发生如此多中断的原因。再加上电力和能源成本的螺旋式上升,需要优化数据中心性能以实现积极的可持续性绩效目标,数据中心成为解决人工智能和机器学习复杂问题的完美用例。

“从现在到20年,工作量将继续以每年约2025%的速度增长。传统的数据中心方法正在努力满足这些不断升级的需求,“EkkoSense美洲副总裁Tracy Collins写道。

戴尔人工智能战略负责人Brons Larson表示,“数据中心可以利用AI/ML来提高性能并优化配置和部署。

阿里云智能高级总监兼首席工程师Wendy Zhao补充说:“AI和ML在其发展过程中继续取得长足进步,它们现在正在对数据中心运营和IT管理产生切实的影响。

据IDC称,由于嵌入式AI功能,数据中心中50%的IT资产将自主运行。该公司表示,对于投资人工智能以实现IT基础设施自动化的企业来说,提高客户满意度以及自动化决策和重复性任务是整个组织的最大好处。

AI 和 ML 获得采用

超过一半(57%)的数据中心运营商表示,他们去年会信任人工智能做出常规运营决策,高于49年的2021%。考虑到数据中心中许多任务的手动密集程度,AI和ML可以显着降低成本并提高效率。

首席信息官告诉VentureBeat,解决减少中断,增强多站点弹性,优化直接液体冷却(DLC)以及改善容量规划和安全性等具有挑战性的问题,是他们有兴趣应用基于AI和ML的解决方案的领域。

能源成本正在飙升,这意味着在预算范围内运营数据中心更具挑战性。首席信息官和数据中心运营商正专注于评估软件设计的电源和人工智能如何帮助成倍地降低能源和冷却成本。

Equinix 是一家为许多世界领先企业提供数据中心服务和网络基础设施的全球提供商。他们的首席信息官Milind Wagle表示,该公司在220个国家运营着26多个数据中心。他们正在使用人工智能来调整他们的互联网“引擎室”,通过估计他们的数据中心将消耗多少电力和空间。

AI 可以帮助优化数据中心性能

利用人工智能,首席信息官和数据中心运营商可以优化功耗并提高电力使用效率 (PUE),从而在未来提高效率。随着整个行业的可持续发展压力增加,许多运营商没有准备好满足碳排放报告要求。

此外,中断仍然代价高昂且频繁,云应用程序尤其容易受到影响。人工智能有可能通过提高效率、减少中断和简化运营来帮助解决其中的一些问题。以下是 AI 可以帮助优化数据中心性能的关键领域

改进容量规划和资源分配

实时数据对于跨任何数据中心的容量规划和资源分配都至关重要。实时数据包含有关需要优化的位置、方式和内容以提高性能的见解。一个关键领域是识别容量规划和负载平衡中的任何瓶颈。这些是基于约束的问题,受监督的 ML 算法擅长解决。正确规划和资源分配对于在预算范围内运行蓬勃发展的数据中心至关重要。

AI 和 ML 有助于提高数据中心安全性

通过学习网络的正常行为并检测异常和偏差,人工智能可以帮助防止大规模数据泄露和黑客攻击。人工智能网络安全工具可以彻底筛选和分析所有传入和传出数据的安全威胁。

“永远不要相信;始终验证“是零信任企业安全的基础。除非安全策略明确允许,否则此方法不信任任何用户、应用程序或设备。组织可以通过采用零信任思维来提高混合环境的可见性、安全性和合规性,同时降低成本。

抢在碳足迹减少和报告的前面

AI 擅长识别各种数据模式,并帮助形成模型,了解数据如何随时间变化。事实证明,监督机器学习在解决复杂的基于约束的碳减排问题方面是有效的,这些问题涉及数百个影响排放的潜在变量和因素。

实现正确的可持续性意味着结合 AI 和 ML 的优势,在减少碳足迹方面表现出色。它太重要了,不能听天由命,它对未来的任何零售品牌都有重大影响。首席信息官表示,他们看到同行的薪酬计划与ESG目标挂钩,将可持续性作为减少碳足迹和报告工作核心的高度优先事项。

随着时间的推移,提高正常运行时间维护水平并衡量数据中心性能

了解为什么给定类型的服务器比其他服务器更需要重建,确定导致电源管理系统中断的原因以及解决资源平衡不起作用的原因,这些都是 ML 可以帮助解决的问题类型。关键是实现实时数据监控,并构建一个可以跟踪所有可用变量以解决性能瓶颈的数据集。

监督式 ML 模型在预测准确性方面表现出色。挖掘机器数据和构建模型来预测给定服务器何时需要预防性维护,可以节省数千美元和数小时的可用性损失。将数据中心中每个资产生成的实时数据视为跟踪性能随时间变化并找到改进新方法所需的智能。

结合 AI 和 ML 的优势,实现冷却、电力、电力和安全系统的自动化

目标是拥有一个可以自主运行的数据中心。通过捕获跟踪空气温度、冷却、功率负载、内部气压、资源负载和服务器性能的实时数据,可以实现这一点。促使首席信息官和数据中心运营商合作实现这一目标的原因是需要根据高级管理层设定的可持续性和ESG目标来衡量数据中心绩效。

使用 ML 来解释和创建基于环境监测和控制的模型对于衡量实现 ESG 目标的进度至关重要。众所周知,AI和ML需要广泛用于跟踪电源和冷却消耗,这是运行数据中心最昂贵的两个领域。

识别数据中心中的 AI 用例

确定人工智能可以在哪些方面对保护和优化数据中心做出最重大的贡献,必须从运营成本和安全性风险最大的地方开始。首席信息官告诉VentureBeat,寻找减少能源消耗的新方法以实现碳减排和可持续发展目标的挑战需要与他们继续经历的员工短缺相平衡。

正确优化冷却、空间、电源和服务器是保持数据中心在预算范围内运行和避免潜在中断的核心。据估计,数据中心使用的能源中有35%是通过冷却基础设施消耗的。根据Uptime Institues的57年全球数据中心调查,优化数据中心冷却,实施更多可再生能源选项并提高IT利用率可以将可持续性收益提高2022%。

数据中心使用 AI 的新兴用例包括效率风险分析、容量规划、安全和预算影响预测。在网络安全领域,使用人工智能来缩小IT和OT系统之间的差距是理所当然的,为每个数据中心和系统定义最低特权访问和身份管理也是如此。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/1912.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

Coursera提供课程,这样员工就不会被人工智能抢走他们的工作所蒙蔽。

下一篇

无处不在:元宇宙领导者计划以全新的规模建立数据中心

微信公众号

微信公众号