人工智能 (AI) 为企业提供了很多帮助优化流程和提高运营效率的承诺。然而,许多人面临的挑战是让数据以正确的形状和正确的流程获得,以便真正能够从人工智能中受益。
这是FeatureByte的两位联合创始人Razi Raziuddin和Xavier Conort在企业AI平台供应商Datarobot工作时一次又一次地注意到的挑战。Raziuddin在Datarobot工作了五年多,包括担任AI服务高级副总裁,而Conort在Datarobot担任首席数据科学家超过六年。
“我们看到的挑战之一是,人工智能不仅仅是构建模型,这不仅是Datarobot的重点,而且是整个AI和ML(机器学习)工具空间的重点,”Raziuddin告诉VentureBeat。“仍然存在的关键挑战,我们称之为人工智能开发中最薄弱的环节,只是生产中数据的管理,准备和部署。
从数据分析中借用数据准备来改进 AI 开发
Raziuddin解释说,特征工程是多种活动的组合,旨在帮助优化,组织和监控数据,以便可以有效地用于帮助构建AI模型的特征。特征工程包括数据准备,并确保数据采用正确的格式和结构以用于机器学习。
在数据分析领域,数据准备过程并不是一门新学科;有一些ETL(提取,转换和加载)工具可以从操作系统中获取数据,然后将其带入执行分析的数据仓库。然而,根据Raziuddin的说法,同样的方法还没有用于AI工作负载。他说,人工智能的数据准备需要一种专门构建的方法,以帮助自动化机器学习(ML)管道。
为了做好特征工程和功能管理,Raziuddin说需要结合几种关键技能。首先是数据科学,具有理解数据结构和格式的能力。第二个关键技能是了解收集数据的域。不同的数据域和行业用例将具有不同的数据准备问题,例如为医疗保健部署收集的数据将与用于零售业务的数据大不相同。
通过对数据的透彻理解,可以在AI中构建功能,这些功能将进行优化以充分利用数据。
自动化 AI 特征工程
为人工智能获取正确形状的数据通常涉及除了一名或多名数据科学家之外,还需要一个数据工程团队。
FeatureByte的目标是帮助解决这一痛点,并提供一个简化的流程,使数据管道可供数据科学家用于为其AI模型构建功能。Raziuddin说,他的公司实际上致力于消除流程中的摩擦,并确保数据科学家可以在单个工具中尽可能多地做事,而不必依赖数据工程团队。
该公司的技术仍在开发中,尽管该公司对它应该能够做的事情有一些明确的目标。今天,它宣布在种子轮融资中筹集了5万美元。Raziuddin表示,该平台将利用这笔资金帮助嵌入领域知识和数据工程专业知识,以加速特征工程的过程。
FeatureByte的平台将基于云,并将能够利用现有的数据资源,包括云数据仓库和数据湖技术,如Snowflake和Databricks。
“随着人工智能模型数量的增加,可用于构建这些模型的数据源数量正在以比大多数团队能够处理的速度更快的速度增长,”Raziuddin说。“因此,除非有工具,除非这个过程是自动化和简化的,否则公司将无法跟上。
椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/3989.html
文章评论