使语言模型有用的秘诀

使语言模型有用的秘诀

如果你以商业领袖的身份向我描述了你的症状,而我把它们输入到ChatGPT中,你是否希望我为你制定并开出一个治疗计划,将订单发送给你当地的药剂师——而不咨询医生?

如果你被邀请做一笔交易:世界顶尖的数据科学家将加入你的组织,但有一个问题是,你的每一位业务专家都必须加入你的竞争对手,只留下数据来工作,没有专家来提供背景信息?

在人工智能时代,公共广场上充斥着吹捧采用生成式人工智能的机会、风险、威胁和推荐做法的声音——尤其是 GPT-4 或 Bard 等语言模型。每天都会宣布新的开源模型、研究突破和产品发布。

在这种市场势头中,人们将重点放在了语言模型的能力上,但语言只有在与知识和理解相结合时才有用。如果有人记住了字典中所有与化学有关的单词,并且在不了解或理解基本原理的情况下就可以背诵,那么这种语言将毫无用处。

获得正确的配方

对于语言模型来说,这更进一步,可能会产生误导,因为模型不仅可以背诵相关单词,还可以背诵专家编写的基础文档、框架、短语和建议。

例如,当被要求生成一个新食谱时,他们可以使用以前的食谱和描述之间的相关性来创建一个新食谱,但他们不知道什么味道好,甚至不知道品尝的体验是什么。如果在过去的食谱中混合橄榄油、番茄酱和桃子之间没有相关性,那么模型就不太可能混合这些成分——不是因为他们知道或了解什么味道好,而是因为数据集中这些成分之间缺乏相关性。

因此,由语言模型生成的美味食谱是一种统计可能性,为此我们可以感谢其食谱包含在原始源数据中的专家。语言模型非常强大,而使它们有用的秘诀是专业知识。

专业知识将语言与知识和理解相结合

“相关性不等于因果关系”这句话是那些与数据打交道的人所熟知的。它指的是这样一个事实,即你可以在两个不相关的事物之间画出一个错误的相关性,误解这种联系,暗示一个导致了另一个,比如一只公鸡在早上打鸣,命令太阳升起。

机器在识别相关性和模式方面非常有帮助,但需要专业知识来确定这些是否意味着真正的因果关系,并应该为决策提供信息(例如是否投资训练公鸡提前一小时打鸣以获得额外的一小时日光)。

在人类的学习体验中,语言只是第一步。当孩子学习语言来标记事物、人物、地点、动词等时,他们的照顾者会用它来灌输知识。我们生活在一个叫做地球的星球上。天空中的那个球被称为太阳。下一步是了解因果关系(因果关系或因果关系):天空中的太阳让你的皮肤感到温暖。跳入冰冷的湖中可以让你冷静下来。

当我们成年时,我们已经内化了复杂的专业知识结构,包括语言、知识(什么)和理解(为什么)。

重新创建专业知识结构

考虑任何主题。如果你的语言没有知识或理解,你就不是专家。我知道传统汽车有变速器,有活塞的发动机,有油箱——我有一些关于汽车的语言。

但是我有知识吗?我知道汽车通过燃油喷射向发动机输送汽油,并且有涉及活塞点火的反应,这对推动汽车前进至关重要。但我明白为什么吗?如果它停止工作,我知道如何修复它吗?令我的高中汽车店老师懊恼的是,我需要聘请一位了解原因并知道如何修复它的专家,通过实践经验学习。

将其转化为机器上下文,没有知识(由知识图谱和模型表示)或理解(由因果模型表示)的语言模型永远不应该做出决策,因为它们没有专业知识。语言模型自己做出决定,就像把一个工具箱和你的汽车访问权限交给一个只记住了与汽车有关的所有事情的下一个最有可能的单词的人。

那么,我们如何通过重新创建机器的专业知识结构来利用语言模型的潜力呢?

从专业知识开始,向后工作

机器学习 (ML) 和机器教学是将人类专业知识转化为机器语言领域的子学科,以便机器可以为人类决策提供信息或自主做出决策。这可以释放人类的能力,让他们专注于过于微妙或没有足够的数据来翻译成机器语言的决策和发现。

机器学习从如何更好地装备机器学习的问题开始,而机器教学则从如何更好地装备人类来教机器的问题开始。

在围绕 AI 和 ML 的讨论中,最常见的误解是数据是最关键的元素,但专业知识是最关键的元素。否则,什么是模型学习?当然,它可以在几秒钟内识别模式、分类并梳理数百万行数据。但是,是什么让这些模式有用呢?

当专家确定一种模式可以为有利于组织及其客户的决策提供信息时,该专业知识可以转化为机器语言,并且可以教导机器将该模式与业务规则相关联,并自主做出有益的决策。

因此,将专业知识提炼到机器中的过程不是从数据开始的,而是从专业知识开始的,然后向后工作。例如,当机器操作员注意到机器发出的某些声音与必要的调整相关时。例如,当它发出尖锐的哨声时,需要调低温度。除了满负荷工作之外,操作员还要全天聆听,以防机器发出其中一种声音。没有与这种情况相对应的预先存在的数据,但有专业知识。

从这些专业知识中向后工作是相当简单的。安装检测机器发出的声音的传感器,然后与专家合作将这些声音(频率和分贝组合)关联起来,以便对机器进行必要的调整。然后,该过程可以卸载到自主系统,从而腾出操作员的时间来处理其他职责。

确定最关键的专业知识

构建人工智能解决方案的过程应该从哪些专业知识对组织最重要的问题开始,然后评估与失去专业知识相关的风险水平,或者将专家驱动的决策卸载到机器的潜在好处。

组织中是否只有一个人了解该过程或如何在系统出现故障时修复系统?数以千计的员工是否每天都遵循相同的流程,这些流程可以卸载到自主系统,从而在他们的日常日历上腾出额外的 30 分钟?

第三步是评估哪些与最高风险或潜在上行空间相关的内容可以翻译成机器语言。这是数据和工具(如语言模型)作为推动者进入对话的步骤,将专业知识转化为机器语言并与机器交互。

幸运的是,对于大多数组织来说,构建专家系统的基础已经奠定,作为起点,语言模型可以参考或根据已编程到其中的专业知识进行检查。

从勘探到运营

在未来十年中,我们将看到基于对人工智能投资的市场部门进行重组。

一个警示故事是视频点播的出现:Netflix 于 2007 年推出了流媒体。三年后,百视达申请破产,尽管在1995年孵化并试行了百视达点播。

当竞争对手推出具有有意义和差异化的人工智能应用时,可能已经太晚了,特别是考虑到开发强大的应用程序所需的时间和专业知识。

到 2030 年,我们现在崇敬的家喻户晓的名字将与百视达一起加入行列,因为他们选择快速跟随,当他们看到市场力量将要消亡时,为时已晚。

领导者不应计划等待开发商的投资和开发并做出反应,而必须从他们在市场上能取得什么成就的问题开始,这需要其他人争先恐后地做出反应。

在自主转型的时代,最有能力保持或扩大其市场地位的组织将是那些投资于将可操作的专业知识转移到机器上并为市场的未来和组织可以创造的价值设定愿景的组织,委托对未知进行探险,以发现该愿景是否可以实现, 同时严格地将发现提炼成有形的价值。

椰有料原创,作者:小椰子啊,转载请注明出处:http://www.studioyz.com/5349.html

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

企业如何使用 Gen AI 来防止 ChatGPT 泄漏

下一篇

Clinatec 展示脑机神经接口

微信公众号

微信公众号