像ChatGPT这样的生成式AI模型可以产生极具说服力的散文,完成以前需要人类作家才能完成的复杂任务。对于各地的企业来说,这应该是一个强大的工具,只是虽然ChatGPT的结果令人信服,但这些模型很容易让人产生“幻觉”:它们是编造的。
SambaNova公司产品高级副总裁Marshall Choy告诉EE Times,到目前为止,无法依靠答案来提供基本事实,限制了生成式AI在企业中的实用性。
“企业拥有海量的结构化和非结构化数据,”他说,“他们正试图弄清楚如何获得被困住的洞察力,尤其是在所有非结构化数据中。”
ChatGPT的成功向企业界展示了无限可能,但当我们以ChatGPT为乐时,“幻觉”并不重要,模型需要“强化”,然后才能在企业中用于以业务为中心的使用案例,Choy说。
这意味着我们停留在增强阶段,而不是如今就要实现完全自动化。
“我们发现,尤其是在企业中,这在很大程度上是一种强化学习和人类反馈的增强,”他说,“现实情况是,一个错误的成本越高,我们就越不愿意完全自动化。”
如果我们能确定它们说的是真话,像ChatGPT这样的生成式AI就有巨大的潜力。
与普通消费者使用ChatGPT等生成式AI模型不同,要想在企业中使用这一类模型,不但需要提高其处理特定问题的能力,还需要确保其产生的信息可以追溯到来源,并且不会造成知识产权保护的相关问题,这也正是在工业物联网等应用中使用生成式AI模型亟待解决的难题之一。
为了帮助行业上下游企业更好地把握AIoT市场发展机遇,6月8日,全球领先的专业电子机构媒体AspenCore将携手深圳市新一代信息通信产业集群联合主办2023国际AIoT生态发展大会,其平行分论坛——工业物联网&机器人论坛,将深入探讨工业物联网的未来发展方向和趋势,以及产业发展中所存在的机遇与挑战。欢迎报名参加!
SambaNova训练了一系列开源的生成式AI模型,包括GPT、Bloom和StableDiffusion,这些模型针对特定领域企业的使用进行了优化,无论是在金融、法律、医疗保健还是公共部门。这些领域中的用例可能包括客服中心交互分析或理解大量文档中的文本。
“开源模型将成为标准……世界上所有最好的模型都将开源,”SambaNova产品高级总监Anton McGonnell告诉EE Times,“我们的论点是,赢家是那些能够承载复杂性的平台,实际上能够大规模有效地运行这些模型,并且具有速度,因为[in models](模型中)的技术水平将发生很大的变化。”
但是我们如何让像GPT这样的生成式AI模型说真话呢?
McGonnell说,确保生成式AI的最大准确性在很大程度上取决于专业化——将训练模型与特定领域的数据相结合,然后使用公司自己的数据用SambaNova Suite等前端针对特定任务进行微调。
“世界上的聊天机器人正在做的是试图拥有一个能够理解所有领域所有信息的单一模型,但通过扩大搜索空间,你不可避免地使该模型成为万事通,但不是万能的大师,”他说,“我们的重点是打造一个真正专业的模型,就我们而言,这就是整个价值主张。”
然而,仅靠专业化并不总是足以满足企业对“ground truth”(真实数据)的需求。
SambaNova目前正在训练一个可以引用其来源的GPT版本——这样用户就可以轻松判断模型是否在说真话。向EE Times展示的模型的早期版本可以将模型生成的文本链接到信息来源的文档,从而让用户相信该模型实际上正在产生真实数据。
Marshall Choy(图片来源:SambaNova)
Choy说,对真实数据的需求是消费者和企业应用之间的区别。
“你必须有引证,才能避免侵犯版权并了解事物的真正来源;你的来源不可能是ChatGPT,”他说,“ChatGPT的开发旨在以令人信服的语气提供答案,即使答案不正确......企业需要引用,他们需要信息来源的可解释性。否则,你可能会无意中剽窃或侵犯他人的版权,以及传播错误信息。”
他补充说,使类似ChatGPT的模型更适合企业的其他想法可能包括简单地回答模型不知道答案,而不是编造一些东西。
SambaNova也在解决安全和隐私等企业关心的问题:其DataScale硬件系统可以部署在客户的防火墙后面,以符合公司自己的安全标准。
“我们不像消费者公司那样使用共享部署或共享端点,”Choy说,“我们正在使[enterprises](企业)拥有自己的专用主干网,因此没有IP泄漏或污染风险。开放标准,它是关于灵活性和选择的——他们可以采用我们的开源模型并按照他们的方式行事……我们让客户使用他们的训练数据,但他们保留模型和数据的所有权,这与他们去找云端的消费级生成式AI供应商不同。”
(原文刊登于EDN姊妹网站EE Times,参考原文:ChatGPT for Enterprise: Can We Make It Tell the Truth?,由Ricardo Xie编译。)
与普通消费者使用ChatGPT等生成式AI模型不同,要想在企业中使用这一类模型,不但需要提高其处理特定问题的能力,还需要确保其产生的信息可以追溯到来源,并且不会造成知识产权保护的相关问题,这也正是在工业物联网等应用中使用生成式AI模型亟待解决的难题之一。