麦肯锡：生成式 AI 重启：重新布局，在 2024 年将潜力转化为价值| 观点与方案

作者：作者：埃里克·拉马尔、亚历克斯·辛格拉、亚历山大·苏哈列夫斯来自：麦肯锡次 2024-03-13

麦肯锡：生成式 AI 重启：重新布局，在 2024 年将潜力转化为价值

2024 年将成为新一代人工智能证明其价值的一年，企业应该牢记数字化和人工智能转型中吸取的惨痛教训：竞争优势来自于构建组织和技术能力，以广泛创新、部署和改进解决方案。规模化——实际上是为分布式数字和人工智能创新重新布局业务。

只有当公司对其业务进行更深入的组织手术时，生成式人工智能的回报才可能到来。

是时候重置生成式人工智能（gen AI）了。随着公司意识到捕捉新一代人工智能的巨大潜在价值比预期更困难，2023 年最初的热情和一系列活动正在让位于重新思考和重新调整。

希望通过人工智能技术取得早期胜利的公司应该迅速采取行动。但那些希望人工智能能够提供一条捷径来克服艰难且必要的组织手术的人可能会得到令人失望的结果。启动试点（相对）容易；让试点规模扩大并创造有意义的价值很困难，因为它们需要对实际完成工作的方式进行广泛的改变。

让我们简要地看一下这对一家太平洋地区电信公司意味着什么。该公司聘请了一位首席数据和人工智能官，其任务是“使组织能够利用数据和人工智能创造价值”。首席数据和人工智能官与业务部门合作制定战略愿景并实施用例路线图。在扫描整个企业的领域（即客户旅程或功能）和用例机会后，领导层优先考虑家庭服务/维护领域进行试点，然后作为更大的计划序列的一部分进行扩展。他们的目标特别是开发一种人工智能工具，以帮助调度员和服务运营商更好地预测为家庭提供服务时所需的呼叫类型和零件。

领导层组建了具有共同目标和激励措施的跨职能产品团队来构建新一代人工智能工具。为了提高整个企业的技能，更好地使用数据和人工智能工具，他们还建立了一个数据和人工智能学院，调度员和服务操作员参加了培训。为了为 gen AI 提供技术和数据基础，首席数据和人工智能官还选择了一个大型语言模型（LLM）和云提供商，既可以满足该领域的需求，也可以服务于该领域的其他部分。企业。首席数据和人工智能官还监督数据架构的实施，以便能够快速、负责任地交付构建 gen AI 工具所需的干净可靠的数据（包括服务历史记录和库存数据库）。

我们的书《重新连线：数字和人工智能时代的麦肯锡竞争指南》（Wiley，2023 年 6 月）提供了关于实现利用数字和人工智能技术的广泛变革所需的六种能力的详细手册。在本文中，我们将探讨如何扩展这些功能，以大规模实施成功的人工智能项目。虽然我们认识到现在还处于早期阶段，还有很多东西需要学习，但我们的经验表明，要突破新一代人工智能的机遇，企业需要通过以下方式重新调整其工作方式。

找出新一代人工智能副驾驶可以在哪些方面为您带来真正的竞争优势

围绕人工智能技术的广泛关注及其相对易用性引发了跨组织的大量实验。然而，这些举措大多数不会产生竞争优势。例如，一家银行购买了数万个 GitHub Copilot 许可证，但由于它对如何使用该技术没有清晰的认识，因此进展缓慢。我们经常看到的另一个不集中的努力是当公司开始将人工智能纳入其客户服务能力时。对于大多数公司来说，客户服务是一种商品能力，而不是核心业务的一部分。虽然在这种情况下，人工智能可能有助于提高生产力，但它不会创造竞争优势。

为了创造竞争优势，公司首先应该了解“接受者”（可用工具的用户，通常通过 API 和订阅服务）、“塑造者”（具有专有数据的可用模型的集成者）和“制造商”（LLMs 的构建者）。目前，创客方法对于大多数公司来说过于昂贵，因此企业的最佳选择是实施接受者模型以提高生产力，同时构建塑造者应用程序以获得竞争优势。

新一代人工智能的近期价值很大程度上与其帮助人们更好地完成当前工作的能力密切相关。通过这种方式，Gen AI 工具充当副驾驶，与员工并肩工作，创建开发人员可以调整的初始代码块，或者为现场维护人员起草新零件的申请单。可以审查并提交（请参阅侧边栏“跨三种生成式 AI 原型的副驾驶示例”）。这意味着公司应该关注副驾驶技术可以对其优先项目产生最大影响的领域。

例如，一些工业公司已将维护视为其业务的关键领域。审查维护报告并花时间与一线工作人员交流，可以帮助确定新一代人工智能副驾驶可以在哪些方面发挥重大作用，例如快速、尽早地识别设备故障问题。新一代人工智能副驾驶还可以帮助识别卡车故障的根本原因，并比平常更快地推荐解决方案，并作为最佳实践或标准操作程序的持续来源。

副驾驶面临的挑战是弄清楚如何通过提高生产力来创收。例如，就客户服务中心而言，公司可以停止招募新代理并利用人员流失来潜在地实现真正的财务收益。因此，预先制定如何通过提高生产力来创造收入的计划对于获取价值至关重要。

提高您所拥有的才能，但要清楚您需要的特定于人工智能的技能

到目前为止，大多数公司都对他们所需的技术一代人工智能技能有了相当的了解，例如模型微调、向量数据库管理、即时工程和上下文工程。在许多情况下，您可以培训现有员工来发展这些技能。那些拥有现有人工智能和机器学习 (ML) 能力的企业拥有强大的领先优势。例如，数据工程师可以学习多模式处理和矢量数据库管理，MLOps（ML 操作）工程师可以将其技能扩展到 LLMOps（LLM 操作），数据科学家可以开发即时工程、偏差检测和微调技巧。

学习过程可能需要两到三个月才能达到适当的能力水平，因为学习各种LLMs可以做什么和不能做什么以及如何最好地使用它们非常复杂。例如，编码员需要获得构建软件、测试和验证答案的经验。一家金融服务公司花了三个月的时间才将其最优秀的数据科学家培训到高水平的能力。虽然提供了课程和文档（许多 LLM 提供商为开发人员开设了训练营），但我们发现大规模构建能力的最有效方法是通过学徒、培训人员然后培训其他人以及建立社区从业者。通过团队轮换专家来培训其他人、安排定期会议让人们分享学习成果以及举办每两周一次的文档审查会议，这些做法已被证明在建立从业者社区方面取得了成功（请参阅附文“所需的新生成人工智能技能示例”）。

重要的是要记住，成功的新一代人工智能技能不仅仅是编码能力。我们开发自己的 gen AI 平台 Lilli 的经验告诉我们，最好的 gen AI 技术人才拥有发现解决方案重点的设计技能、确保生成最相关和高质量答案的上下文理解能力、以及工作协作技能与知识专家合作（测试和验证答案并制定适当的管理方法），具有强大的取证技能来找出故障原因（问题是数据、对用户意图的解释、嵌入元数据的质量还是其他什么）其他？），以及构思和计划可能结果并将正确类型的跟踪放入代码中的预期技能。本质上不具备这些技能的纯粹程序员可能不会成为有用的团队成员。

虽然目前的技能提升主要基于“在工作中学习”的方法，但我们看到，对于在过去一年中学习了这些技能的人来说，市场正在迅速崛起。这种技能的增长正在迅速进行。 GitHub 报告称，开发人员正在“大量”开发 gen AI 项目，2023 年在其平台上创建了 65,000 个公共 gen AI 项目，比前一年增长了近 250%。如果您的公司刚刚开始其 gen AI 之旅，您可以考虑聘请两到三名高级工程师，他们已经为公司构建了 gen AI 塑造器产品。这可以大大加快你的努力。

组建一个集中团队来制定标准，以实现负责任的扩展

为了确保业务的所有部分都能扩展新一代人工智能能力，集中能力是自然而然的第一步。该中心团队的重点将是开发并实施支持规模的协议和标准，确保团队可以访问模型，同时最大限度地降低风险并控制成本。例如，该团队的工作可能包括采购模型并规定访问它们的方式、制定数据准备标准、建立批准的提示库以及分配资源。

在开发 Lilli 时，我们的团队在创建开放插件架构并为 API 的运行和构建方式设定标准时，就着眼于规模。他们开发了标准化工具和基础设施，团队可以在其中安全地试验和访问 GPT LLM、团队可以访问的带有预先批准的 API 的网关以及自助开发人员门户。我们的目标是，随着时间的推移，这种方法可以帮助将“Lilli 作为产品”（少数团队用来构建特定解决方案）转变为“Lilli 作为平台”（整个企业的团队可以访问该平台来构建其他产品））。

对于开发新一代人工智能解决方案的团队来说，团队的组成将与人工智能团队类似，但拥有具有新一代人工智能经验的数据工程师和数据科学家，以及更多来自风险管理、合规和法律职能的贡献者。为小队配备来自不同专业领域的资源的总体思路不会改变，但人工智能密集型小队的技能构成将会改变。

建立可扩展的技术架构

构建一代人工智能模型通常相对简单，但使其大规模全面运行则完全是另一回事。我们看到工程师在一周内构建了一个基本的聊天机器人，但发布一个稳定、准确且合规的版本可能需要四个月的时间。我们的经验表明，这就是为什么实际模型成本可能低于解决方案总成本的 10% 到 15%。

规模化建设并不意味着构建新的技术架构。但这确实意味着专注于一些核心决策，这些决策可以简化和加快流程，而无需花费大量资金。其中三个决定尤为突出：

专注于重用您的技术。重用代码可以将 gen AI 用例的开发速度提高 30% 到 50%。一种好的方法是简单地为批准的工具、代码和组件创建源。例如，一家金融服务公司创建了一个生产级工具库，该库已得到安全和法律团队的批准，并将它们放在库中供团队使用。更重要的是花时间识别和构建最优先用例中常见的功能。例如，同一家金融服务公司确定了三个可重复用于 100 多个已确定用例的组件。通过首先构建这些，他们能够为所有已识别的用例生成代码库的很大一部分——本质上为每个应用程序提供了一个良好的开端。
该架构的重点是实现一代人工智能模型和内部系统之间的高效连接。为了让新一代人工智能模型在塑造者原型中有效工作，他们需要访问企业的数据和应用程序。集成和编排框架的进步大大减少了建立这些连接所需的工作量。但阐明这些集成是什么以及如何实现它们对于确保这些模型有效运行并避免产生技术债务的复杂性至关重要（公司为解决现有技术问题所需的时间和资源而支付的“税”）。首席信息官和首席技术官可以为其组织定义参考架构和集成标准。关键要素应包括模型中心，其中包含可按需配置的经过培训和批准的模型；标准 API，充当连接新一代 AI 模型与应用程序或数据的桥梁；上下文管理和缓存，通过为模型提供来自企业数据源的相关信息来加快处理速度。
建立您的测试和质量保证能力。我们自己构建 Lilli 的经验告诉我们应该优先考虑测试而不是开发。我们的团队不仅投资于为每个开发阶段制定测试协议，而且还协调整个团队，以便明确谁具体需要在流程的每个阶段签字。这减慢了最初的开发速度，但通过减少错误和修复错误所需的时间，加快了整体交付速度和质量。

确保数据质量并专注于非结构化数据来为您的模型提供支持

企业从新一代人工智能模型中生成和扩展价值的能力将取决于它如何充分利用自己的数据。与技术一样，需要对现有数据架构进行有针对性的升级，以最大限度地发挥 gen AI 的未来战略优势：

有针对性地提高数据质量和数据增强工作。虽然数据质量一直是一个重要问题，但新一代人工智能模型可以使用的数据的规模和范围（尤其是非结构化数据）使得这个问题变得更加重要。因此，建立正确的数据基础至关重要，从澄清决策权到定义清晰的数据流程，再到建立分类法，以便模型可以访问所需的数据。做得好的公司将其数据质量和增强工作与特定的 AI/gen AI 应用程序和用例联系起来——您不需要将此数据基础扩展到企业的每个角落。例如，这可能意味着为所有设备规格和报告的问题开发一个新的数据存储库，以更好地支持维护副驾驶应用程序。
了解非结构化数据中锁定了哪些价值。大多数组织传统上将数据工作重点放在结构化数据（可以在表格中组织的值，例如价格和功能）。但 LLMs 的真正价值来自于它们处理非结构化数据（例如 PowerPoint 幻灯片、视频和文本）的能力。公司可以找出哪些非结构化数据源最有价值，并建立元数据标记标准，以便模型可以处理数据，团队可以找到他们需要的内容（标记对于帮助公司在必要时从模型中删除数据尤其重要）。创造性地思考数据机会。例如，一些公司会在高级员工退休时对其进行访谈，并将获取的机构知识输入 LLM 中，以帮助提高他们的副驾驶绩效。
进行优化以大规模降低成本。公司为数据支付的费用与优化数据基础设施和基础成本后可能支付的费用之间通常存在十倍之多的差异。这个问题通常源于公司在没有优化数据方法的情况下扩展其概念验证。有两个成本通常比较突出。其中之一是公司将 TB 级数据上传到云端并希望该数据 24/7 可用而产生的存储成本。实际上，公司很少需要超过 10% 的数据才能达到这种级别的可用性，并且在 24 或 48 小时内访问其余数据是一个更便宜的选择。其他成本与需要随时访问数千个处理器才能运行的模型的计算相关。当公司构建自己的模型（创客原型）以及使用预训练模型并使用自己的数据和用例运行模型（塑造者原型）时，情况尤其如此。公司可以仔细研究如何优化云平台上的计算成本，例如，将一些模型放入队列中，以便在不使用处理器时运行（例如当美国人睡觉和使用 Netflix 等计算服务时）减少）是一个更便宜的选择。

建立信任和可重用性以推动采用和规模化

由于许多人对新一代人工智能心存疑虑，因此解释这些工具如何工作的门槛比大多数解决方案要高得多。使用这些工具的人想知道它们是如何工作的，而不仅仅是它们做了什么。因此，投入额外的时间和金钱通过确保模型准确性并方便检查答案来建立信任非常重要。

例如，一家保险公司创建了一款人工智能工具来帮助管理索赔。作为该工具的一部分，它列出了所有已到位的护栏，并为每个答案提供了相关政策文件的句子或页面的链接。该公司还使用 LLM 生成同一问题的许多变体，以确保答案的一致性。这些步骤对于帮助最终用户建立对该工具的信任至关重要。

使用 gen AI 工具对维护团队进行培训的一部分应该是帮助他们了解模型的局限性以及如何最好地获得正确的答案。这包括教导员工通过从广泛的问题开始然后缩小范围来尽快获得最佳答案的策略。这为模型提供了更多背景信息，并且还有助于消除那些可能认为自己已经知道答案的人的偏见。拥有与现有工具外观和感觉相同的模型界面还可以帮助用户减轻每次引入新应用程序时学习新知识的压力。

扩大规模意味着企业将需要停止构建难以用于其他类似用例的一次性解决方案。例如，一家全球能源和材料公司已将易于重用性作为所有一代 AI 模型的关键要求，并发现在早期迭代中，其 50％至 60％的组件可以重复使用。这意味着为开发新一代人工智能资产（例如提示和上下文）制定标准，这些资产可以轻松地在其他情况下重用。

虽然与人工智能相关的许多风险问题都是已经酝酿的讨论的演变——例如数据隐私、安全、偏见风险、工作岗位流失和知识产权保护——但人工智能极大地扩展了这种风险格局。在报告人工智能采用情况的公司中，只有 21% 表示他们已经制定了管理员工使用新一代人工智能技术的政策。

同样，应该建立一套针对 AI/gen AI 解决方案的测试，以证明数据隐私、去偏见和知识产权保护得到尊重。事实上，一些组织正在提议发布模型并附带详细说明其性能特征的文档。记录您的决定和理由对于与监管机构的对话特别有帮助。

从某些方面来说，这篇文章还为时过早——变化如此之大，以至于我们可能会在一年内对新一代人工智能及其功能产生截然不同的理解。但寻找价值和推动变革的核心真理仍然适用。公司对这些教训的吸取程度可能在很大程度上决定了他们在获取这一价值方面能否成功。

关于作者

埃里克·拉马尔高级合伙人

亚历克斯·辛格拉高级合伙人

亚历山大·苏哈列夫斯基高级合伙人件

罗德尼·泽梅尔高级合伙人

作者衷心感谢 Michael Chui、Juan Couto、Ben Ellencweig、Josh Gartner、Bryce Hall、Holger Harreis、Phil Hudelson、Suzana Iacob、Sid Kamath、Neerav Kingsland、Kitti Lakner、Robert Levin、Matej Macak、Lapo Mori、Alex Peluffo、 Aldo Rosales、Erik Roth、Abdul Wahab Shaikh 和 Stephen Xu 对本文的贡献。