但与过去企业的技术投入相比,大型机型属于另一个成本层面。从目前来看,大模型应用的成本至少在百万起步,甚至可能达到千万。对于企业来说,一方面要找到高价值的场景,避免无用功;另一方面,他们必须估计和跟踪引入大型模型的效果,以确保投资能够带来回报。
在近期的InfoQ年度技术盘点与展望系列直播中,中国信息通信研究院人工智能研究中心平台与工程部曹峰、中国企业知识开源计划首席布道者陈果,与长城汽车工业数字智能中心人工智能技术资深专家胡阿培围绕“大车型下的业务创新与架构升级”展开讨论,就企业引入大车型的适用业务场景进行了交流作为其结果的评估和量化方法。
对此,曹峰总结了现阶段企业实施大规模模型的五种适用场景,以及不适合应用实施的五种情况。他强调,企业在选择场景时,可以先尝试一些已经被证明有价值的场景,而不是一开始就过快或过于激进地涉足多个场景。不要一下子冲进去,而是在一个场景内慢慢前进。
陈果提出,人工智能是第三代企业数字化。其中,第一代以数据库和信息系统为代表,第二代以互联网和云平台为代表,第三代是以AI原生企业应用为代表。为了应对AI变革,企业的架构将发生四大变化:一是企业级模型管理;第二,从数据管理到知识管理;第三,多模式用户界面;第四,业务进一步服务化、自动化。
以下内容根据对话整理而成,篇幅有所缩短。点击链接观看直播回放:https://www.infoq.cn/video/jTzjE654vsY9CF8Ev42c
大模型将引发企业架构第三次革命
InfoQ:中国信通院近日刚刚发布大模型落地路线图,根据这一路线图,我们针对大模型的发展现状和应用部署有什么重点发现?
曹峰:首先我解释一下我们为什么要发布这个路线图。 2023年,人工智能快速发展,从大模型,到行业大模型,再到AI Agent。然而,通过研究,我们发现很多企业在开发大型模型时面临一系列实际问题。因此,我们针对大模型的实现展开了一系列的研究工作。
首先,我们制定了一些原则:第一,需求驱动。企业在开发或购买大模型服务时,必须以大模型的应用和实施为出发点,不能盲目跟风;其次,它们必须以问题为导向。在大模型的应用和部署过程中,必须根据公司自身的情况不断处理问题;第三,创新意识。在推动数字化转型的过程中引入大模型时,一定要有创新意识,因为大模型不同于传统的IT基础设施,对基础设施的实施带来新的挑战,所以需要创新的方法;第四,技术为本,核心是综合应用云、数据、智能等数字技术,通过提升整个应用端的业务和性能来驱动大模型的发展。
整个路线图分为四个阶段:
第一阶段是诊断。这个阶段,企业需要明确大模型的能力,了解它能为企业做哪些赋能。同时,企业需要盘点、审视自身的业务场景、数据、算法、基础设施预算、策略等能力,为后续大模型的建设、使用和管理奠定基础;
第二阶段是大模型建设,主要是技术基础建设,包括方案设计、技术研发和测试;
第三阶段是应用,强调大模型实现后能够更好地利用应用模型。虽然ChatGPT以会话的形式流行,但在构建企业内部的大模型应用模型时,可能会涉及到各种能力,例如插件模式、代理模式等,因此如何更好地应用它需要解决的问题待解决;
最后一步是管理。大模型实施后,将成为IT系统的重要组成部分,因此需要进行管理、运维、监控等方面的工作。
此外,路线图具体包含五个层面,涵盖不同阶段的诊断、建设、使用和管理。从下到上,它们是:
基础设施层:建设算力、计算网络、存储等硬件基础设施。搭建开发平台、数据库、虚拟化资源等基础设施。
数据资源层:保障大模型、优质语料、数据集、企业内部知识等资源的高质量建设。建立有效管理和利用数据资源的能力。
算法模型层:基于基础设施和数据资源构建相关算法和模型。关注算法模型的质量和性能,确保满足企业的需求。
应用服务层:将大模型与企业应用场景和实际需求相结合。使用插件、Chat、Agent等解决场景区分问题。
安全可信层:保证各个层面的安全、可信、可靠等因素。我们面向四个维度,保证整个系统的安全。
我们梳理了这四个维度、五个层面的40多个问题。我们希望通过在未来解决问题的过程中不断深化大模型实现方法论,为大模型的综合应用提供有效的指导。
InfoQ:果总在咨询行业拥有 20 多年的从业经验,可以说您见证和陪伴了众多企业从信息化到数字化再到未来的数智化,期间技术经历了巨大的更迭演变。那么,在您看来,大模型对于企业(尤其是传统企业)最有价值的影响体现在哪些方面?
陈果:曹老师提到Agent,我可能是国内第一个讨论Agent改变企业系统架构可能性的人。去年3月,我写了一篇关于Agent的文章,其中提到企业信息系统可能会因此发生根本性的变化。我称之为第三次革命。
回顾历史,计算机的商业使用始于20世纪60年代和1970年代,而企业软件真正出现是在20世纪70年代后期。从20世纪70年代到90年代中期,这20年的主要特点是数据库的出现和以数据库为中心的人机交互。现阶段企业软件主要以数据库、ERP等核心系统为代表,实现数据业务流程的数据处理。
第二阶段开始于20世纪90年代末,随着互联网的兴起,以数据库为中心的应用模式被分布式计算所取代。 2005年左右,进一步进入云计算、云原生阶段。从1995年到2020年的25年间,传统的以数据库为中心的架构已经全面转型为以互联网为特征的云计算。
人工智能标志着第三阶段的开始。过去我们的企业系统有后端和前端的概念。后端处理业务逻辑,前端处理用户交互。但人工智能的出现将改变这种范式。例如,自然语言处理、Copilot 和Agent 等新技术正在改变我们与机器交互的方式。
未来,当人和代理人不再区分时,我们将看到业务处理方式的变化。过去我们按照预设的业务流程进行操作,但现在大家都开始探索人工代理,比如自治代理(AA)模型。在这种模式下,信息处理将是事件感知和智能驱动的。
比如,下雨的时候,我们知道去收衣服;另一个例子是,当一只虫子落在蜘蛛网上时,蜘蛛在感知到这一事件后就会进行捕猎。这是事件驱动的。 AI时代,可能会发生更多并行、复杂的事件。在后端,我们可以使用事件驱动的方式来重组信息系统;在前端,人机集成和协作将使用复杂事件的并行处理。
大模型的 5 个适用场景,以及不适用的 5 种情况
InfoQ:具体在汽车行业,大模型技术是如何促进业务创新或产品开发的?长城汽车目前有哪些具体的尝试和落地实践?
胡阿培:从Agent的角度来看,大模型技术的发展为我们开辟了空间。当我们刚开始使用大模型时,我们可能会认为大模型只能回答问题,而没有很多可能性。然而,随着Agent概念的出现,我们可以考虑用大型模型做更多的事情。比如大模型可以让人们以更加人性化的方式与软件进行交互和交流,这是一个非常重要的技术方向。
对于汽车行业来说,随着智能化的发展,汽车制造商的智能化和科技属性越来越强,这对产品、服务和组织产生了重要影响。通过大型模型与软件或机器的拟人化交互,这一过程将为业务创新和产品开发带来新的课题。
比如,过去我们在业务拓展或者产品开发上主要依靠人力或者一些固定的信息系统。对此,大型模型可以通过学习海量信息并利用高效计算为我们提供知识和新的想法或解决方案,从而对工作和创新效率产生巨大影响。国外已经有很多大型模型辅助药物研发和产品开发的应用,而且效率远远超过人工效率。
对于长城汽车来说,我们在研发、服务、售后、生产等方面都有很多应用场景。例如,过去的客户服务系统更多基于FAQ或相对简单的智能系统,不能很好地理解详细意图。大模型应用可以更准确地理解用户意图。将对大模型的理解与其背后的知识和数据结合起来,我们可以提供更加智能的服务体验。
长城汽车从信息化建设转向数字化建设已经20多年了。从研发到生产到售后,我们积累了丰富的数据和知识,包括各种规章制度、工艺标准和维护手册。将这些知识和数据与大型模型相结合,将为我们带来生产和工作效率的显着提升,同时也提高创新能力。
目前我们正在开发长城汽车知识大脑,它是基于公司内部的知识。其核心是专业于汽车行业垂直领域的大规模知识模型系统。
我们在长城知识大脑的应用上也进行了一些探索,包括研发、售后等领域的知识应用和管理,通过对话获取工作所需的知识或数据。比如售后方面,汽车知识更新非常快,包括OTA、软件、零部件等,如果用户出现汽车故障和问题,我们的技术工程师需要检测并处理问题。通过及时更新大型机型的相关维护手册和案例,可以为我们的工程师提供高效可靠的信息参考和指导。可以更好的处理客户面临的问题,提升售后服务体验。
InfoQ:大模型和知识图谱的技术结合,有哪些具体的应用场景?
胡阿培:以人力资源管理为例,我们可以重点关注以下几个方面的应用:
首先,通过大模型构建人才图谱。以简历信息为例,大模型可以从非结构化信息(例如简历PDF文档)中提取并结构化相关信息,例如姓名、教育、职位等。这在图构建阶段具有显着的优势。传统方法通常需要大量成本,包括定义图架构、标记数据、训练模型等。为此,大型模型可以更有效地完成这些任务。
其次,在图的应用过程中,图交互通常包括对输入问题的语义理解、提取实体和关系、通过图查询语句检索相关知识来回答。在大模型时代,我们还可以探索利用大模型直接输出图查询语言,连接人类语言和图数据库查询语言。这样,人与图之间的联系就建立起来了。例如,如果你想查询某个人的上下级关系或者了解他参与的项目,你可以直接从图表中搜索。
第三,大模型可以从图中提取整个子图,从而使大模型能够理解并找到问题的答案。这与文档检索的过程类似,但在此基础上实现了基于图的操作,这是图应用的重要方向之一。
InfoQ:除了汽车行业之外,包括金融、电信等在内的诸多行业都在试水大模型应用。那么,根据中国信通院的研究,企业中适合大模型落地的业务场景具有哪些特点?
曹峰:大型模型已经开始与企业的全价值链、全流程融合,在降低成本、提高效率方面发挥了巨大的价值。总结起来,应用主要集中在几个方面:
首先是知识类别的应用,例如企业知识管理和搜索。大模型有效提升相关能力和产品性能,同时降低实施成本;
其次是会话场景,包括智能客服、智能助理等应用;
三是智能软件工程场景,比如代码生成、代码检测等应用;
四是人工智能赋能科学场景。一方面,人工智能在基础科学中发挥了重要作用,比如AlphaFold对蛋白质的发现。更重要的是,它将在未来的应用科学中发挥巨大的作用,例如材料发现、材料验证和风洞实验。例如,国内一家电池制造商已经开始利用人工智能来模拟电池性能和材料。同样,国产飞机也将人工智能技术应用于风洞实验,展示了其在应用科学领域的广泛应用;
第五是人工智能与内容营销的结合,包括文字、图片、视频等的生成,这个领域现在非常火热。
另一方面,经过一年的演变,我们发现大模型在某些场景下仍然不适合:
第一个挑战是可解释性要求高的情况。由于大模型本身是一个基于深度学习的系统,其“黑箱”属性使其无法解释;
第二个挑战是,在生成内容的稳定性或确定性较高的场景下,例如需要精确答案时,大型模型的应用会更加困难,因为可能会出现模型“错觉”的问题;
第三个挑战是,在实时响应要求较高的场景下,大型模型的推理速度可能不够快,无法满足实时需求;
第四个挑战是动态要求高的场景。这主要是因为大型模型需要离线训练或离线微调,这涉及更高的成本、时间和资源投入。由于无法实现离线实时训练,当场景快速变化时,当前模型可能无法适应未来的场景变化;
第五个挑战涉及一些小数据场景或者数据量较小的情况。目前在这些场景下很难有效地实现大型模型,因为我们无法对模型进行实时微调。这是海量数据和高质量数据集之间的矛盾。
当面对这一系列问题或者不适用的场景时,业界也提出了一些新的解决方案。例如,通过技术增强,我们可以利用知识增强、搜索RAG等方法来解决可解释性要求较高的问题,用确定性生成来解释一些问题,通过插件等方法降低实现大型模型的成本。
还有技术整合的方法。今年,人工智能行业面临一个重要问题,那就是高估大模型,而忽视小模型在某些情况下的有效性。我们在大模型兴起之前(2022年之前)就已经看到了传统人工智能的应用,比如在人脸识别、计算机视觉、语音识别等领域,效果已经非常显着。这就催生了大模型和传统人工智能的结合,包括大模型和小模型。在这个新趋势下,大模型可以作为控制核心,在特定场景下控制小模型,同时使用多模型编排,比如目前讨论的MOE等新方法。
企业架构在 AI 时代将发生四个变化
InfoQ:前端业务模式的变化,势必会伴随后台架构的调整。那么,随着大模型越来越广泛和深入地赋能于具体业务,企业架构层面会呈现哪些新的特点和基础能力?企业现阶段如何着手打造新的架构体系?
陈果:前面提到,企业信息系统经历了三个阶段:数据库ERP阶段、云原生阶段、AI阶段。目前,很多企业甚至还没有完成第一、第二阶段。基础核心系统和信息化不完善,线上业务水平低,数据不规范。一些更好的公司仍在对其架构进行现代化改造并尝试采用云原生。其他方式的技术改造。具体来说,可能只有不到30%的企业完成了架构现代化。
企业从数字化现代化架构向人工智能发展的过程中,还可能涉及四个层面的变化:
首先,企业级模型管理涉及到AI模型层,它位于前端和数据之间。这一层对于企业驱动的业务至关重要,具体会包含各种模型,从大模型到自然语言处理和机器学习等能力,形成所谓的AI中台。
第二,从数据管理到知识管理,涉及到数据层。这不仅包括传统的结构化数据,还包括大量的结构化和非结构化的企业知识。值得一提的是,对于当前的中国企业来说,最缺乏的不是数据,而是系统化、具体化的知识。数据对于企业来说毫无意义;它们只是信息的一部分。数据只有转化为信息和知识才变得有意义。
以业务流程为例。两个人对业务流程的理解可能完全不同,而“业务流程”这个词最初是从英文单词“process”翻译过来的,有些人称之为流程。因此,我们发现AI输出的结果在处理“过程”、“流程”等时存在词汇混乱,如果知识体系本身不规范,就会影响AI训练的质量。中国目前最缺乏的是公共的、社会企业的知识。这就是我开始开源企业知识的原因。
第三,用户界面是多模态的,涉及前端应用开发层。未来前端将不再只是多终端的适配,而是多模态的适配。用户交互将涉及语音、图像、文本、视频等多种形式,这将对前端产生深远的影响,需要重构人机交互,解决人工智能应用的可解释性和信息安全问题。
四是业务进一步服务化、自动化。从云原生到人工智能阶段,企业应用领域最大的变化就是出现了一个新词汇——业务自动化。我认为这个术语抓住了人工智能将为企业业务带来的典型变革。具体来说,这种变化源于半手动流程。过去我们讲流程化,但流程中还是需要人工操作。
现在,我们看到了一种新的模式,即代理模式。该模型最大的变化是,过去由人类执行的许多任务不再需要人工干预。未来是人机协作、共存的时代。以房间内的空调为例。语音命令将空调降低两度是一种人工智能应用。然而,这样的人工智能应用仍然需要人类来驱动。真正的Agent应用是指基于推理和理解自动调节温度,无需人工直接输入。例如,当你说“今天好热”时,空调就会自动降温。
在这个过程中,人工智能发挥着至关重要的作用。 AI包括一些传统意义上的应用,比如规则优化、自动抓取、一些业务之间的自动路由等。同时也涵盖深度学习应用,例如大型模型驱动的深度学习应用。
总的来说,未来人工智能将通过自动生成推理并生成相应的行动来改变商业形态和企业运营。 AI的这种改变可能会给公司形态带来显着的商业价值提升,这是我们需要考虑的重要因素。
InfoQ:如果已经完成架构的现代化企业不到 30%,那么企业要从第一阶段迈向第三阶段,如何才能实现多管齐下,快速补齐基础能力的缺失呢?
陈果:当前,企业需要重新思考数字化是否是自己的核心能力。数字时代,最稀缺的资源是人才。企业数字化转型的最大瓶颈之一是企业是否拥有足够的开发人员和工程师来应对数字架构的挑战。
因为在过去,企业可以购买现成的软件并咨询顾问来实施,因此挑战主要在于处理数据和流程管理,而不是技术管理。如今,无论是构建新的数字化架构,还是适应AI时代的业务需求,毫无疑问,企业需要大量的开发者。
比如,过去几年,很多企业进行了中期建设,但真正成功实施的并不多。中间平台不仅仅是一种软件,还需要大量的工程人员来管理架构,这是大多数公司无法承担的。这就是为什么中间平台是很多公司的一个问题。
然而现实情况是,并不是每个企业都有足够的资源或能力在短时间内培养和管理如此多的技术人才。因此,企业必须思考数字化在短期内是否真的是自己的核心竞争力。这个问题其实并没有明确的答案。
在我看来,企业在数字化方面可能不需要太过激进。过去几年,人们拼命追逐数字化转型的潮流,但概念谈论较多,实际落地却很少。
有时,企业可能会花更多的钱在数字化规划咨询上,而不是构建系统和聘请优秀的技术人才,或者采取过于激进的态度。我认为这可能没有必要,除非你在某些领域是真正的颠覆者。例如,像滴滴这样的公司已经颠覆了传统的出租车行业。然而,大多数情况下,颠覆者都是少数,社会更像是金字塔结构。因此,大多数企业只需保证自己在数字化转型过程中不被淘汰,保持相对扎实的心态即可。
InfoQ:大型模型如何与现有的系统(例如 ERP、CRM 等)结合,以实现一些 AI 创新?是否可以提供一些具体的例子来解释一下?
陈果:ERP和CRM是传统的单体架构系统。人工智能带来的最大改变是人机交互的方式。 ERP、CRM等系统本身没有流程,它们是事务处理系统,在CRM中执行创建订单、创建收据或创建客户和机会等操作。所有这些操作都需要用户进入系统并在某种驱动下进行手动操作。
AI带来的最大改变就是让这些业务流程能够根据某些事件自动触发,实现自动化运营。换句话说,人工智能不一定会改变系统本身,至少在短期内不会。它改变的是信息系统的运行流程。未来,我们可以设想,正如我之前提到的,“自动化”一词狭义地指的是RPA的应用。短期来看,人工智能可以驱动RPA操作系统。但中长期来看,一旦系统解构为API,AI将不再通过机器人来操作系统。业务流程将自动使用系统内的任何业务功能。因此,只要企业业务没有发生根本性的变化,人工智能可能不会改变CRM、ERP等传统软件的架构和逻辑,而是改变系统的应用方式。
大模型成本百万级起步,落地价值如何量化和评估
InfoQ:大模型的落地应用最后一定不是单点的创新,而是涉及方方面面的全方位变革,这对于企业的管理手段提出了新的要求。对此,中国信通院大模型落地路线图中也强调了构建大模型管理体系的重要性,是否可以介绍一下,企业在做这项工作时具体如何展开?
曹峰:大模型的应用需要与企业IT系统深度融合。但人工智能和大模型的运营、研发、管理系统与传统IT系统存在一定差异。这主要体现在大型模型需要引入更多的数据量、模型文件以及更复杂的运行监控指标、维护更新等挑战。企业迫切需要建立或升级管理系统来应对这些挑战,确保大模型的顺利运行、有效迭代以及对其智能、质量、效率和投资回报率的评估。
为了实现这一目标,相关管理体系的建设应从以下几个维度入手。
综合指标监控体系包括模型、数据、业务等多方面指标,有机结合,实时监控运行指标,对潜在风险进行预警。
构建模型维护体系,通过标准化流程对大型模型进行变更和升级,确保模型在运行过程中能够实时修正,保持高质量稳定运行。
多维度的人工智能资产管理体系,包括人工智能数据、高质量数据集、语料库、模型、模型服务、大模型组件等,通过统一管理,保证相关资产的可用性、可追溯性、可诊断性、可审计性资产。性别和其他关键指标。
在构建这些系统时,可以采用以下思路和解决方案:
1.实时监控设施的可靠性和稳定性
引入实时监控工具,保证设施的稳定性,及时发现和处理任何问题。
2. 监控数据的完整性和正确性
使用适当的工具和算法实施数据质量监控并验证数据完整性和正确性。
3. 监控大型模型的性能
使用性能监控工具评估模型的效果和性能,并及时进行调整和优化。
4、监控大机型业务运行状况
从业务运营绩效、业务效果两个维度,建立监控体系,保障业务大模型的正常运行。
5. 监控大型模型的安全性和可信度
建立全面的安全监控体系,从系统安全、模型安全、数据安全、业务安全等多个维度防范潜在风险。
InfoQ:在大模型问世之前,AI 技术已经在汽车产业的多个场景中得到应用,尤其在核心的生产制造环节,如产品质检、设备维护预警等方面。那么,长城汽车是如何平衡创新技术 / 应用,和现有业务之间的关系的?
胡阿培:我想用一个词来表达如何平衡创新与现有业务的关系:诚信与创新。数字化建设和创新技术应用是企业长期稳定运营的基础。没有这样的保证,创新就不可能实现。
其中,“守诚信”的重点是确保业务、产品和服务的高质量,满足用户需求,以商业价值为准则。我们追求效率,不断评估业务效率,寻找优化点,然后在此基础上积极追求创新。
作为全球智能科技公司,长城汽车持续投入大车型技术等新技术的研发和应用,旨在优化现有业务,提供更高效、更智能的解决方案,推动新的AI原生应用。我们的核心目标是提高生产效率、降低成本、加速创新、提高企业竞争力。为了实现这个目标,我们内部做了一些创新的尝试和探索。我们开发了自己的知识应用平台。平台提供了一系列可以理解企业内部专业术语并解答问题的功能。
除了传统的AI模型之外,我们还使用了很多小模型,涵盖视觉、自然语言处理、语音、知识图谱、搜索推荐等领域。视觉方面,我们打造了“智控”工业级物联网平台,集成视频监控和各类AI视觉算法,实现数字化车间管理。
此外,我们还利用语音和语言处理技术构建问答客户服务系统,实现智能服务质量检查。在企业级知识管理系统方面,我们结合大模型来实现创新或升级。同时,我们还在生产调度、优化技术等方面进行创新,将大机型与小机型相结合,实现优势互补,促进业务创新发展。
InfoQ:在长城汽车,大模型在当前哪些业务场景中已经能够带来实际的业务价值和效益?具体如何体现,内部是否有明确的业务指标或相关指标来评估?
胡阿培:在长城汽车,大型车型在多个业务场景下为公司带来了实际的商业价值和效益。这主要体现在以下几个方面。
1、提高工作效率和用户体验:看大模型的应用是否真正发挥其价值,最直观的就是看它是否提高了工作效率。例如,在企业内部使用大模型技术,可以提高宣传文案写作过程中的写作效率,解决以前难以解决的问题,提高企业服务的体验。
2、用户自愿使用程度:大模型技术开发应用的关键在于用户是否愿意使用。如果每天有大量用户使用该应用程序,例如ChatGPT每月处理超过10亿个请求,经常受到大量用户的认可。
可和使用足以证明该应用具有实际价值。
3.衡量内部价值:长城汽车内部有一个衡量基于大模型打造的数字员工的价值指标,即通过折算或估算大模型的工作量,与完成相同任务所需的员工工作时长进行换算,从而量化大模型的贡献。对于我们内部的知识应用平台,通过观察日常运营情况,了解员工使用情况和提问量,可估算出模型带来的实际价值。
4.数据处理和深度加工效果:大模型在数据处理方面的应用也体现了实际价值。在企业内部,数据需要转化成知识,并进行分类、抽取和打标签等,以便进行有效的管理和分析。大模型通过提示工程等手段,可以高效地处理大量数据,将其转换成可管理、治理和分析的数据,从而显著提高数据处理效率。
曹峰:量化和评估问题其实是一个备受关注的话题,因为人工智能之前的投入相对较小,购买解决方案、SDK 或 SaaS 服务可能只需几十万到十几万的资金。但目前大模型应用的成本至少在百万级起步,甚至可能达到上千万。因此,如何评估投入是否划算,企业内部是否有清晰的业务指标或相关指标来进行评估,是一个备受关注的问题。
对于企业而言,特别关键的是确保投资能够带来回报。这涉及企业需要对哪些场景具有潜在价值进行盘点。然而,其中的矛盾在于,一些传统信息化效果较好的场景可能已经解决了大部分问题,引入大模型后提升的效率可能并不显著。
对于企业来说,选择场景的关键在于首先考虑场景是否适合使用大模型。其次,需要对引入大模型后的效果进行预估,包括人力成本、效率提升和收入增长等方面。不能盲目跟风,而是需要对每个场景进行明确的估算。第三,企业可以结合产业界的优秀经验,寻找高价值的场景。我们发布路线图的核心目标之一也是帮助企业找到这些高价值的场景。
在选择场景时,可以先尝试一些被证明有价值的场景,而不是一开始就过于迅速或过于激进地涉足多个场景。切忌一拥而上,而是需要在一个场景中慢慢推进。根据我们的调研,部署和使用大模型还有许多问题需要解决,因此不能贪多求快,需要从成熟的场景开始,逐步推进。
陈果:在过去的一百年里,特别是在工业领域,我们主要依赖手工操作。随后,电力技术的出现带来了重大的变革。当初开始应用电力时,我们思考的是在哪些场景中使用电力?应用电力后,我们能够为企业创造多少投资回报率(ROI)?过去,我们使用人力推动推磨,引入电动推磨后提高了效率,实际上现在我们可能仍处于类似的状态。随着电力变成一种公共能源,变得成熟起来,我们就不再需要设想如何使用电力了?
AI 的情况也类似,现在有人在论证 AI 能为企业创造多少 ROI 吗?并没有。因此,回答这个问题实际上是在思考,如果使用了 AI,它将如何对整个业务运营带来重大变化。我们需要从业务本身的角度去思考实现 ROI,而不仅仅是考虑如何购买 AI 软件,投入了多少,产出了多少。
InfoQ:许多公司在进行大模型的部署时可能面临一些挑战。一方面,如果选择采用私有化部署,就需要花费时间和成本来理解并部署一个大模型;另一方面,由于新模型不断涌现,公司可能会跟不上大公司开源新模型的速度。如何解决这个问题呢?
曹峰:这个问题实际上涵盖了两个方面。首先,对于模型的使用路径,开源模型的更新速度并不快。例如,Lamar2 开源后,至今已经过去了相当一段时间没有更新。其次,模型更新迭代对业务系统的影响,这确实存在。
我认为第一个问题在我们的路线图中是一个反复讨论的问题,即选择基础模型的重要性。这可能涉及选择开源解决方案或选择行业大模型。这相当于路线图绑定。一旦选择了某个基础模型,后续的变化可能会变得相对困难。例如,一旦采用了 LLAMA2 或某家企业的基础模型,后续的变化可能会涉及之前做的许多微调、大量的时间和精力投入以及数据注入。选择基础模型的核心问题在于如何做出明智的选择,或者如何确定模型路径。
第二个问题是关于如何将模型的更新形成一个流水线。之前,我们提到了一个概念叫“MLOps”。我们希望像软件工程一样,模型也能形成一个流水线。在 2023 年上半年,我们撰写了一本报告《2023 年人工智能研发运营体系(MLOps)实践指南》,这本白皮书详细介绍了一些关于模型如何更新迭代的良好实践。
这本白皮书是公开的,可以在这里查看:http://www.caict.ac.cn/kxyj/qwfb/ztbg/202303/t20230316_416827.htm。
目前,我们看到许多企业使用一个基础模型或部署多个基础模型,以解决路径绑定或路径依赖的问题。
新年关键词:AI 智能体、多模态、技术人才培养
InfoQ:新的一年,大家对于大模型对业务创新和架构升级的赋能有什么期待和展望?
胡阿沛:在 2023 年,大模型经历了“百模大战”,也进行了一些新的发展方向的探索,包括 Agent、智能体,以及开源社区的活跃发展。从我的角度来看,我对未来两三年有一些期待。
首先,我期待在开源社区中看到更多优秀的模型产出。谷歌曾表示 OpenAI 等闭源大模型没有护城河,大模型门槛正被开源踏破。在这个过程中,基座模型变得越来越强大,这意味着我们可以做更好的技术应用,更好地结合业务创新,使大模型能够更好地落地。如果大模型的效果不佳,在实际应用中可能会遇到很多问题。对于一般企业或规模较小的企业来说,从零开始训练一个技术模型需要投入大量的资源,并可能需要一定的积累。在国内,高质量数据的获取可能仍然是一个难题。
其次,在模型的应用方面,我比较看好 AI 智能体的应用方向,尤其是在知识对话、知识问答等应用。这种智能体可以在知识管理、数据支持以及写作或创作等方面发挥作用。通过智能体的视角看待大模型的发展,可以将其视为一个人类,去思考问题、拆解问题、选择工具以完成任务。
第三,多模态技术在国内在 2023 年并没有取得惊人的发展,但我对 2024 年比较期待,希望在前端的交互应用中能够更好地感知能力,实现多模态感知的更多可能性。
最后,未来我们希望在企业内打造一个基于大模型的智能伙伴,使每个员工都有一个懂他、深度结合数据、知识和业务系统的智能助手。这个智能助手能够提升员工的能力和生产力,使他们成为超级员工。
曹峰:我非常认同胡老师刚才提到的观点,Agent 可能以一种爆炸性的方式呈现。另外,还有一个观点就是每当一项新技术出现时,总会有很多人在短时间内高估其产生的价值,而在长期内低估它的价值,大模型也是如此。
因此,我们需要关注大模型在今年或者明年的核心任务,准确地说是释放其能力。不论是插件、Agent、还是当前的知识增强搜索,它们的核心目标都是释放大模型在对话、记忆、搜索、控制、决策等方面的能力,并产生相关的工具或新的应用模式。
我们认为从 2024 年开始,未来几年,随着大模型技术的演进,将必然释放其在技术能力和应用端价值方面的潜力,成为技术演进和应用创新的核心脉络。
陈果:我想强调两点:
第一,是大模型的应用,其中包括前文提到的智能体。这个智能体不仅拥有智能,而且还具备执行任务的能力。然而,一个聪明的机器如果没有数字化作为其基础,就无法发挥作用。这里的数字化包括物联网和各种服务等。我认为智能体存在于业务自动化中,是业务自动化中最重要的智能体。但要实现这一点,取决于企业数字化水平的提高。企业数字化水平是一个持续的过程。当企业数字化水平不够时,大模型无法发挥作用。
用户评论
漫长の人生
大型模型应用成本这么高?企业要怎么才能负担得起?
有18位网友表示赞同!
南初
数百万美元的成本,企业怎么才能收回成本?
有5位网友表示赞同!
发呆
与企业现有信息系统集成,这个过程会很复杂吗?
有13位网友表示赞同!
空巷
大型模型的应用成本太高了,感觉对中小企业不太友好。
有19位网友表示赞同!
熏染
大型模型的应用场景很多,但成本问题确实是个大难题。
有12位网友表示赞同!
枫无痕
集成大型模型和企业现有系统,需要考虑哪些因素?
有6位网友表示赞同!
|赤;焰﹏゛
希望未来大型模型的应用成本能够降低,让更多企业能够用得起。
有6位网友表示赞同!
半梦半醒i
大型模型的应用成本,是否会随着时间的推移而降低?
有16位网友表示赞同!
慑人的傲气
集成过程需要耗费大量的时间和人力,如何才能更高效地完成?
有5位网友表示赞同!
墨城烟柳
除了成本问题,大型模型的应用还有哪些挑战?
有20位网友表示赞同!
我怕疼别碰我伤口
大型模型的应用成本,对于不同规模的企业来说,是否会存在差异?
有11位网友表示赞同!
代价是折磨╳
如何评估大型模型的应用成本,才能更精准地进行预算?
有15位网友表示赞同!
蹂躏少女
大型模型的应用,是否能够为企业带来足够的价值?
有5位网友表示赞同!
发型不乱一切好办
大型模型的应用,是否会取代现有的信息系统?
有7位网友表示赞同!
麝香味
集成过程需要哪些技术和人员支持?
有5位网友表示赞同!
别悲哀
大型模型的应用,是否能够提高企业效率?
有6位网友表示赞同!
盲从于你
大型模型的应用,是否能够带来新的商业模式?
有17位网友表示赞同!
残花为谁悲丶
大型模型的应用,需要考虑哪些法律和伦理问题?
有14位网友表示赞同!
雪花ミ飞舞
大型模型的应用,是否能够推动行业发展?
有10位网友表示赞同!
闲肆
如何才能有效地管理大型模型的应用成本?
有10位网友表示赞同!
青瓷清茶倾城歌
大型模型的应用,未来会朝着什么方向发展?
有20位网友表示赞同!