从ChatGPT面世引发新一轮人工智能(AI)技术变革,到中国的DeepSeek以强化学习、多头潜在注意力(MLA)、混合专家架构(MoE)等技术创新开启高效能推理模型范式,AI大模型技术日臻进步,一个崭新且庞大的行业生态正在形成
行业发展综述
从ChatGPT面世引发新一轮人工智能(AI)技术变革,到中国的DeepSeek以强化学习、多头潜在注意力(MLA)、混合专家架构(MoE)等技术创新开启高效能推理模型范式,AI大模型技术日臻进步,一个崭新且庞大的行业生态正在形成。
具体来说,AI大模型行业可分为硬件层、软件层、模型层和应用层。硬件层包括芯片、服务器、光模块等;软件层包括操作系统、数据库、中间件、云计算、虚拟化等;模型层包括GPT、Claude、文心一言、DeepSeek等各类大模型;应用层则覆盖千行百业和千家万户。
中国高度重视AI产业创新发展,早在2017年就通过《新一代人工智能发展规划》,提出了面向2030年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施。2025年以来,DeepSeek凭借“低成本、高性能、广开源”等优势在全世界范围内引发关注,表明中国正以强劲的自主创新能力构筑起在全球AI竞赛中的竞争优势。Epoch AI的数据显示,中美处于全球AI大模型研发领导地位,自研大模型数量合计达全球总数的80%以上,2024年中国人工智能大模型总数已达95个。
2020-2024年各国人工智能大模型系统数量,个
数据来源:Epoch AI,毕马威分析
*注:美国、英国大模型存量数据涵盖跨国企业研发的模型。
其中,中国AI大模型发展呈现出细分化、专业化特征。根据公开资料不完全统计,中国的AI大模型中各种垂直类大模型占比在80%左右,主要涉及教育、科研、医疗、金融等领域。
中国行业大模型领域分布情况,%
数据来源:GitHub,毕马威分析
AI大模型的爆发集中在2023、2024两年,这离不开资本市场的大力支持。根据投中数据,2019-2024年全球AI大模型领域投融资事件共计约457起,交易总金额约6,443亿元。其中,2023年投融资事件的交易金额较2022年上涨了近15倍,2024年融资事件数量达160起,金额共计3,151亿元,总体规模为近年最高。2023-2024年,中国人工智能大模型投融资市场呈现回暖向好迹象,2024年中国AI大模型融资金额近467亿元,共计发生141起融资事件。
2019-2024年全球人工智能大模型行业投融资规模,亿元人民币,笔
数据来源:投中数据,毕马威分析
底层AI大模型的蓬勃发展,将带动生成式AI在应用层的拓展和深化,有利于持续吸引资本进入该赛道。根据《第55次中国互联网+络发展状况统计报告》显示,截至2024年底,共302款生成式AI服务在国家网信办完成备案,当年新增238款,生成式AI产品用户规模达2.49亿人,约占整体人口17.7%。智能办公助手、自动驾驶、智能医疗诊断、具身智能等应用场景多点开花,生成式AI的商业价值正不断凸显。
行业发展挑战
AI大模型低成本、高效能发展路径虽已开启,算力总需求仍将持续高涨。
在低成本、有限资源的情况下,DeepSeek系列大模型的性能不输OpenAI o1等大模型,这主要得益于其高效的模型训练方法,在一定程度上降低了对大规模算力的依赖。但长期来看,AI大模型行业整体的算力需求仍将持续增长。一方面,Grok-3、Claude 3.7 Sonnet、GPT-4.5等大模型相继发布,全球大模型的市场竞争仍在升温,或将持续推高算力的需求。另一方面,AI大模型下游应用场景仍在持续拓展,预计随着越来越多企业、个人等终端用户接入生成式AI应用等产品或服务,也将倒逼边缘算力、实时算力等需求提升。IDC最新预测结果显示,2025年中国智能算力规模将达到1,037.3 EFLOPS,并在2028年达到2,781.9 EFLOPS,2023-2028年中国智能算力规模的年复合增长率达46.2%,较上一版本预期值33.9%有显著提升。在此背景下,如何实现算力有效供给将成为大模型行业亟须关注的重点问题。
国产GPU有望和大模型加速适配,关键挑战在于软硬件协同。
近年来,中国芯片行业不断加快自主研发和创新的步伐,聚焦核心技术攻关,持续提升国产GUP性能。尤其随着国产AI大模型算力需求持续爆发,国产GPU侧的适配工作正快步跟上,关键挑战在于芯片软硬件协同。目前,国产GPU大多依赖英伟达CUDA生态,推动GPU生态系统走向更加开放多元,将更有利于支持国内企业的大模型训练、推理及微调等工作。结合行业实践来看,可推动基础软件先行,依托专业操作系统的领军企业,与国有芯片厂商合作,共同研发能兼容各类国产AI芯片和训练推理框架的智算操作系统。进而推动实现智算集群算力异构、灵活调度智算集群算力,以有效应对算力资源供应不足的问题。
从技术能力到落地价值的链路尚未打通,亟须实现垂直领域的精准应用。
AI大模型持续发展的关键在于其能否真正解决生产生活的实际问题,但目前仍存在优质中文语料数据欠缺、核心算法缺陷、应用场景碎片化等问题,导致了AI大模型的技术能力和落地价值的闭环反馈机制协同不畅,破局之道在于实现垂直领域的精准应用。以行业视角来看,可深挖制造、金融、医疗等重点行业的业务场景,布局相关应用。例如,中国作为制造业大国,下游应用场景十分丰富,AI大模型正逐步融入工业生产的全生命周期,各类垂直化、场景化的专用模型持续迸发,涉及研发、设计、仿真、生产、测试、运维、售后等关键环节,有望率先出现一批具备高落地价值的场景应用案例。以企业视角来看,数据质量决定了大模型落地的下限,可聚焦数据资产的全生命周期管理,实现从数据采集、模型预训练、算法优化到实际应用落地的全流程优化,为企业部署大模型相关的生成式AI应用等打好基础。
趋势研判
云边端协同、量子计算等创新方向持续涌现,助力解决算力饥渴的问题。
除芯片侧技术创新外,云边端协同、量子计算等创新方向正持续涌现,以应对AI大模型行业日益高涨的算力需求。具体来说,云边端协同计算架构下,企业可在云端进行大规模预训练等高负载任务,在边缘侧进行轻量化模型推理,在端侧进行模型蒸馏和实时推理等任务,有利于推动算力资源合理配置和高效协同。在更为前沿的探索方面,量子计算作为前沿颠覆性的技术,具备强大的计算能力,正逐步从理论迈向实际应用阶段,有望应对大模型发展带来的算力需求挑战。不过,短期来看,量子计算仍存在技术路线仍需验证、市场接受度不明确、政策监管等问题。
多模态数据融合仍是必经之路,有利于持续拓展大模型能力边界。
现实世界的信息通常是以多模态的形式出现,因此,在真实应用场景中,多模态大模型有利于实现更真实、更自然的人机交互,进行多任务处理和解决复杂问题。长期来看,大模型由单一模态迈向多模态,有利于推动AI真正向生产力转化。然而这一过程绕不开多模态数据融合,即整合不同模态(如文本、图像、音频、视频等)的信息,提升模型的感知、理解和决策等能力。目前,国内厂商正竞相推出多模态模型,包括智谱AI CogVideoX(输入文本或图片可生成视频)、谷歌Gemini 2.0(具备处理和生成多种类型内容的能力,包括文本、图像、音频和视频)、OpenAI Sora(文生视频大模型)等,竞争焦点主要在于多模态数据挖掘、不同模态信息的精细化捕捉、数据对齐问题、信息冗余以及融合策略的设计等方面。
AI大模型开源创新生态有望持续做大,相关商业模式探索将提上日程。
开源与闭源生态之争由来已久,中国在推动人工智能创新方面,倡导开源共享理念。工信部数据显示,截至2024年12月,中国软件开发者数量已突破940万,开源参与者数量排名全球第二,开源生态社区持续扩大。2025年,DeepSeek的开源模式不仅带动了国内外AI大模型厂商的开源热潮,更是吸引了大量企业迅速接入,有望加速形成“技术迭代创新-应用场景拓展-反哺技术研发”的闭环生态。但值得注意的是,开源生态面临较多商业化难点,例如开源生态付费意识尚未普及、知识产权难以保护等。此背景下,AI大模型厂商正在积极探索相关商业模式,以合理的盈利方式来支持开源生态的可持续发展。目前,市场上已有部分的积极成果出现,例如,提供定制化方案、通过开放部分功能吸引用户付费解锁高级功能、API接入等商业模式。
上述内容节选自毕马威中国与中关村前沿科技与产业服务联盟联合发布的《中关村国际前沿科技大赛趋势报告》,《报告》聚焦中关村国际前沿科技大赛的十大领域,包括人工智能、具身智能、集成电路、生物医药与医疗器械、商业航天、智能制造、新能源与新材料、低空经济等。接下来毕马威会陆续发布围绕上述专题的深入分析,敬请期待!
据《HR Brew》2025年4月14日报道,全球知名咨询公司KPMG推出了一款名为Kai的AI解决方案,旨在通过人工智能技术改善招聘流程,同时为招聘人员和候选人提供更高效、更便捷的体验。Kai是KPMG与AI供应商Paradox合作开发的内部...
消博会不仅是购物天堂,更是海南自贸港旅游零售的“试金石”!毕马威的最新白皮书揭秘了海南如何在压力下逆势崛起,成为全球消费市场的“中国样本”...
毕马威汇集了全球不同领域的网络安全专家,在《2025网络安全重要趋势》报告中指出了首席信息安全官及其团队在2025年应优先聚焦的八大事项,同时揭示了企业可以采取的关键行动,以有效管理网络安全风险并保护企业的发展和未来。...