未来会发生什么？2024世界人工智能大会，听各界大佬们如何预测

在上海世博中心和上海世博展览馆的路上，一个贴了数个微信群二维码的立牌旁，不少路人扫描入群，一个女士说：“很多群都满了，需要有人拉才行。”

而在另一个微信群里，不时有群主提示，展览馆开放注册了，可以注册进入了。

连日的梅雨之后，上海进入炎热的夏季，正在举行的2024世界人工智能大会，就像当下37、38度的天气一样，无论是场内还是场外，热度都非常高，国内外专家学者和企业家们，都加入到这场AI的最大盛会。

百度创始人李彦宏分享中提到说，上一次参加世界人工智能大会是2022年，当时主题是元宇宙，当时主办方希望他讲元宇宙，李彦宏坚持说讲AI，并把主题定在了AIGC，“我认为AI的技术发展路线，发生了方向性的改变，就是从过去的辨别式人工智能，转向了未来的生成式人工智能。”李彦宏说，讲这话后的5个月，ChatGPT发布，后来的事情大家就更清楚，两年的时间恍若隔世，整个世界都变了，人工智能颠覆了绝大多数人的认知。

阿里云CTO周靖人也是早在2022年就提出了MaaS，也就是模型即服务的概念，“两年前，我们在世界人工智能大会上发布通义大模型系列，当时我们公布，通义核心模型将开源开放。到今天，通义千问已经实现真正意义上的全尺寸、全模态开源，拉平了开源、闭源模型之间的差距。”周靖人在2024世界人工智能大会期间这样说。

确实，在这个AI盛会期间，各路大佬们分享的高密度信息，以及思维和观点的碰撞，夹杂着对未来发展趋势的洞悉和预判，一定程度上，让我们看到未来的一部分。

接下来，我们看看大佬们都说了什么吧！

上海人工智能实验室主任、首席科学家，清华大学惠妍讲席教授，衔远科技创始人周伯文：通向AGI的必经之路是ABI，并会有通专融合的“价值引爆点”

“通向AGI的必经之路是ABI，即广义人工智能。从学术上我给出了严格的定义：自监督、端对端、从判别式走向生成式。”

周伯文认为，人工智能AGI落地会有一个高价值区域，同时要求模型兼备很强的泛化能力和足够的专业性。这个区域离原点最近的位置，我们把它叫做通专融合的“价值引爆点”。

根据对历史生产力提升的分析，我们认为处在这个点的大模型，在专业能力上应超过90%的专业人类，同时具备强泛化能力，即ABI的能力。谁先进入高价值区域，即意味着谁的能力更强，拥有更多的场景和数据飞轮，并因此更早拥有自我进化迭代的能力。

周伯文认为，强泛化之上的专业能力是AI皇冠上的明珠，通专融合的发展新范式。

如何瞄准构建一个既具有泛化性又具备专业能力的AI系统，以更高效、更好地适应和解决现实世界中的复杂问题？这包括三层重点工作：

基础模型层：专注于更高效地构建通用泛化能力，尤其是其高阶能力，如数理、因果推理等。通过高质量数据的清洗和合成，研发高性能训练框架、高效的模型架构。

融合协同层：采用多路线协同的算法和技术，构建比肩人类优秀水平的专业能力。我们的原创工作包括高密度监督信号的生成、复杂任务规划，以及新的架构来实现系统1（即快速、直觉反应的系统）和系统2（慢速、逻辑分析的系统）之间的交互。通过这些技术，AI能够在复杂环境中做出决策，将复杂任务分解为更易管理的子任务，制定行动计划，并有效地协调多个智能体，以实现群体智能的涌现。

自主进化与交互层：强调AI的自主探索和反馈闭环的重要性。AI系统需要能够在真实或仿真世界中自主地收集数据、学习并适应环境。通过与环境的交互，AI能够获得反馈，这些反馈对于其自我进化至关重要。自主进化与交互层使AI能够进行具身自主学习，最终对世界模型有更深刻的理解并与之交互，完成开放世界任务。

早在1900年，德国数学家大卫·希尔伯特（David Hilbert）提出了著名的“23个问题”，引领了数学很多子领域数百年的发展。

在科学上，提出一个好问题往往比解决问题更重要。希尔伯特还有一句名言，这也是他的墓志铭：“We must know. We will know.”我们必须知道。我们终将知道。

“今天我们踏上通专融合的路线，探索通用人工智能AGI的未来，展望下一代的AI for Science，更可以从这句话中汲取灵感和激励。”周伯文这样说。

中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤：大模型和生成式AI有五个大的趋势

在 2024 世界人工智能大会 “长三角协同创新AI新质生产力发展”论坛上，中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤就大模型和生成式AI的发展趋势等进行了分享。

张亚勤认为大模型和生成式AI有五个大的趋势：

第一个趋势是多模态、跨模态、多尺度，这里面有文字、声音、图像、视频，但是也包括像激光雷达、结构传感器、生物里面DNA、蛋白质、细胞，其实是一种多模态、跨模态的方式。

第二个趋势是走向边缘，现在讲的大模型更多的是基础大模型在云端的，现在更多的智能走向PC、电视、手机、车，走向各种边缘。

第三是智能体的发展，特别是自主规划去完成一个任务，自我升级，包括自我编程、自动试错。

第四是物理智能，现在大模型和物理世界结合起来，包括无人车、无人机、无人系统，包括物理设施、基础设施，走向通用人工智能不仅仅要理解这个世界，要读书，而且要走路。其实物理智能就是我们机器和物理世界交互学到我们这个世界模型。

第五是比较长远,也是最重要的智能,是生物智能，我们把大模型和我们的大脑、器官、生物体连在一块的时候，这时候智能是AI加上HI新的智能。

张亚勤认为，现在行业简单的堆算力、堆数据，一定会有达到一个瓶颈，一定会遇到一个瓶颈，效率十分低，比起人的大脑目前效率可能低3个数量级，现在有860亿个神经元。“每个神经元有一千到一万个连结，但是我们只用20瓦，所以我们的效率是高了很多。”

张亚勤预计，未来五年会出现一个全新的架构，这个框架需要首先要有一个记忆系统，像人类是三层有DNA记忆、短期记忆、海马体记忆，皮层记忆、长期记忆。现在目前的AI大模型是没有真正的支持记忆系统的，没有真正的物理模型，系统推理能力比较差，透明性也比较差。

什么时候可以达到AGI？张亚勤给出一个时间段：15-20年。他把这个时间分成三个阶段：

第一是现在信息智能，多模态智能。

目前的ChatGPT或者GPT4已经通过图灵测试了，视频像Sora等在5年之内预计也能通过图灵测试，是一个新的图灵测试。

第二个是物理智能或者具身智能，这可能需要5年甚至更长的时间。

具身智能第一个就是无人驾驶，无人驾驶可能是最快通过图灵测试的具身智能。然后是机器人，产业的机器人、家庭的机器人等，这个需要可能5-10年的时间。

最后是生物智能，包括脑机接口、植入芯片或者是传感器也好，可能还需要5年、10年。如果5年前问我这个问题我说可能需要50年，过去这几年大模型的发展，我认为是加速了，20年之内可以达到AGI。

中国工程院院士、之江实验室主任、阿里云创始人王坚：一定会有新的大公司出现，也一定会有大公司烈火重生

“人工智能有一个非常长的过去，但是有一个非常短的历史。长到什么时候呢？长到其实你可以追溯到一百多年以前。但是短到什么时候呢？短到就是GPT的出来。GPT的潜力，今天事实上还是没有被完整的探索的。”

王坚认为，未来十年将是一个非常激动人心的十年，一定会有新的大公司出现，也一定会有大公司烈火重生 。

人工智能，是一个非常革命性的东西。它对产业的影响一定是反映在两方面：

第一，只要是个新的技术，一定会有新的大公司出现。如果一个新的技术出来，没有新的大公司出现，那它是不是颠覆性的技术是要打个问号的。但是我自己相信，在这个时代一定会有新的大公司出来。就像当年的GE一样，这是第一个逻辑来看这件事情。

第二，一定会有大公司是烈火重生的。就像前几天大家看到苹果这个事情。我觉得苹果这个发布很有意思，不是他拿AI去服务了C端的客户，事实上人工智能技术重新重构了苹果这家公司，这个重构是从重构它的操作系统开始的。所以我自己觉得，因为有了人工智能技术，苹果这家公司不一样，那是不是真的能不一样？但我们要再往下看，但是我想只有不一样，以后他可能才可以市场上活得更好。所以我想对于大公司而言，就是大的企业而言，只有两种可能性。

王坚说，因为数据等，人工智能对大公司会友好一点。但友好并不是说它会对你宽容，你没有创造力，它也不会对你宽容，因为该面临的挑战还是会面临的。

“最后你发现有一个因素容易被忽略，就是人。AI我们这么讲是革命性力量的时候，你发现AI对每个部门都会产生影响，要所有部门的所有人都去拥抱AI这在很多大企业是很难的。我想小企业跟大企业的差别就是，根本上，小企业一定会觉得大企业一定会觉得AI是工具的革命。小企业一定会觉得这是革命的工具，那就是点差别。我想大企业也要意识到这是革命的工具，那这个变化就来了。”

另外，关于能源问题，王坚认为，要放在时间和空间维度动态来看 。

“ 1980年全世界都担心石油马上没有了，没想到越到现在石油反而更便宜了。”王坚认为，所有的问题都是要在动态过程中解决，你根本不会想到可能十年以后说的算力，跟今天说的算力不是同一个算力。十年以后说的电，可能跟今天说的电也不是同一个概念。“所以我是觉得这个还是要在动态过程解决，一定不能在现在这个时刻的状态来解决十年以后的问题。要拿十年以后的状态来解决十年以后的问题。”

商汤科技董事长兼CEO 徐立：有应用支撑，才能迎来AI的超级时刻

“超级时刻和应用是互相成就的，只有超级时刻带来的认知的变化，最后才能推动这样一个应用。所以倒推回来，如果我们后面用应用来支撑，那么我们现在这个时刻就是超级时刻。”2024世界人工智能大会期间，徐立说，就像IPhone一样，因为是有了这个平台，后面才有iOS上面的App Store生态，应用是决定这个时代是不是人工智能超级时刻的一个关键。

要走向应用，人们在认知上有几个核心的重要的突破点：

一是对高阶的逻辑数据的依赖性来解决人工智能的推理问题，就是它的智慧。

现在的人工智能大模型某种程度上只是记忆器，他只是背下了所有的知识点，它仅有的一点点的智能其实是来自于互联网上的数据背后带有的一个高阶的逻辑思维链。那在在垂直领域里要做一个突破，依赖于人类去构造更加高级的思维链背后的逻辑，甚至是再往上一步，不依赖于人类，也就是通过跟真实世界的交互形成执行的数据，形成知识层、推理层以及执行层。

第二个是实时的交互性能够带来一个流畅的体验，也是带来推动超级时刻以及应用变化的一个核心。

最后很重要的一点是可控性，不管是文本、图像、视频，如果对它没有具备可控性，它作为一个工具，它本身能够带来的效能的提升就非常的有限。

徐立说，如果要推动人工智能超级时刻的到来，需要大模型可以展现出卓越的深度思考的能力。首先合成的人工数据，特别是高级思维的数据往往是非常重要的，所以越是有应用的场景，才能形成更好的高质量的数据的一些核心。

第二自然的没有延迟的交互。所以端侧其实也是一个非常重要的突破点，今年商汤科技着重推动模型的端侧优化，实时的交互变化更加的流畅。用好端和云两部分的计算机资源，才能够成为一种全自然的交互模式。

第三就是所有的生成都要可控，你不需要做得很好，但你需要知道你哪里做得不好，并且说做哪里进行一些修改，有了这样的一个边界，那么实际上才能做到真正的可控技术以及可持续的技术发展。

百度创始人、董事长兼首席执行官李彦宏：闭源模型最能打、避免掉入"超级应用陷阱"，最看好智能体

2024世界人工智能大会期间，李彦宏的分享不仅回应了关于开源还是闭源的问题，也提到了是否发展超级应用等问题。

李彦宏认为，在大多数的应用场景，开源模型并不合适，当你处在一个激烈竞争的市场环境当中的时候，你需要是让自己业务的效率比你的同行更高，成本比你的同行更低，这个时候商业化的闭源模型是最能打的。

李彦宏说，有些外行甚至混淆了模型开源和代码开源这两个概念，模型开源你拿到的是一大堆的参数，你还是要去做SFT（监督微调），还是要去做安全对齐，你不知道这些参数是怎么来的。你是无法做到众人拾柴火焰高的，即使你拿到对应的源代码，你也不知道他用了多少数据，用了什么比例的数据去训练这些参数。所以拿到这些东西，并不能够让你站在巨人的肩膀上去迭代和开发。

所以同样参数规模之下，闭源模型的能力就比开源模型要更好，而如果开源想要能力追平闭源，那么它就需要有更大的参数，这就意味着推理成本会更高，反应速度会更慢。

李彦宏也强调了从卷模型到卷应用的观点，“没有应用，光有基础模型，不管是开源还是闭源都一文不值。“

李彦宏说，基于基础模型的应用在各行各业、各个领域都已经开始了逐步的渗透，两个多月前我们宣布文心大模型的日调用量超过了2亿，最近文心的日均调用量超过了5亿！仅仅两个多月的时间，调用量发生了这么大的变化，足见它背后代表了真实的需求，是有人在用，是有人真的从大模型当中获益了，得到了价值。

比如在快递领域，让大模型帮助处理订单，做到了"一张图、一句话寄快递"，不再需要其他繁琐的流程，时间从3分多钟缩短到19秒。而且90%以上的售后问题，也都由大模型来解决，效率提升非常的明显。

再比如在小说创作领域，一开始也用开源模型做出过一些效果，后来改用文心轻量级模型，经过10轮上万组数据的SFT和post pretrain，结果有了明显的提升，最近又转到文心4.0版本，仅用了数百条数据，4.0就在情节和逻辑方面展现出了非凡的优势，生成的内容无论是可用率还是优质率都大大超过了轻量级模型，网文作者们如虎添翼！

其实更通用的领域，比如说代码生成，文心快码这样的软件，在各个领域，也在逐步的渗透，百度内部的话，我们有30%左右的代码，已经用AI生成的，代码的采用率超过了44%。

李彦宏认为，要避免掉入"超级应用陷阱"，觉得一定要出现一个DAU10亿的APP才叫成功，这是移动时代的思维逻辑。其实不一定，AI时代，"超级能干"的应用比只看DAU的"超级应用"恐怕要更重要，只要对产业、对应用场景能产生大的增益，整体的价值就比移动互联网要大多了。

”随着基础模型的日益强大，开发应用也越来越简单了，最简单的就是智能体，这也是我们最看好的AI应用的发展方向。“李彦宏认为，制作一个好的智能体通常并不需要编码，只要用人话把智能体的工作流说清楚，再配上专有的知识库，一般就是一个很有价值的智能体了。这比互联网时代制作一个网页还要简单。

未来在医疗、金融、教育、制造、交通、农业等等领域，都会依据自己的场景，自己特有的经验、规则、数据等等，做出各种各样的智能体，将来会有数以百万量级的智能体出现，形成庞大的智能体生态。

上海科学智能研究院院长、复旦大学浩清特聘教授、无限光年创始人漆远：实现通用人工智能的最好标志之一就是实现 “AI爱因斯坦”

“在AI 1.0时代，从风控到搜索、推荐，每个具体任务都训练出一个模型，聚焦同一个任务或领域的具体任务。”漆远认为，“在今天的AI 2.0时代，大模型有更好的泛化能力，可以在很多领域或某一类垂直领域的多项任务中发挥接近或超越人类的能力。我们看到了通用人工智能的火花。”

与AI对话，欣赏与传播AI生成的文本、图片与视频……AI已经为人们的生活带来便利与乐趣。但是“所有的大模型都是‘做梦的机器’，都有幻觉的特点”，漆远坦言，“幻觉和幻想类似，在情感对话和艺术创作里可以发挥作用。但是如果想把大模型作为生产力工具，在科研、医学、金融等领域的核心业务里发挥重要作用，大模型的幻觉就是个大问题，可能会违背基础规律，导致差之毫厘，谬以千里。”“从微观的分子，到宏观的人体表型、到更宏观的气象气候和复杂的经济金融系统，我们需要AI大模型做出精准预测，给出靠谱的答案，甚至发现未知的规律。”

漆远认为，scaling law还有红利，但是基于transformer（注：变压器）自回归架构的大模型不足够走到通用人工智能，无论是从AI技术本身角度还是从能耗的角度而言。未来要把人工智能的逻辑推理为代表的符号主义和深度学习为代表的联结主义结合在一起，融合知识规则、数字世界与物理世界里的数据，去探索与发现世界里的未知规律。

今天的深度学习是对数据的模拟和压缩，擅长对观测数据的概率内插预测，并不擅长对数据之外的外插推演，更不擅长多步的逻辑推演。而爱因斯坦的大脑，作为人类智能一个巅峰体现，结合有限的物理观测数据、自己的“合成数据”和黎曼几何等数学工具，提出狭义和广义相对论，适用于广阔的宇宙。漆远认为实现通用人工智能的最好标志之一就是实现 “AI爱因斯坦”，发现复杂世界的未知规律。

施耐德电气副总裁古月：没有生态的力量，AI很难真正发展起来

没有生态的力量，AI很难真正发展起来，更不用说在产业推广应用。

因为AI要蓬勃发展，需要算法、算力、数据等因素的支撑，单独一家企业很难具备这些所有的能力。AI的规模化应用、技术创新迭代、产业可持续发展，这些都离不开高度开放合作的生态体系。AI产业链上的不同企业、机构和个人需要共同协作、相互赋能，才能释放AI技术红利和产业价值，实现经济效益和社会效益的共赢。

施耐德电气商业价值研究院认为，企业对于AI价值的期待正在从单一向立体转变，形成三大显著趋势：首先，从仅重视AI的商业收益，拓展到越来越注重社会环境价值；其次，价值取向从宏观决策到微观个体，更加关注AI如何影响并优化每一位用户的体验；第三，从追求AI带来短期的快速增长，到更重视长期的价值跨越。

腾讯集团副总裁蒋杰：场景应用会成为未来大模型的决胜要素

“未来通用模型会成为水、电、网络等基础设施一样存在，供业务和应用按需接入。”腾讯集团副总裁蒋杰认为，从行业和应用的角度来看，未来会出现更多不同尺寸、不同模态的模型，业务可以通过大小模型的协同，在提升性能的同时满足定制化需求。

腾讯混元大模型自2023年9月首次亮相以来，经过多次迭代升级，在国内率先采用MoE架构，实现性能大幅提升，模型整体参数量已达到万亿，tokens数量超过7万亿，居国内大模型第一梯队。

目前，腾讯混元大模型已通过腾讯云向企业及个人开发者开放，包含万亿、千亿、百亿等不同参数尺寸，接下来，多种尺寸的腾讯混元MoE模型也将对外开源，可分别支持手机端、PC端、云以及数据中心等多样化的部署场景。

蒋杰表示，大模型行业正经历从单模态到多模态，再到全模态的演进。比如在文生图领域，最近效果比较好的是采用 DiT 架构的模型，它融合了早前主要用于文本生成的Transformer架构，并在图像和视频生成任务中展现出了显著的优势；在文生视频领域，视频生成正朝着更高分辨率、更长时长、更精细的方向发展，一些较好的模型已经能够生成长达数分钟高清的视频，带来了广阔的应用想象空间。

腾讯混元大模型正在积极部署多模态甚至全模态技术，在文生图方面，混元文生图打造了业界首个中文原生DiT架构生图模型效果超开源 Stable Diffusion 模型，发布一个多月Github 点赞数超过两千，是社区内最受欢迎的国产开源文生图模型；在3D生成方面，单图输入仅需30秒即可生成动漫、汽车、建筑等类型的3D模型；在视频生成方面，腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频4大核心能力，支持视频风格化、视频重绘等多样化的产品玩法。

蒋杰认为，场景应用会成为未来大模型的决胜要素。当前大模型的落地主要集中在生产工具和提效方面，距离真正的业务创新还有一定距离，缺少杀手级的应用，不过行业的探索一直没有停下。

T3出行CEO崔大勇： 2027年将是自动驾驶商业化运营拐点

除了大模型以外，自动驾驶是人工智能技术落地应用的另一重要领域。

自动驾驶何时会迎来大规模商业化运营？T3出行CEO崔大勇在2024 世界人工智能大会 “长三角协同创新AI新质生产力发展”论坛上预测说，2027年是自动驾驶进入商业化运营的拐点。

一方面，随着人工智能大模型时代到来，自动驾驶技术日益成熟。另一方面，自动驾驶车辆成本降低。“Robotaxi车辆成本在100万元以上时，就没有商业化应用场景。眼下，我们已经看到有企业推出30万元以内的量产车型。这样的车辆批量上市，便能够大规模应用。”崔大勇说。

值得一提的是，相关部门积极推进完善智能网联汽车和自动驾驶相关法律法规制度建设，让自动驾驶商业化应用再提速。其中，五部门已确定20个城市（联合体）为智能网联汽车“车路云一体化”应用试点城市。

从更长远来看，人工智能将大大改变人们出行体验。崔大勇举例称，随着自动驾驶，尤其是全无人驾驶时代的到来，乘客将享有独属于自己的车上空间。比如，乘客可以在车上开电视电话会、玩游戏，或者看视频，这是一个私密的、完全放松的个人空间。

综上，从各方的发言中，不难看出，在大模型的发展范畴下，更加务实的走向场景、应用，找到商业化的路径，已经成为业内的共识，而且会在未来几年时间成为发展的重要路径和方向。

【数智化案例展】立臻科技——大模型助力制造企业数据智能化

枫清科技案例

本项目案例由枫清科技投递并参与数据猿与上海大数据联盟联合推出的《2024中国数智化转型升级创新服务企业》榜单/奖项”评选。

立臻科技作为头部智能手机主要代工厂，在苏州拥有两座智能化工厂，年产值过千亿元，年聘用员工达数十万余人，设备和人构成了公司最重要的核心资产。立臻科技目前拥有IT研发人员超过200余名，已经构建了相对完善的数据治理体系以及完整的数据平台，在智能化方面，也率先落地了包括视觉质检、预测性维护、智能生产排程等智能化场景。

随着大模型的发展，立臻科技意识到可充分借助大模型的能力，全面提升公司的数据智能化建设，并接触多家业界一流的AI公司和一流的科研团队，枫清科技（Fabarta）通过与立臻科技的多次交流，其在大模型领域的产品建设、全部大厂的团队背景以及落地理念，深得立臻科技认可，并于2023年末正式达成合作关系，目前相关合作正在按计划推进中。

在制造行业，典型的劳动密集型特征导致了高流动率。这一行业面临的挑战不仅限于人力资源管理，还包括生产技术文档的复杂多样性和设备数据的海量生成，但这些数据往往难以直接转化为有效的决策支持。

立臻科技面临的问题和挑战促使他们希望通过智能系统来改进解决。首先，集团每年管理数十万名作业员，管理层充分认识到对一线作业员进行有效的管理和关怀对提升生产效率、控制成本至关重要。集团高层将员工管理比喻为一座潜力巨大的矿山，需要深入挖掘。其次，制造行业的设备知识库现状复杂，知识难以共享和利用，导致信息孤岛现象的形成。因此，建立统一的知识管理系统成为必然选择，以提升整体生产水平和技术创新能力。第三，制造核心环节急需智能化制造决策支持系统。通过充分利用设备数据、生产技术文档和行业知识，实现从数据到决策的有效转化，将大幅提高生产效率和产品质量水平。通过这三方面的深入改进，枫清科技（Fabarta）联手立臻科技致力于通过大模型来提升管理效率和生产效益，助力制造行业实现智能化转型，迈向更加高效和可持续的发展。

时间周期：

开始时间：2023.9

截止时间：

节点1：初步构建大模型知识中台，覆盖人力资源文档数据管理 2024.2

节点2：初步覆盖生产制造知识管理，构建厂内制造业大模型，并初步对接数据平台数据 2024.6

节点3：全面覆盖生产制造数据，扩大结构化数据对接，基于智能体和大小模型等，选择部分场景实现制造领域智能决策（进行中，2024.9）

节点4：全面对接数据平台，并构建相对完善的大模型知识中台，覆盖结构化和非结构化数据，对接已有大小模型，可基于该平台体系化落地更多业务场景（2024.12）

数智化需求

立臻科技具备业界领先的工厂智能化建设和领先的科技人才队伍，目前公司已经具备完善的数据平台并已落地大量智能化场景，在制造业中企业中，具备领先的数智化发展水平。

公司目标是能够借助大模型的发展，能够全面利用已沉淀的结构化和非结构化数据，改变过去点状落地智能化场景的方式，希望能够体系化全面落地智能化能力，全面提升智慧工厂建设，不断提升公司的智能化竞争力。为此，立臻科技制定了分布三步走的策略：第一阶段，围绕人力、财务等支撑性领域，率先进行大模型落地实践，构建初步的应用场景，并搭建大模型落地支撑平台；第二阶段，打通已有数据平台，全面覆盖生产制造数据，并借助大模型提升数据使用体验，并提升部分生产制造业务场景智能化；第三阶段，基于融合后的大模型平台和数据平台，并结合已有大小模型和智能体建设，平台化全面落地智能化场景，提升工厂智能化建设。

当前，枫清科技（Fabarta）同立臻科技一道，已顺利完成第一阶段建设，已实现对人力资源多个智能化业务场景建设，并迈向第二阶段，打通数据平台，并覆盖生产制造相关数据。每个阶段对数智化的需求总结如下：

阶段一：初步构建大模型知识中台，覆盖人力资源文档数据管理

制造行业以劳动密集型为主要特征，员工流动率高。集团每年管理数十万名作业员，一线员工的管理和关怀直接影响生产效率、成本控制和整体效益，亟待通过大模型技术进行深入挖掘和优化。从支撑性业务开始，通过大模型对一些基础系统的智能化升级，比如规章、制度、薪资、休假、奖惩等信息的问答，取代原有的靠人力去做一对一的服务，极大程度的释放了支持性岗位的基础性、重复性工作，实现在支持性职能岗位人数不变的情况下可以更好的支持集团的扩厂扩线。

阶段二：初步覆盖生产制造知识管理，构建厂内制造业大模型，并初步对接数据平台数据

在第二阶段，立臻科技的目标是实现生产数据的全面整合和智能分析，从而提高生产效率，降低运营成本。通过使用大模型的能力，让数据的出口不再局限于BI系统，而是可以靠灵活的自然语言交互的形式实现，全面降低用数、取数的门槛，提供数据智能在更广泛的业务用户、生产用户的覆盖度。

阶段三：全面覆盖生产制造数据，扩大结构化数据对接，基于智能体和大小模型等，选择部分场景实现制造领域智能决策

制造企业多模态数据沉淀庞大：结构化数据以BI系统为代表，已经实现一定程度上的数据智能；而对于非结构化、半结构化数据的分析与决策还在非常早期阶段，大量数据依然沉淀在冰山之下无法产生业务价值；多模态融合的决策智能可以进一步放大数据融通后的价值，提供更多的决策支持。

对于结构化数据，制造企业在设备产生的环境所产生的数据量非常庞大，但难以直接从数据中得出有效的决策。不仅仅需要一套数据平台来解决数据的可见、可控，同时针对不同数据的业务含义、业务诉求进行智能的分析和决策。通过知识驱动的决策系统，立臻科技将打造智能制造决策大脑。综合利用设备数据、生产技术文档和领域知识，实现从数据到决策的智能转化，提升生产效率和产品质量。通过这一系统，企业将能够在复杂的生产环境中做出更加准确和高效的决策，全面提升智慧工厂的建设水平。

面临挑战

面对当前企业面临的多重挑战，首先需要深入分析和解决的是员工管理方面的困难。

随着企业规模和厂区扩大，员工管理难度显著增加。即便是细微的管理失误，也可能导致员工离职，从而直接影响到生产排产计划的执行效率和稳定性。这种影响不仅仅限于人力资源的重新招聘和培训成本，更涉及到生产线的稳定性和运行效率。因此，有效的员工管理和保持员工稳定是当前企业急需解决的首要问题之一。

其次，随着企业规模的扩大，管理成本也呈现出线性增长的趋势。这不仅包括人力资源管理的成本，还涉及到管理工具和系统的投入成本。传统的管理方式往往无法有效应对规模扩大带来的管理挑战，需要引入更为智能化和系统化的管理解决方案，以降低管理成本，提升管理效率和准确性。

此外，企业在员工个性化需求满足方面面临的问题也不容忽视。现有系统往往缺乏足够的灵活性和个性化定制功能，难以有效地满足员工多样化的需求。特别是一线作业工人文化水平不高，对于普通IT系统的操作和利用能力有所限制，需要更加简化和智能化的系统设计，使其能够轻松适应员工的操作习惯和能力水平。

面对制造业的多模态数据分析挑战，企业面临着复杂的数据处理问题。

制造业中产生的数据通常是多模态的，包括非结构化和半结构化数据，这些数据的分析与决策支持仍处于早期阶段。传统的数据分析方法可能无法有效地整合和分析这些多样化的数据类型，导致信息孤立和决策效率低下。特别是在生产过程中，涉及到从设备传感器收集的实时数据到质量控制记录，再到供应链管理中的物流数据，这些数据来源广泛且类型不一，如何实现数据的统一管理和分析成为制造业面临的重要挑战之一。缺乏有效的数据分析和决策支持系统，企业难以从这些数据中准确提取有价值的信息，并据此进行即时的生产优化和战略调整。

通过大模型帮助企业获得高质量数据后，进一步就是如何利用大模型对通用知识的理解能力，配合专有制造业模型对特定场景垂直的推理能力，让大模型结合业务场景、系统需要自主的选择合适的小模型，充分发挥各自的优势，提升系统整体决策的能力。

数据支持

在立臻科技联手枫清科技（Fabarta）的大模型落地中，数据处理涉及多个关键方面，每个方面都对最终分析和应用结果至关重要。

对于非结构化数据的解析，这类数据通常包含多种格式和来源，例如各种生产制造的知识库中的文档、文件等，其中也具有复杂的内部结构和关联关系。通过数据解析技术，可以有效保障上下文的完整性，确保从数据中提取的信息不失真或遗漏重要细节，相较于传统的简单切片方法，效果显著提升。以图片数据的理解与识别为代表，大量的多模态数据需要准确的解析和识别。利用计算机视觉技术，可以从图片中提取关键特征，并进行模式识别和分类，对于质量控制、产品监测和工艺优化具有重要意义。

对于关系型数据的元数据补齐，这对于大型数据模型的正确理解至关重要。通过为数据库中的表和字段添加业务含义的元数据，可以提升大模型对业务逻辑的理解和预测能力，进而优化数据分析和决策过程。元数据的丰富性和准确性直接影响到数据分析的质量和结果的可信度。

对于多模态数据的融合分析，元数据规范和统一是大模型落地的基础，元数据让大模型知道应该用到哪些数据提供对应服务。通过元数据过滤，提升大模型问答筛选范围，提升问答精准度；通过元数据，为智能BI场景提供数据基础。元数据为大模型提供了很好的语义层支持，在准备好高质量数据和语义层之后，需要能够有好的体系能链接大模型和数据。枫清科技（Fabarta）通过多模态数据引擎来统一存储数据和元数据，并构建面向大模型的统一记忆体，同时还借助系统内置的问数、问指标类工具，快速方便用户去获取和分析数据，并积极尝试借助智能体来串联大小模型，使得用户不仅仅是能便捷取数、用数，还能够借助模型的能力结合业务做进一步的数据分析，帮助客户来做决策。此外，枫清科技（Fabarta）还提供了低代码化能力，能够便捷的将数据价值嵌入到已有业务系统或者快速构建AI场景应用，加速推动基于数据驱动的AI能力落地。

综上所述，数据处理的复杂性和技术挑战需要综合运用先进的数据解析、识别技术以及元数据管理策略，以确保从数据中获取的信息准确、全面，并能够有效支持业务决策和创新。

应用技术与实施过程

枫清科技（Fabarta）企业知识中台，旨在链接大模型和企业数据，帮助企业全面化落地智能场景。在当前与立臻科技的落地实践中，率先从人力资源场景切入，既面向普通员工提供终端自助服务，同时还面向人力资源专员提供智能化的知识检索和智能问数等体验。这项服务能够与各种业务场景进行对接，包括不同厂区的巡检机器人机器人，以及舆情对话场景。企业知识中台在立臻本地环境中部署，集成了Text2api、Text2sql、多格式文档解析等关键技术组件。此外，还包含了基于大模型的问答服务、文档权限管理、知识运营和知识管理等高级功能。在技术落地的过程中，其核心技术点总结如下：

知识解析与术语理解

在制造业的实施中，知识解析和黑话理解是关键的技术支持。通过将文档结构解析为图谱结构，大模型能够更好地理解文档中的关联性知识上下文。这种技术不仅提升了回答准确率，还能够快速提取和理解复杂的制造业术语和企业内部用语。例如，通过同义词机制维护行业术语，大模型能够在处理实际作业时更精准地理解和应用专业术语，从而提高生产效率和准确性。文档知识管理和问答知识管理是智能对话服务的重要组成部分，它们允许用户通过对话形式访问和管理知识库，从而提高信息检索的效率和准确性。这种管理方式不仅优化了用户与系统之间的交互，也为知识共享和再利用提供了便利。

在大数据量情况下，传统的RAG（Retriever-augmented Generation）召回系统往往面临召回范围过广、回答干扰信息过多的问题，直接导致回答不准确。这在制造业中尤为明显，因为制造业的数据种类繁多，既包括结构化数据（如生产设备的实时运行数据），也包括非结构化数据（如设备的维护手册和操作指南）。为了应对这些挑战，本项目采用了统一语义层增强的多模态知识融合技术。将结构化数据和非结构化数据进行融合，构建了一个统一的语义层。这个语义层能够理解并关联不同类型的数据，从而在回答问题时提供更加精准和全面的信息。通过构建语义关联拓扑，可以在设备类型、生产商和文档信息之间建立紧密的联系，确保每个回答都基于最相关和最新的知识。通过这种多模态知识融合技术的应用，本项目显著提升了回答的精准度，解决了传统RAG系统中回答不准的问题，并且实现了对知识本身的扩展和深化。

智能问数技术

通过理解自然语言查询并将其转换为SQL查询语句，极大地提高了从数据库中提取信息的效率。使用统一语义层的方式，将多模态异构数据源的元数据进行集中管理，帮助大模型更好的理解不同业务含义所对应的元数据信息，同时通过动态提示词的方式，将特有的业务含义及其思维链放到大模型的记忆系统中，使之可以更灵活的满足不同业务场景对查数、取数、分析的需求。这项技术不仅减少了人工编写查询语句的时间和劳动，而且降低了技术门槛，使得非技术人员也能通过自然语言与数据库进行交互。这促进了数据分析的民主化，并支持企业更快地获取数据支持，做出更加精准和及时的决策。

随着语义层的加入，系统的智能化程度得到了显著提升，特别是在SQL准确率方面。这种提升可以从几个不同的层面来理解。首先，LLM（Large Language Model，大型语言模型）的原生理解力，也就是它在没有额外语义信息的情况下对自然语言的理解能力，大约在30-50%的准确率。然而，一旦引入了基础的语义信息，比如字段级的语义描述，这个准确率可以提升到大约70%。进一步地，当引入基于语义的业务含义描述，也就是表级语义描述时，准确率可以进一步提高到85-100%。

在这个过程中，数据归因与分析起到了关键作用。这涉及到对数据的理解，包括字段级和表级语义的描述，它们分别代表了数据的业务逻辑和更宏观的数据含义。例如，一个字段可能代表某种特定的能耗数据，而一个表则可能包含了整个组织级别的能耗数据。通过这种层次化的语义描述，系统能够更准确地解析用户的问题并生成相应的SQL查询。

具体到用户问题的处理，例如用户询问“今年的总能耗是多少？”时，系统首先需要解析这个问题。这涉及到对问题中关键词的理解，比如“今年”和“总能耗”，以及它们在业务上的含义。在这个例子中，“今年”指的是从年初到当前日期的时间范围，“总能耗”则涉及到对特定字段，如year_total_quantity_coal的求和操作。接下来，系统需要确定数据来源，比如从哪个表中获取数据。在这个例子中，数据来源于energy_composite_basic表。然后，系统需要根据业务逻辑构建SQL查询，这通常涉及到对特定条件的筛选，比如时间条件（今年）和组织类型（org_type=1），以及对特定字段的聚合操作，如求和。

此外，系统进一步利用Dynamic few shot learning（动态少样本学习）和COT（Chain of Thought，思维链）技术，进一步提升系统对用户问题的理解和SQL查询的准确性，尤其是在数据质量受限的情况下。

最终，不仅仅是技术层面的实现，它还涉及到决策的落地与自主执行。这意味着系统不仅要能够理解用户的问题并生成正确的SQL查询，还要能够将这个查询执行并返回结果，从而实现从理解到执行的闭环。通过这种方式，系统能够为用户提供更加智能化和自动化的数据查询服务，实现问答是的关键词模糊匹配、字段级澄清反问、智能图表生成、分析摘要总结等特色能力。

智能工具调用技术（大模型调小模型）

通过理解自然语言描述的需求或指令，并将其转换为相应的工具调用（小模型服务），实现了业务流程的自动化和用户友好的交互体验。这项技术有助于提升用户体验，因为它允许用户通过自然语言与应用程序交互，而无需学习复杂的操作流程或API使用方式。同时，它也为企业提供了一个创新服务模式，通过开发基于自然语言的接口服务，增强了企业的竞争力。

在工具的选择和调用阶段，该系统通过对任务相关的领域知识进行多模态召回，以此进一步理解和确认任务意图，并最终匹配到对应代理工具的执行策略上，实现基于上下文领域知识的工具精准调用与执行。在召回阶段通过：1）多路向量、关键字融合召回等方式，确保最大范围的收集意图任务相关的上下文信息；2）通过问题改写、RRF倒数排序、reranker模型等方式，实现对意图的最终排序，确认意图与已有知识的匹配优先级。

在意图识别阶段通过：1）链路并行机制进行大模型意图确认；2）当意图存在歧义和关键信息缺失时，则会利用澄清反问机制进行意图的再确认，直至大模型认为已经完全理解任务意图（或放弃）。

其他技术点

企业级权限控制： 在多厂区、多级别和不同角色的用户环境中，权限控制是必不可少的。系统根据用户的角色和权限，提供定制化的答案，确保用户能够无感知地获取符合其权限范围内的知识。例如，高级别管理人员可以获取更深层次的企业战略信息，而现场工作人员则能够获得与其操作任务相关的实用信息，从而有效支持各级别人员的决策和操作。

混合LLM使用，兼顾推理能力与企业数据安全： 结合公网大参数量模型的推理能力，与内网数据安全的需求是制造业智能应用的重要考量。混合LLM使用策略能够有效地应对复杂的场景需求，例如大规模问答、智能体工具调用等。通过确保敏感数据不出内网，同时灵活选择不同链路上使用的大模型，企业能够在维持数据安全的同时，充分利用大模型的强大推理和处理能力，提升生产效率和智能化程度。

超级入口 ：超级入口技术使智能体能够自动识别用户意图，并根据不同的对话场景无需显式切换不同的对话应用。这种技术提高了用户体验，使得用户能够更自然地与系统交互，无论是查询数据、执行任务还是获取建议。

超级入口的智能策略和自动匹配能力，为制造业提供了高效的操作和管理工具，进一步提升了生产流程的智能化水平。

商业变化

随着一二阶段的合作成果落地，在人力资源和支撑性职能领域，数十万名作业员和研发人员已经可以通过统一的对话式入口，对公司政策、管理反馈、薪酬、休假等领域进行询问。以作业员为例，可极大程度的降低了对于系统使用的门槛。同时，相比于传统的提交工单系统，极大程度的提升了员工关怀专员对于作业员反馈处理的效率。

在员工关怀相关的问答场景中，知识覆盖度达46%（知识来源严格受限于知识库内），对于较为开放式的问答可实现76%的知识覆盖度（允许利用大模型本身的知识进行补充，常用于闲聊场景），并且在一个月的试用时间范围内，由业务专家对回答质量进行抽查，未收到任何负反馈。

对于系统回答不知道的情况进行统计分析后得出结论：

91.1%：知识库内并不存在相关知识，需要知识运营人员基于相关话题判断是否需要补充相关的领域知识1.4%：问题是提问不明，例如“离职、投诉”，此处进一步通过关联问功能，让系统引导用户给出更为准确的问题，如“离职手续怎么办理？”0.7%：专有名词尚未加入配置项，如员关=员工关爱中心、员工一站式服务中心，需要引导知识库运营人员在产品中添加相关配置。6.8%：相关语义存在识别问题，需要通过算法进一步提高。枫清科技（Fabarta）通过产品本身，也可实现对bad case的自动化收集，以持续性的提高回答准确率。

关于企业

·枫清科技

枫清科技（Fabarta）是一家 AI 数据基础设施公司，通过探索和联结数据资源，助力企业实现智能驱动的持续创新。在引擎层，打造面向 AI 的技术基础设施，提供支持图、向量和 AI 推理能力融合的 ArcNeural 多模态智能引擎；在平台层，通过企业智能分析平台加速可解释图智能和新一代AI技术在企业场景的落地，同时利用多模态数据编织平台帮助企业梳理多模态的数据资产，让企业充分发挥数据流动带来的价值；此外，Fabarta 可以基于多模态智能引擎、企业智能分析平台和多模态数据编织平台与客户和伙伴一同构建行业应用，加速企业数智化转型和 AI 技术的落地。

Fabarta

Fabarta是一家AI基础设施公司，提供图、向量和AI推理能力融合的ArcNeural多模态智能引擎，通过企业智能分析平台加速图智能在企业场景的落地，利用多模态数据编织平台帮助企业梳理多模态的数据资产，加速企业数智化转型和AI技术落地。

·立臻科技

立臻（江苏）有限公司于2020年11月25日成立，下设立臻科技（昆山）有限公司和立臻精密智造（昆山）有限公司，分别位于昆山综合保税区和昆山巴城镇。立臻科技(昆山)有限公司，位于昆山综合保税区，占地面积约225亩，已获得国家级绿色工厂企业、江苏省智能制造示范工厂等荣誉和称号。主要从事移动通信终端设备的研发生产制造及销售，2022年产值约960亿元。立臻精密智造(昆山)有限公司，位于昆山巴城镇，占地面积约840亩，主营业务为通讯终端及零组件研发和智能制造。2022年开始投产，全面投产后年产值超千亿。

立臻科技

员工互动、企业文化、投诉建议、企业动态、人员招聘

★ 以上由枫清科技投递申报的项目案例，最终将会角逐由数据猿与上海大数据联盟联合推出的《2024中国数智化转型升级创新服务企业》榜单/奖项 。

该榜单最终将于7月24日北京举办的“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛 ”现场首次揭晓榜单，并举行颁奖仪式，欢迎报名莅临现场

上海羊羽卓进出口贸易有限公司

智慧城市

国际智能制造论坛2022 未来会发生什么？2024世界人工智能大会，听各界大佬们如何预测

未来会发生什么？2024世界人工智能大会，听各界大佬们如何预测

上海人工智能实验室主任、首席科学家，清华大学惠妍讲席教授，衔远科技创始人周伯文：通向AGI的必经之路是ABI，并会有通专融合的“价值引爆点”

中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤：大模型和生成式AI有五个大的趋势

中国工程院院士、之江实验室主任、阿里云创始人王坚：一定会有新的大公司出现，也一定会有大公司烈火重生

商汤科技董事长兼CEO 徐立：有应用支撑，才能迎来AI的超级时刻

百度创始人、董事长兼首席执行官李彦宏：闭源模型最能打、避免掉入"超级应用陷阱"，最看好智能体

上海科学智能研究院院长、复旦大学浩清特聘教授、无限光年创始人漆远：实现通用人工智能的最好标志之一就是实现 “AI爱因斯坦”

施耐德电气副总裁古月：没有生态的力量，AI很难真正发展起来

腾讯集团副总裁蒋杰：场景应用会成为未来大模型的决胜要素

T3出行CEO崔大勇： 2027年将是自动驾驶商业化运营拐点

【数智化案例展】立臻科技——大模型助力制造企业数据智能化

数智化需求

面临挑战

数据支持

应用技术与实施过程

商业变化

关于企业

猜你喜欢

工业智能制造上天入海，全能选手！工业机器人让智能制造“酷炫加倍”

天昱智能制造(天昱智能官网)

智能制造展览会第二十六届中国北京国际科技产业博览会开幕

余姚制造智能化浙江余姚机器人产业链初步形成――瞄准建设“未来工厂”

智能制造的书智能制造，工业40最值得读的10本书，都在这里了

智能制造服装生产系统海澜之家新注册《服装智能生产MES系统V10》项目的软件著作权

智慧城市

未来会发生什么？2024世界人工智能大会，听各界大佬们如何预测

上海人工智能实验室主任、首席科学家，清华大学惠妍讲席教授，衔远科技创始人周伯文：通向AGI的必经之路是ABI，并会有通专融合的“价值引爆点”

中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤 ：大模型和生成式AI有五个大的趋势

中国工程院院士、之江实验室主任、阿里云创始人王坚 ：一定会有新的大公司出现，也一定会有大公司烈火重生

商汤科技董事长兼CEO 徐立：有应用支撑，才能迎来AI的超级时刻

百度创始人、董事长兼首席执行官 李彦宏 ： 闭源模型最能打、 避免掉入"超级应用陷阱"，最看好智能体

上海科学智能研究院院长、复旦大学浩清特聘教授、无限光年创始人漆 远 ： 实现通用人工智能的最好标志之一就是实现 “AI爱因斯坦”

施耐德电气副总裁古月：没有生态的力量，AI很难真正发展起来

腾讯集团副总裁蒋杰：场景应用会成为未来大模型的决胜要素

T3出行CEO崔大勇 ： 2027年将是自动驾驶商业化运营拐点

【数智化案例展】立臻科技——大模型助力制造企业数据智能化

数智化需求

面临挑战

数据支持

应用技术与实施过程

商业变化

关于企业

猜你喜欢

工业智能制造 上天入海，全能选手！工业机器人让智能制造“酷炫加倍”

天昱智能制造(天昱智能官网)

智能制造 展览会 第二十六届中国北京国际科技产业博览会开幕

余姚制造智能化 浙江余姚机器人产业链初步形成――瞄准建设“未来工厂”

智能制造的书 智能制造，工业40最值得读的10本书，都在这里了

智能制造服装生产系统 海澜之家新注册《服装智能生产MES系统V10》项目的软件著作权

中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤：大模型和生成式AI有五个大的趋势

中国工程院院士、之江实验室主任、阿里云创始人王坚：一定会有新的大公司出现，也一定会有大公司烈火重生

百度创始人、董事长兼首席执行官李彦宏：闭源模型最能打、避免掉入"超级应用陷阱"，最看好智能体

上海科学智能研究院院长、复旦大学浩清特聘教授、无限光年创始人漆远：实现通用人工智能的最好标志之一就是实现 “AI爱因斯坦”

T3出行CEO崔大勇： 2027年将是自动驾驶商业化运营拐点

工业智能制造上天入海，全能选手！工业机器人让智能制造“酷炫加倍”

智能制造展览会第二十六届中国北京国际科技产业博览会开幕

余姚制造智能化浙江余姚机器人产业链初步形成――瞄准建设“未来工厂”

智能制造的书智能制造，工业40最值得读的10本书，都在这里了

智能制造服装生产系统海澜之家新注册《服装智能生产MES系统V10》项目的软件著作权