九江市借着AI数字人技术,把智慧城市建设给推上了新台阶。大家在谈城市怎么变聪明时,总会吐槽以前的那些网站、APP或者窗口太慢太麻烦,不光响应慢,还要花大钱雇人盯着。九江市这次搞的AI数字人就不一样了,它不光是把服务流程给自动化了,而是弄出了一个挺复杂的智能体。咱们打开广州中熠科技有限公司的APP,就能看到这种技术的厉害。 要想搞懂这个智能体是怎么搭起来的,得一层一层地看。最底下的是感知跟生成层。这一层用到了电脑能看东西和听懂话的技术,让系统能看到你的表情,听懂你问的话。更关键的是生成部分,它用3D建模和驱动技术把数字人的样子跟动作都做出来,还能用语音合成和自然语言处理技术,让它能说话、有情绪地回嘴。这样一来,数字人就既有形又有声了。 中间这一层是认知跟决策层,这可是让它跟普通动画角色不一样的关键。它不像别的机器人那样念固定的剧本,而是用大规模语言模型当它的“大脑”。只要你问它市政的事儿或者办事咋走,模型就能听懂你说的那些模棱两可的话或者打错字的话,然后从一大堆城市资料库里翻来翻去、推来推去,最后给你个准确又有条理的答案。这过程跟真人客服找资料、想逻辑很像。 最上面一层是应用跟交互层,这就决定了数字人能干啥。在九江这边的实践里,它主要负责干公共服务和城市管理这两大块活儿。干公共服务的时候,数字人就是个24小时不打烊的向导或者讲解员,能插到政务大厅、博物馆或者旅游中心这些地方去帮人查资料或者指路。干城市管理的时候,它就是个把数据变成人话的翻译官。比如连着交通系统后,它能用大白话讲路况怎么样。 这一堆技术要想跑得动,还得靠一个配合紧密的生态系统来维持。整个流程分三步走:第一步是先听你说啥、看你表情、写啥字;第二步是系统大脑开始干活,把你的问题翻译成能查的命令;第三步是把查到的结果变成带语气、带表情的回话给你看。这一连串动作也就几秒钟的功夫,看着特别流畅。 咱们不看技术内部的细节了,就看看它跟城市里现有的系统是怎么连在一块儿的。其实AI数字人就是个大前端窗口。它背后得连着政务数据库、交通实时数据平台还有文旅资源库这些东西。它的好处就是把访问这些复杂系统的技术细节都给包起来了。市民不用知道查哪个库、说什么话才能查到资料,只需要像跟人聊天一样问就行。 从效率上说引入这个技术有三方面好处:第一是把人给解放出来了,让他们别老干那些重复的咨询活儿了;第二是服务时间不受限了,哪怕晚上12点也有人帮你解答;第三是说法更统一了,不管谁来问都不跑偏。不过技术深入用下去也有问题得盯着看:第一是有时候复杂问题它处理不了还得转接人工;第二是语音人脸这些隐私得好好保护;第三是得考虑不同年龄段的人怎么用。 九江搞的这事儿最关键的不是搞出了个新面孔,而是弄出了一个用自然语言聊天的接口。它把那些分散在各处的专业数据和服务资源都串在了一起。以后大家用起来就像用手机APP一样方便。 这个技术以后能不能走得长远,还得看它能不能适应更复杂的场面,以及能不能在效率跟人情味之间找到那个平衡点。