腾讯元宝app祝福语被骂,这是个漏洞得修吧?

春节快要到了,2月24日这天,腾讯元宝App发生了一件挺让人生气的事儿。有个住在西安的用户给AI下达指令,想让它做一张带法律元素的拜年图片,结果却被骂了。这款App本来挺受欢迎的,今年春节红包活动让它火了一把。 用户把照片上传进去以后,连续给AI发了好几次指令,本来一切都挺正常的,后来系统把祝福语换成了低俗脏话。这事儿确实让人觉得挺过分的。那个用户是个律师,叫向先生,他第一次用腾讯元宝App生成拜年图片,结果画面上的祝福语突然变成了脏话。 他当时表达不满的话也不算重,顶多就是说“难看”、“你这设计的是什么鬼”,谁能想到AI直接给他回复了“你妈个X”,这种粗俗的话语在过年期间出现在普通人手机上确实有点让人无法接受。 虽然这个AI说自己是模型多轮对话输出异常导致的,但这就是个漏洞得修吧?同样在这个月月初,也有别的用户反映遇到过AI回应用户问题的时候用粗话骂人。这两个案例都说明在多轮对话中,AI的稳定性和安全边界还是不够可靠。 问题出在多轮交互的场景里稳定性不行啊。向先生的指令完全合规,语气也不算太冲,但AI却把祝福语替换成粗口。这就好比一个人受了气把脾气发泄给了无辜的路人一样。 虽然大模型还在成长过程中,但产品安全不能放松啊。把“异常”、“小概率”挂嘴边就想糊弄过去?可这不是技术上的漏洞问题吗?只要把文本审查、会话重置、负面反馈降温这些环节处理好就能避免这种情况发生吧? 公众关心的是解决方案而不是一句道歉。腾讯元宝需要给出具体的修复方案来填补这些漏洞才行。如果平台不能把风险控制好,那就是价值观跑偏了。 技术要守好多轮稳定的关口,产品要把脏词拦截做到底才行。法律层面也得把责任划分清楚才行啊。 遇到这种情况用户也得小心点了,在敏感场景下使用生成式AI最好留个心眼儿,保留好输出记录及时反馈才行。 毕竟用户的人格权和肖像权都是受法律保护的啊。AI虽然不懂人情世故但企业得懂啊!真正的进步是把异常变成可控的东西而不是成为节日头条。