从程序员技术论坛到智能社区

知乎在过去几年中从一个程序员技术论坛快速成长为了拥有1.4亿注册用户的庞大知识社区,每天有3400万用户活跃,页面访问量达到了230亿次。尽管这个社区在规模上取得了巨大成功,但它也面临着信息洪流和管理难题。为了解决这些问题,知乎引入了一套自主研发的AI中台系统,让AI在生产、消费、连接和管理全流程中发挥重要作用。 在生产环节,知乎把机器学习模型植入后台。这个系统通过给问题打标签和分析用户历史回答记录,把问题推送给最合适的答主。这种自动路由机制让整体回答量提高了300%,并显著增加了深度内容的数量。 在消费环节,知乎通过状态转移模型捕捉用户未来的兴趣。他们不仅给问题打标签,还预测用户未来几个月可能感兴趣的内容,提前把相关信息推送给潜在父母等目标群体。此外,知乎还采用了“母爱 + 父爱”算法,既记录用户明确喜欢的内容,也用高分、高赞和高认同度内容引导用户发现更多的知识。 在连接环节,知乎把阅读关系、关注关系和互动关系抽象成节点与边,并使用Graph Embedding技术把用户嵌入到高维空间中。这个系统计算亲密度时同时考虑语义相似度和行为亲近度,推荐“可能想认识的人”更加精准。 在管理环节,知乎采用了瓦力、悟空和人工“三保险”机制。瓦力是一个实时学习的模型集群,能够在0.3秒内判定违规内容并处理5000条新内容。广告识别模块上线Bi-LSTM-CRF后准确率与召回率均有明显提升。悟空则负责扫描异常登录和刷赞行为,并对作弊账号实施秒级封禁。小管家团队每天抽检算法结果并进行人工复核。 知乎还与高校合作共建语义理解实验室,让前沿算法在真实场景中落地。视觉审美方面使用ResNet对封面图和插图进行低俗识别与质量打分,准确率超过90%,日均过滤数千张低质图片。 未来一年里,知乎计划把AI进一步应用到话题绑定、话题层次结构重建以及广告CTR预估等场景中。他们的目标是让智能社区自我进化,并把每个人大脑中的知识、经验和见解精准对接给需要答案的人群。这既是知乎的初心也是长跑目标。