“标题党,是信息传播过程中的噪声,我们一直在进行打击。”在1月11日今日头条召开的《让算法公开透明》交流会上,资深算法架构师、中国科学技术大学计算机博士曹欢欢如此说道。在交流公上,他还面向业公开算法原理,消除社会各界对算法的一些误解,同时接受意见和建议。
“我们会过滤停留时间短的点击。”曹欢欢说。今日头条的推荐机制并不惟点击率论,点击只是说明用户对标题感兴趣。如果许多用户点进文章,大都很快就退出来了,说明文章的标题和内文是存在较大差异的。
如果被定义为“标题党”,机器算法将自动减少给“标题党”文章分发的资源,从而提升那些优秀内容分发资源的几率。
另外,机器算法也会自动识别“标题党”文本,给不同的特征以不同权重。在运行的过程中,算法会拆分标题里面单个词,并形成权重分数,同时也会拆分对词组,并自动打分。分数一旦超过阈值就被认为是“标题党”,头条号作者会收到警示。
据介绍,每个头条号帐号拥有100分起始帐号分值,如触发惩罚条例,将被扣除相应分值,且不可恢复,如100分被扣光,则帐号将被封禁。根据运营规范,头条号帐号违规发布“标题党”内容,一次就会被扣除10分。
在分享过后,曹欢欢在现场解答了社会各界人士对算法的疑问,包括今日头条如何实现冷启动,广告和内容该怎样平衡,怎样准确地拓展用户兴趣图谱等切实的工程性问题。同时,听取接纳了大家对今日头条算法的意见和建议。
推荐