谷歌专利申请泄露谷歌新闻排序新算法规则
谷歌去年提交的一项新闻排序系统专利申请泄露了谷歌在新闻排序上的一些算法规则。
这项专利提交的时间为2012年2月,批准时间为去年12月,名称叫“提高新闻文章排序的系统和方法”( Systems and Methods for Improving the Ranking of News Articles)。
根据此项专利资料,谷歌在对“Google News”页面上所展示新闻进行排序时使用了十多种独立算法规则。
这些算法包括:在一定时间内一家新闻机构创作的文章数量,新闻文章篇幅,新闻的报道的影响力,突发性新闻报道数量,新闻展现形式,作者观点,转发发行量、以及与新闻运营员工规模、新闻员工规模、新闻来源的报导宽度、来自国外的流量,以及写作方式等。
当使用者输入搜索字符时,谷歌会分析具有该关键字的新闻列表,确定每个链接的新闻来源,然后基于新闻来源品质的各种指标进行排序。
不过根据专利信息,谷歌通过搜索引擎监测发现,知名新闻网站(如CNN)所提供的新闻普遍比较受读者欢迎,而其它不知名网站(如Town News)报道,用户可能不去看。
事实上,自去年谷歌提出新闻排序新算法规则后,就引来了媒体公司的一片争论。许多媒体公司抱怨谷歌很容易操作新闻排序。谷歌的这种行为会直接影响到了读者所看到的新闻内容。