人肉搜索详解
1. 引言 2. 谷歌的人肉搜索愚人节 3. 人肉搜索引擎升级之路 4. 人肉搜索引擎工作原理揭秘
5. 人肉搜索的未来:人工和技术,一场无法结束的战争
引言
2007年底,一个叫姜岩的31岁女子,因为丈夫有了外遇并想离婚,从24楼跳下自杀。在她生前写下的后来广为人知的“死亡博客”中,将自杀原因归咎于丈夫王菲的不忠,并贴出了丈夫和第三者的照片。这些内容在网上公开后,论坛上众口一词痛骂“负心郎”王菲与第三者。
部分网友开始对王菲进行详细信息追踪,王菲的信息开始被逐步揭示。王菲在网上被“通缉”、“追杀”,并不断收到恐吓邮件。在现实生活中,王菲父母住宅多次被人骚扰,门口两侧贴满诬陷恐吓标语,其工作单位也因被骚扰将王菲辞退。
这是一次典型的人肉搜索事件。人肉搜索引擎不是一种互联网技术或产品,而是指基于互联网提供的平台(如论坛、贴吧、社区等),利用互联网用户的人工参与,来提纯所需要信息的一种机制。
比如,某网友需要解决一个问题,就在网上社区发贴,并以一定数量的虚拟币作为酬谢。看到帖子的网友利用其专业背景、亲身经历或道听途说的答案来回应。最后,提问题的人得到了答案,回答得到了报酬,双方皆大欢喜,这就形成了“人肉搜索”引擎机制。
在本文中,我们将研究人肉搜索是如何登上流行词汇舞台的,详细追溯中文互联网史上“人肉搜索”的发展,以事件为导向研究“人肉搜索”的技术升级之路,并且预测“人肉搜索”的未来。
谷歌的人肉搜索愚人节
人肉搜索成为一个为社会普遍认可的流行用词,要从2008年4月1日的愚人节说起。2008年4月1日,谷歌中国在其网站上推出一个“人肉搜索”的网络产品,在这个页面上,谷歌对自己的这个产品如此介绍:
什么是人肉搜索?
人肉搜索与刺青、美白、护肤、减肥等直接在人肉上施行的种种行为无关。顾名思义,人肉搜索就是利用现代信息科技,变传统的网络信息搜索为人找人、人问人、人碰人、人挤人、人挨人的关系型网络社区活动,变枯燥乏味的查询过程为一人提问、八方回应、一石激起千层浪、一声呼唤惊醒万颗真心的人性化搜索体验。人肉搜索不仅可以在最短时间内揭露某某门背后的真相,为某三某七找到大众认可的道德定位,还可以在网络无法触及的地方,探寻并发现最美丽的丛林少女、最感人的高山牧民、最神秘的荒漠洞窟、最浪漫的终极邂逅…… 人肉搜索追求的最高目标是:不求最好,但求最肉。
如果互联网用户真的尝试使用这个搜索产品,那么他在输入关键字并回车查询后,会发现这只是谷歌的又一个愚人节玩笑。
每年的愚人节,谷歌都会针对当前流行事件或者趋势推出愚人节恶作剧。既然被谷歌选为了2008年愚人节的恶作剧主题,“人肉搜索”大热的程度可见一斑。在下一部分中,我们将看到“人肉搜索”是如何一步步发展,并成为热门词汇的。
人肉搜索引擎升级之路
2007年初,《时代》杂志将年度人物颁发给网民的时候,很多中国人对《时代》杂志的这个判断感到疑惑不解。然而在2007年整整一年中,仿佛是为了印证《时代》杂志的论述,网络开始史无前例地影响和改变起中国的社会。
从卖身救母事件、网络虐猫事件,到火爆的“铜须门”网络丑闻乃至最新的“白领跳楼自杀事件”,通过遍布互联网的“人肉引擎”矢志不移的努力,本不离奇的事件在2007年被互联网演绎成了一个个离奇的悬疑剧而吸引了全社会大众的关注。伴随而来的就是人肉搜索引擎的一战成名。
对于这个现象,《时代》的概括可谓言简意赅:“正是千千万万个网民浏览网站,创建博客、视频共享网站和交友网站,才使网络信息爆炸性增长,推动传媒进入大众唱主角的时代。”
人肉搜索引擎最早出自于猫扑社区。这个互联网站因为拥有巨大用户量而具备了人肉搜索的先决条件:人。
MP是猫扑大杂烩使用的一种虚拟货币,称作“猫扑币”或者“猫皮”。一般来说,想要获得这类货币,需要大量地参加社区活动,发帖子,相比于游戏或者点广告这些缓慢来“钱”方式,做猫扑“赏金猎人”是一个好主意,不仅能收获猫皮,还能体验侦探的快感。于是,某人需要解决一个问题,就在猫扑发贴并许与一定数量的MP作为酬谢。很快,就会有赏金猎人看到这个帖子,他们利用其专业背景、亲身经历、道听途说甚至冷嘲热讽来回答这一切。然后争先恐后地把找到的答案回在帖子里面邀功。最后,提问题的人得到了答案,赏金猎人得到了MP,皆大欢喜。这也就形成了所谓的人肉搜索引擎的机制。
有趣的是,通过比较我们可以发现,人肉搜索引擎的搜索流程和搜索引擎在不同服务器之间的分布式搜索流程看起来是那么的相似,区别仅仅在于发动和执行流程的是人,还是机器。
如今,人肉搜索被归纳为经历了5个发展阶段:
- 人肉搜索1.0(引擎首次发动)
以公布个人资料为重点。
2001年 微软陈自瑶事件——人肉引擎的首次发动:根据一张照片爆出照片主人的大部分个人资料。
- 人肉搜索2.0(方法基本确定):
- 先在人格上进行分析
- 然后推测私人信息
- 最后发出通缉令
2006年2月“虐猫事件”——首次开始严重影响到“被通缉者”的工作生活:这是人肉搜索广为人知的标志性事件,短短六天之内将虐猫视频的三个嫌疑人锁定,第一次彰显了网络调查的能力……
- 人肉搜索3.0(引擎升级):
- 效率越来越快
- 影响扩大
- 除了资料,开始曝露他人生活凭证
2006年4月“铜须门”事件——受害人群较前两次变得更多:网友调查到铜须的身份,还将他的求职简历、家庭电话、手机号、学校电话以及照片公布,发布“江湖追杀令”,呼吁社会封杀铜须。由此,一场网络事件,终于演变成一场大规模的社会讨伐。
- 人肉搜索4.0(引擎升级):
- 速度更快,资料更全
- 无辜人群更众多
- 网络判决开始影响社会判决
- 攻击更猛,已然有些不顾及被谴责对象
2007年4月钱军打人事件——网络判决开始试图影响社会判决:几个小时之内,殴打老人者钱军和其妻子的电话号码、身份证号码、家庭住址、工作单位、孩子上学的学校全部曝光……网民试图通过影响由派出所来惩治钱军。
- 人肉搜索5.0(人性化、理智化)
- 部分网友在面对人肉搜索时趋于理智
- 大部分网民开始理性地参与讨论
2007年底,由“打虎网民”层层推进的“华南虎事件”,大部分网民开始理性地参与讨论,意见和观点主要基于摄影、生物、常识等不同角度的技术分析,体现出追求真相的愿望。
在下一部分中,我们将看到人肉搜索是如何工作的,其工作原理是基于什么进行的。
人肉搜索引擎工作原理揭秘
为什么选择人肉搜索引擎,而非搜索引擎这种互联网产品?原因在于,对于一些八卦搜索、没有唯一答案、需要去挖掘答案的搜索,人肉搜索往往能得到更有价值和吸引力的结果。这是因为,由于人肉搜索引擎聚集了各地的不同阶层、不同知识背景的人,得到帮助的几率也会大大增加。当然,人肉搜索引擎也有比不上互联网一般搜索引擎的地方,那就是速度。所以说,人肉搜索引擎的潜在力量比一般的搜索引擎强大,但反馈速度就比不上一般的搜索引擎。换个角度来看,人肉搜索引擎其实就是搜索引擎的社区化。区别仅仅在于发动和执行流程的是人,还是机器。
那么人肉搜索引擎的工作原理是什么呢?人肉搜索基于下面这种假设:你是网民吗?只要你曾经使用过互联网,在网上留下过你的个人资料,留下过你的言论,就会留下痕迹,就能搜索得出来。
常用方法:
- 利用GOOGLE、百度等超强的搜索功能,根据搜索结果,变换输入关键词,细化得到的结果。
- 从被搜索的人的博客入手,再进而搜索他朋友的博客,经常有意外的收获。
- 不放过搜索一些常用网站,如易趣、淘宝,或一些大型论坛,如天涯、猫扑、新浪等,对方都可能留下注册信息。
- 通过对方的ID或邮件地址,查出其IP号,可以获得各种“马甲”的真实身份;
- 如果知道对方所在城市,利用GOOGLE卫星地图查到他户外照片的确切所在地。
- 具备一定的逻辑分析能力,整合梳理庞杂信息,拼凑出可被验证的调查结果。
人肉搜索的未来:人工和技术,一场无法结束的战争
迄今为止,搜索引擎是使用最广泛的一种互联网应用。只要搜索引擎还是用户寻找信息的最主要手段,人工和技术就是一场永远无法结束的战争。
搜索引擎是利用机器自动化的收集网络信息并有序化的一种技术。虽然现在的搜索引擎高效快速,但是因为人工智能并不完善,搜索引擎仍然很难甄别刻意修饰过的信息,这也正是谷歌面对“点击欺诈”在互联网上泛滥而束手无策的原因。
而为了应对这一难题,全球的搜索巨头都加大了研发的力度。据了解,Google正准备研发包括语义搜索在内的下一代智能搜索引擎;微软也开始研发基于Web Block(网页块)而不是网页的搜索技术。
与此同时,结合人肉搜索的搜索引擎也成为了新一代搜索引擎的思路:搜索引擎对用户在搜索引擎结果的点击行为和点进后的浏览行为继续跟踪,而不是简单地反馈结果或者跟踪到点击就结束。只有更加深入地分析用户行为才能理解用户的需求,并向用户反馈最符合检索需求的结果。通过分析这些用户的行为习惯,再根据内部算法进行调整补充,排序结果可以更优良。
但人肉搜索不会因为技术的发展而停止自己前进的脚步。当目前的技术不能解决所有搜索信息需求时,数个互联网公司都推出了基于人肉搜索的产品。比如,百度娱乐频道被看作是百度技术整合人肉搜索的尝试,娱乐频道内全部的新闻都是基于百度贴吧这个百度产品里的资信息源,通过百度搜索引擎形成的新闻聚合。