欢迎来到上海园丁鸟网络科技有限公司|企业网站建设企业建站企业官网建设企业官网
咨询热线:18017747315当前位置: 首页 > 新闻动态 >
联系我们
企业网站建设 建站咨询
电话咨询:18017747315
E-mail:2355555999@qq.com
QQ:2355555999

中国最具影响力的综合搜索引擎比较研究

作者/整理:http://www.voez.net/ 来源:http://www.voez.net/ 日期:2018-10-11

面对浩如烟海的网络信息,选择最合适的搜索引擎快速、准确地找到所需要的信息成为人们在信息检索中最关注的 问题。通过实验,从数据库更新、检索功能、响应时间、査准率、个性化服务等五个方面,对中国市场目前最具影响力的三 种综合搜索引擎百度、谷歌、360进行比较研究,总结了三种搜索引擎的优势与不足,提出合理选择搜索引擎的策略和提高 检索效率的技巧。
在互联网技术普及的今天,人们査阅资料都会选择一种便 捷、全面、准确的方式——搜索引擎。现在国内外的搜索引擎 五花八门,面对浩如烟海的互联网信息,怎样才能使用最合适 的搜索引擎方便、快速、准确地找到所需要的信息,这成了人们 在信息检索中最关注的问题。关于搜索引擎的评价研究一直 是研究热点之一,目前,国内外学者在该领域的研究大多是理 论层面的、定性的研究。虽然国内学者也进行了一些定量的评 价,但是很少有人从用户的角度考虑,通过实验进行定量分析 比较研究。木文以用户快速、准确、方便査找信息为主导方向, 通过实验,对中国市场目前最具影响力的三种中文综合搜索引 擎:百度、谷歌、360进行比较研究,希望木文的研究能指导用户 选择合适的搜索引擎,提高检索效率,并能指导中国搜索引擎 的改进和发展。
1.中国市场最具影响力的中文综合搜索引擎基本情况
搜索引擎是一种采用高效的Spider程序进行网络资源的 收集、整理与组织,为用户提供査询服务的信息服务系统。常 见的搜索引擎有综合搜索引擎和特殊搜索引擎。从中国用户 角度、市场份额及有关媒体统计数据看,目前中国市场上最具 影响力的中文综合搜索引擎是百度、谷歌(香港)、60等。
百度搜索引擎是最了解中国文化、更懂中国人的心理、更加贴近中国的生活,它是目前世界上规模最大的中文综合搜索 引擎;Google搜索引擎是被公认为全球最大的搜索引擎,在国 内外都具有很大的影响力;360搜索引擎是目前中国市场最具 影响力的搜索引擎之一,上市几天其综合搜索访问量份额达 8.97%,迅速成为中国第二大搜索引擎。
2.百度、谷歌、360比较研究
木文从三种中文综合搜索引擎影响力特点出发,以用户快 速、准确、方便査找信息为主导方向,从数据库更新、检索功能、 响应时间、査准率、个性化服务等五个方面进行比较研究。
2.1方法
分析比较的原始数据通过具体实验获取,实验中采用了 “网页快照”、“时间戳”5和时间间隔检索方法来获取网页更新 的时间变化。实验时间从2017年3月10日至31日,实验在华 中师范大学校同网网络环境下,使用360浏览器进行。实验检 索课题集是从“百度搜索风云榜”中选择出更贴近用户兴趣和 检索需求的五个检索关键同,具体是:KW1 :王大治(人物)、 KW2:国五条(社会民生)、KW3:欧文退役(体育)、KW4: QQ(科 技)、KW5:大众(汽车品牌)用选择的这五个关键字分别在三 种搜索引擎中进行实验,分析统计数据,并结合相关文献得出 结果、结论。
2.2实验结果及分析
2.2.1数据库更新
为提高查全率,各种搜索引擎都努力扩大数据库,而数据 库的更新周期直接影响了查准率。实验中通过“网页快照”“时 间戳”和时间间隔检索方式进行实验,记录检索结果总数变化 及时间变化并对结果进行分析对比,得到三种搜索引擎的数据 库更新情况,如表1。

结果表明,百度在数据库更新方面做得相对好一些;谷歌 在数据库更新方面敏感度稍差;而360主要依托百度和谷歌的 数据库,它的页面刷新频率更高,能搜索到最新信息。
2.2.2查询功能
搜索的强度是评估搜索引擎质量的一个重要指标。下面 主要从检索方式、布尔检索、限定检索及截词检索四个方面进 行实验测试,结果如表2所示.

结果表明:三种搜索引擎检索方式相似,百度还支持二次 检索;百度和谷歌都支持布尔检索,而360支持与、或检索符; 百度和谷歌都有限定检索功能,谷歌的限定能力最强,而360 没有;三种搜索引擎都支持截词检索,但谷歌和360此功能 有限。
2.2.3响应时间
响应时间是指用户通过某个搜索引擎从提交关键词检索 式到系统返回检索结果所用的时间,它表明一个搜索引擎的检 索速度。速度越快,用户也就越对它有所偏好。用选定的关键 字实验测试,结果发现只有谷歌在检索结果中显示检索响应时 间。根据实验测试过程中的观察表明,在网络畅通的情况下百 度搜索上万网页通常只需零点几秒,是三种搜索引擎响应时间 最短的,号称为毫秒级检索响应速度。


2.2.4精确率
精确率是衡量检索系统信噪比的指标,也是用户最关心 的问题,查询精确率高可以减少重复检索,节省用户的检索时 间。对选定关键字集进行检索得到的原始数据如表3,三种搜 索引擎的查准率如表4所示。实验结果主要是作为分析比较 的依据,在同等条件下,增大或减小数值不影响分析比对结果, 为了方便比对数据,表4中数据均作了消阶处理(即每个数都 乘上1000).
从实验结果来看,360的查准率比其他搜索引擎更胜一筹, 百度和谷歌的检索返回结果总数比360大一些,360的查全率 要差一些,而谷歌的检索相对更全面一些。
2.2.5服务个性化
服务的个性化本质是为不同用户提供个性化的服务内容 和活动,尽量满足各种用户的需要。对于搜索引擎而言,个性 化服务是影响用户对网站偏好的一个重要指标。下面从功能 设置、关键词输入、搜索设置、检索结果等方面对三种搜索引擎 的个性化服务进行比较、分析得出:三种搜索引擎在个性化服 务方面各具特色。结果如表5所示。

3.结论
通过以上实验并对三种搜索引擎进行了比较、分析研究, 得出以下结论:
3.1百度、谷歌、360搜索引擎优劣并存
百度搜索引擎更注重服务的木地化,更多地融入了中文检 索的特点,收录的中文信息覆盖面广、数据库更新快、检索速度 快,对于中国木土文化的理解和适应能力更强。百度的短处是 检索结果排序不合理、精确度不高等,这些都需要进行优化和 改进。
比较而言,谷歌的检索功能强大、灵活,支持多种语言检 索,谷歌能够对网页的重要性做出客观的评价,结果排序客观 公正,收录速度快,以复杂而全自动的搜索方法排除了仟何人 为因素对搜索结果的影响。谷歌的缺陷在于“不懂中国”°,中 文数据库更新慢。因此,网络上热传着“内事不解问百度,外事 不解问谷歌”之说。
36°强调的是人在搜索中的重要性,它采取了机器学习技 术和独创的PepoleRank算法,高质量网页的排名靠前可为用户 提供更清洁,安全和可靠的搜索结果。360的缺陷是没有完全 识别字母组合检索同,没有高级检索功能,信息相关性、复杂 性、抓取速度等方面也需加强、改进。
3.2合理选择搜索引擎,充分利用互动问答平台解决问题
用户在进行检索时,要根据具体的检索要求选择合适的搜 索引擎,提高检索效率。比如要检索具有中国地域特色的信 息、国内热点问题、中国人物等具有中文习惯说法的信息等,用 百度搜索引擎效果更好;若要检索国际事件、名同、英文等,特 别是要获得非中文信息时,用谷歌搜索引擎查准率更高;如果 用户对查全率要求不是太高,用36°搜索引擎可以得到比较准 确的检索结果。另外,还可以通过百度的“百度知道”360的 “问答”等功能进行提问或检索答案,充分利用互动问答平台解 决问题。
3.3掌握检索技巧,提高查询效率
提高査询关键同的选择技巧,有助于提高检索速度、获得 准确信息。为了选好关键同,要掌握一些必要的技巧,要避免 用含义宽泛的一般性同语作为关键同,如要査某方面的学习信 息,选择“英语学习”之类的关键同就比“学习”更准确;当査询 结果中有太多不相关的信息时,可以添加关键同滤除不相关结 果;将关键同内包含的疑问同、连同、感叹同、辅助同等删除有 助于提高査询质量。当然,在査询中,也可以根据一次搜索的 结果,不断修正关键同,最终找到想要的信息。
4.结语
搜索引擎中还有许多问题,如信息量不足,査询精确度低; 信息刷新速度跟不上,网络上信息的变化无法控制;管理信息 内容和多样化的格式很困难;准确性和可靠性差;数据错误、遗 漏、过时等等。希望搜索引擎能认清不足,不断改进,加强服务 的个性化,提高自动搜索软件的智能化程度,加快信息刷新速 度,让用户能够方便、快速、准确地找到所需要的信息。