欢迎来到上海园丁鸟网络科技有限公司|企业网站建设企业建站企业官网建设企业官网
咨询热线:18017747315当前位置: 首页 > 新闻动态 >
联系我们
企业网站建设 建站咨询
电话咨询:13524991327
E-mail:1424374510@qq.com
QQ:1424374510

搜索引擎在计算机辅助翻译中的应用

作者/整理:http://www.voez.net/ 来源:http://www.voez.net/ 日期:2018-10-12

以网络为先导的信息通信技术(Information and Communication Technology,ICT)给翻译工作带来了革命性影响,深刻改变了翻译工作的环境和方式。对今天的翻译工作者而言“慢工出细活”的手工式作业已不适合时代发展和社会需求。 利用计算机和网络工作能够使译者轻松、巧妙地利用网络资源共享、搜索查询、信息交流等功能进行计算机辅助式翻译操作, 从而极大提高翻译质量和效率。
1.搜索引擎的概念
搜索引擎指根据一定策略、运用特定的计算机程序从互联网 搜集信息,完成信息组织、处理后为用户提供检索服务,并将检索 信息展示给用户的系统,包括全文索引、目录索引、元搜索引擎、 垂直搜索引擎、集合式搜索引擎、门户搜索、引擎与免费链接列表 等(刘彦平,2011)。百度和谷歌等是搜索引擎代表。
2.搜索引擎的工作机制
抓取网页。每个独立的搜索引擎都有自己的网页抓取程 序爬虫(spider)。爬虫Spider顺着网页中的超链接,从这个网 站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被 抓取的网页被称之为网页快照由于互联网中超链接的应用很 普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的 网页。
处理网页。搜索引擎抓到网页后,还要做大量的预处理工 作,才能提供检索服务。其中,最重要的就是提取关键词,建立索 引库和索引。其他还包括判断网页类型、去除重复网页、分析超 链接、分词(中文)、计算网页的重要度/丰富度等。
提供检索服务。用户输入关键词进行检索,搜索引擎从 索引数据库中找到匹配该关键词的网页。为了用户便于判断, 除了网页标题和URL夕卜,还会提供一段来自网页的摘要以及其 他信息。
3.基本逻辑检索符
3.1布尔逻辑检索
布尔逻辑检索的使用面最广,使用频率最高。利用布尔逻辑 运算符连接各检索词,然后由计算机进行相应逻辑运算,找出所 需信息。需要注意的是,在使用布尔逻辑检索时仍然需要参考具 体数据库使用帮助或说明。
表1布尔逻辑运算符与检索式
逻辑 运算符 检索式
A AND B/ A*B A OR B / A+B A NOT B / A - B
3.2位置算符检索
位置算符检索也称全文查找逻辑算符或相邻度算符,是用来 规定符号两边的词出现在文献中的位置的逻辑运算算符。
W算符(with):通常写作A(nW)B,表示词A与词B之 间至多可以插入n个其他的词(注意是单词,不是字母),同时A、 B保持前后顺序不变;其中(W)也可以写作(),表示两词之间不 得有其他词,但有些系统允许有空格或标点符号。
N算符(new):通常写作A(nN)B,表示A与B之间至多 可以插入n个其他词,同时A、B不必保持前后顺序。其中W)表 示算符两侧的检索词必须前后相连,但词序可颠倒,词间不允许 插入其他词或字母。
Same:通常写作A SAME B,表示SAME两侧的检索词A 和B必须同时出现在数据库的同一个段落中。
s算符(subfield):通常写作A(S)B,表示A与B必 须同时在一个句子或同一子字段内出现,但词序可随意变化,且 各词间可以加任意多个词。例如输入solar(W)energy,会得到 solar energy ;输入 solar(N)energy 可會匕会得到 solar energy 或者 energy solar。
3.3截词检索
截词检索是指在检索词的合适位置进行截断,然后使用截 词符进行处理,既可节省输入的字符数目,也可达到较高的查全 率。需要注意的是,任何一种截词检索,都隐含着布尔逻辑中的 “或”运算(刘振西、李润松、叶茜,2006)。检索符:“?”代表零或 一个字符,代表无限截词符号。
后截词:输入“book?”检索结果为“book”或“books”; 输入“educat*” 检索结果为“education”、“educational”、 “educator”。
中截词:输入“s?w”,检索结果为“saw”、“sew”。
3.4宇段检索
字段检索是指根据标题、作者、摘要、关键词、作者单位、文献 来源、学位授予单位、学位级别、会议信息、会址、会期、书名、出版 地、出版年、专利号报告号、ISBN和ISSN等字段检索所需内容。
表2常见字段检索
常见字段English搜索结果呈现常见字段English搜索结果呈现
按作者呈现结 果
按作者单位呈 现结果 搜索某图书 搜索某期刊内 文献
3.5全文检索
全文检索是一种将文件中所有文本与检索匹配的文字资料 检索方法。全文检索系统是按照全文检索理论建立的用于提供 全文检索服务的软件系统,可将存储于数据库中整本书、整篇文 章中的任意内容信息查找出来,进行各种统计和分析。
3.6精确检索
精确检索是指尽可能限定检索范围,以最快速度找到自己所 需的检索方式。在计算机辅助翻译中采取精确检索能够提升检索 效率,避免大量冗余信息。需要注意的是,采取该种检索方法的 前提是译者对自己的检索内容非常确定。
例1
使用双引号“”。检索符含义:对引号中的内容不进行任何添 加删除处理进行检索。
在Google中检索短语knock down joint会发现,除了 包含完整关键词knock down joint的检索结果外,还显示了包 含knock down、joint等关键词和关键字的结果。将整个关键 词knock down joint加上双引号“”进行检索,结果则只剩下包 含完整关键词knock down joint的词条。
例 2
使用布尔逻辑检索符“-”。检索符意义:排除减号后面的 内容。“Bass”在中文中既指一种低音乐器(贝斯)同时也有“鲈 鱼”之意。如要在搜索引擎中仅查找有关“贝斯”的检索词条,需在 检索框中输入“bass[空格]-fish”就可以把有关鲈鱼的检索 词条全部屏蔽掉。
4.结语
除了电子词典与工具书,在进行翻译实践时,搜索引擎已经 成为翻译实践工作必不可少的工具。与此同时,在使用搜索引擎 辅助翻译时也要辨别检索结果的真伪,避免出现偏差、低质量或 违法的结果。