在日常的学习、工作、生活中,肯定对各类范文都很熟悉吧。那么我们该如何写一篇较为完美的范文呢?以下是我为大家搜集的优质范文,仅供参考,一起来看看吧
搜索引擎信息检索篇一
任课教师:刘存杰
学院学号姓名:土木工程学院
12014084329 王旭星
学生e-mail:316703042@
导师姓名及e-mail:刘存杰
lcjlib@
作业时间:2016年10月
一、检索课题确定(要求课题名称具体,宁可选择小题大做。如果在主题词查找后,决定修正课题名称,请说明,并写出课题名称。)
检索课题的名称确定为:大体积预应力混凝土的温控技术。subject for retrieval:temperature control technology of large volume prestressedconcrete.二、写出检索课题的研究背景和研究目的。
研究目的、必要性和重要性、意义:
桥梁施工建设中,为推动施工顺利进行,不仅要合理安排施工工序,促进工程建设质量提高。同时还要加强温度应力控制,尤其是大体积预应力混凝土温度应力的控制,在施工现场对出现的裂缝及时处理。从而保证桥梁工程结构的外形美观,减少养护维修的工作量,进 而实现对工程质量的有效控制,推动桥梁工程建设质量和效益提高。
桥梁施工建设中,往往需要进行大体积预应力混凝土施工。由于其体积较大,内外温差大,如果忽视采取有效的温度控制技术,容易导致裂缝出现,给整个桥梁施工建设带来不利影响。为有效弥补这种问题与缺陷,应该综合采取有效的温控技术措施,尽量缩小大体积混 凝土内部和外部的温差,确保工程质量。
三、选择检索主题词,请将选择的过程详细描述,并将最后选择的所有中文主题词写出来。(要求包括同行认可的同义词、近义词及可能的各种变化)我们一般定义文献主题为:“概括文献中关于某一事物的情报内容的概念。”即为文献的中心内容而文献主题词就是在标引和检索中用以表达文献主题的规范化的词或词组。根据选择主题词的三个原则:实用性原则;准确性原则;通用性原则;来选择本次检索主题词。首先我们选择“大体积预应力混凝土”为主题词进行检索,发现检索的结果符合我们的要求,然后添加“温控技术”主题词进行检索发现检索结果依然正确,进一步添加“裂缝处理、水化热、混凝土收缩”为主题词,通过不同的组合来进行检索,得到符合要求的检索结果。
检索的主题词的英文为:大体积预应力混凝土(large volume of prestressed concrete),温控技术(temperature control technology),裂缝处理(crack treatment),水化热(heat of hydration),混凝土收缩(concrete shrinkage)。
四、数据库选择,请写出你所选择的数据库名称(cnki)。(要求尽量全而准)
在检索的过程中选用的数据库有: 万方数据;
ei village 工程索引; elsevier 综合类学术期刊; ieee-wiley ebooks library; ieee/iet electronic library(iel); 中国学术期刊网(cnki); 维普中文科技期刊。
五、选择1个中文数据库检索平台(cnki)实际进行检索。并将检索策略写出来。(要求逻辑运算符、位置算符、截词算符使用正确)
利用中国学术期刊网(cnki)进行实际检索:
利用nuaa图书馆主页中文电子资源——中国学术期刊网(cnki)进行文献检索。首先,根据本次的检索课题《大体积预应力混凝土的温控技术》,在高级检索中输入主题词:“大体积预应力混凝土”,可以得到大体积预应力混凝土有关的文献,通过查阅这些文献了解预应力混凝土定义、研究现状、应用等相关的文献。
然后进一步选用“温控技术”(主题)、“裂缝处理”(主题)、“水化热”(主题)、“混凝土收缩”(主题)四者关系为“并含”(and),可以得到相的大体积预应力混凝土温控技术的文献,通过阅读,来了解大体积预应力混凝土裂缝产生的情况以及温控技术对裂缝的影响。其中具有代表性的文献:张锐敏.大体积预应力混凝土温控技术[j/ol].交通世界(建养,机械),2016(13).检索到得文献的摘要为:结合桥梁施工建设基本情况,就大体积预应力混凝土温控技术进行探讨分析,同时还提出了温度裂缝的处理技术措施,为日后相关工作提供借鉴。试验发现,摘要:结合桥梁施工建设基本情况,就大体积预应力混凝土温控技术进行探讨分析,同时还提出了温度裂缝的处理技术措施,为日后相关工作提供借鉴。
检索到的文献与本次检索主题相当吻合,可以通过对文献的阅读来掌握该项研究的大体思路。然后再通过添加主题词包括:“水化热”、“裂缝处理”等来对相关文献进行检索,找到与检索主题相关的文献进行阅读。
六、使用2个搜索引擎进行查找,写出查找所用的检索策略。(要求尽可能使用高级检索界面,查找结果准确)
在检索过程中使用了:百度学术搜索以及搜狗学术搜索服务来进行检索。
检索结果如图所示,可以看出检索出来的结果和检索主题很符合:
检索结果如图所示,可以看出检索出来的结果和检索主题很符合:
七、整理检索结果,找出相关文献,并列出相关文献的三个基本字段:title(篇名)、author(作者)、source(出处)。(要求著录正确)
文献中的引文的汇总:
[1]张锐敏.大体积预应力混凝土温控技术[j].交通世界(建养.机械),2016,13:88-89.[2]张锐敏.大体积预应力混凝土温控技术[j].交通世界,2016,13:88-89.[3]叶再军.大体积预应力混凝土温控技术研究[j].交通科技,2015,04:1-3.[4]刘家彬,郭正兴 ,韦世国 ,赵有明 ,刘加平.润扬长江大桥南锚碇超大体积混凝土温控技术[j].建筑技术,2003,01:41-43.[5]张连春.小云峰大坝大体积混凝土温控技术研究[d].哈尔滨工程大学,2010.[6]苏骏,田乐松.大体积混凝土温控技术及热工计算[j].安徽理工大学学报(自然科学版),2010,02:5-7.[7]周建林.苏通大桥北塔承台大体积混凝土温控技术[j].现代交通技术,2007,05:31-35.[8]伍波.厦漳跨海大桥大体积混凝土温控技术[j].施工技术,2015,18:1-4.[9]施召云,武晓杰.大体积混凝土温控技术研究[j].云南水力发电,2011,01:67-68+105.[10]陈卫国,屠柳青,刘可心,孙同兴,刘鸿.舟山西堠门大桥南锚碇大体积混凝土温控技术[j].公路,2006,06:112-116.[11]刘杰,赵超.缺水山区大体积混凝土温控技术[j].中外公路,2015,03:188-191.[12]沈卢明,王忠海.西藏通麦特大桥锚碇无降温管大体积混凝土温控技术应用[j].公路交通技术,2015,03:69-73.[13]袁建平.马新大桥主塔承台大体积高标号混凝土温控技术研究[j].城市道桥与防洪,2011,08:224-227+255+10.[14]文亚军,尹红星.矮寨大桥大体积混凝土温控技术[j].企业技术开发,2010,09:19-21.[15]于金琪.大体积混凝土温控技术在西固黄河大桥施工中的应用与分析[j].公路交通科技(应用技术版),2016,05:282-285.[16]邝青梅,刘朝军.承台高标号大体积混凝土温控技术[j].广东公路交通,2016,04:65-69.[17]阮有力.悬索桥锚碇大体积混凝土温控技术研究[j].低温建筑技术,2008,04:153-154.[18]罗志唐,丘必学.大体积混凝土温控技术在梅州市清凉山水库扩建工程中的应用[j].广东水利水电,2012,06:52-54.[19]刘大荣.大体积混凝土温控技术应用实例[j].广东建材,2008,09:76-78.[20]王立新,霍燚.青兰渡槽大体积混凝土温控技术研究[j].小水电,2015,01:58-63.八、对2篇中文相关文献的全文进行查找,写出这2篇全文查找的过程,并注明网络地址。(要求查找思路正确)
全文检索的基本原理
非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。对非结构化数据的搜索:全文检索。全文检索大体分两个过程,索引创建(indexing)和搜索索引(search)。1.索引创建:将现实世界中所有的结构化和非结构化数据提取信息,创建索引的过程。2.搜索索引:就是得到用户的查询,请求搜索创建的索引然后返回结果的过程。
实现全文检索功能
1、对数据库内容进行检索。通过程序读取数据库内容并生成检索对象,通过全文检索引擎处理检索对象。
2、针对xls格式数据,调用poi组件读取纯文本数据,调用全文检索引擎处理检索对象。
4、针对ppt格式数据,调用poi组件读取纯文本数据,调用全文检索引擎处理检索对象。
5、针对pdf格式数据,调用pdfbox组件读取纯文本数据,调用全文检索引擎处理检索对象。
organ-机构: 中建路桥集团有限公司,河北,石家庄050000 网址http:///?mod=home&id=256 主管单位:中华人民共和国交通运输 期刊信息:《交通世界》创刊于1994年,由中华人民共和国交通运输部主管,交通运输部科学研究院主办,《交通世界》杂志社出版,面向国内外公开发行的中央级科技期刊,其凭借丰富的内容、精致的印刷,成为中国交通系统影响力最大的主流媒体之一。《交通世界》应广大读者和客户的要求,从2007年第1期开始改为半月刊,以“建养·机械”和“运输·车辆”为主题,每月分上册和下册出版,有针对性地发行,使杂志受众对象更明确,既方便读者查询自己感兴趣的资讯,又利于广告客户准确传递企业及产品信息。邮发代号:82-943。
期刊栏目:
1)《交通世界(建养·机械)》栏目:
重大项目——国家重点交通建设项目采访报道
机械广场——工程机械市场分析、最新产品、施工技术、工艺推荐
现代公路——公路规划、设计、施工、管理
养护天地——公路、市政养护设备、施工工艺介绍
沥青技术——沥青混凝土的技术发展及应用
桥梁隧道——桥梁和隧道的设计、施工、养护、监管
2)《交通世界(运输·车辆)》栏目:
物流货运——最新的物流运营技术、方案分析、运输安全
城市交通——城市公共交通规划方案、交通工具、营运管理
绿色交通——世界商用汽车排放标准、法规介绍及应用解决方案
交通统计——我国客运、货运量和商用汽车销售数据统计、分析及预测
关注用户——运输企业及商用汽车的用户访谈
•读者对象:《交通世界(建养·机械)》受众为全国交通厅(局)、公路局、高管局、港口航道、工程机械、建设施工、市政养护等行业各级领导、企业经理人和专家学者以及各国驻华使馆商务处负责人。《交通世界(运输·车辆)》受众为交通局、公路局、高管局、城乡客运、物流运输、商用汽车、发动机及配套件等行业各级领导、企业经理人和专家学者。
no2 中国土木工程网
网址:http:/// 网站简介
土木工程网于2011年5月2日正式开通与大家见面,是一个纯学术类的技术交流网站,提供土木工程专业资料免费下载,包括了图集、施工资料、图纸、软件、规范、监理、设计、技术交流、论文等资源的下载。
网站文化
土木工程网自成立来本着“自由开放,资源共享”的原则为土木工程从业者提供一个良好的技术交流平台,土木工程网锁定的用户群体以20-50岁社会高知主流人群,这个群体的特征是中高消费、高学历、高感度(指信息的整合能力和对新事物的接受能力强)。共享资源丰富。
发展方向
土木工程网目前包含了将近30个频道:建筑工程暖通空调结构设计路桥工程水利工程园林绿化电气工程岩土工程给排水工程注册考试矿山工程环境工程工程造价工程监理工程施工新闻资讯工程图集工程图纸工程书籍工程论文标准规范工程软件土木人才招聘装饰装修毕业设计土木论坛工程图片等频道,120多个栏目,是每一个土木工程师的网上家园。
搜索引擎信息检索篇二
本学期,我们学习了一门很特别而且很有用的学科,名字叫文献检索,这门课程给我带来了不少收获。
文献检索,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索,这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。文献检索途径:著者途径、题名包括书名刊名等途径、分类途径、主题途径、引文途径、序号途径、代码途径、专门项目途径 。文献检索是科学研究的向导。要进行有价值的科学研究,必须依赖文献检索,全面获取相关文献信息,及时了解各学科领域出现的新问题、新观点、以确定自己的研究起点和研究目标。
文献检索课程是高校教学中不可缺少的一门课程,是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法学,是信息素养教育中重要的组成部分,是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我们来说,文献检索十分有必要。而且我们必须好好掌握这样一门课程。
通过此次实习我了解到,我校图书馆中藏有如此庞大的数据库资源,报刊、博硕士论文等等,信息量大,检索方法简捷,也认识到文献检索这门课程很有用,可是要学好也不是很容易,我们必须多练习、多搜索,经常去查询、去摸索,并且要仔细的静下心来学习,只有真正熟悉了各种数据库的检索方法,掌握正确的检索方法,才能够快速而准确的找到自己真正所需要的文献资料。
检索不像我们想象的那么简单,因为的要找到相关的东西的同时还要摒弃大量的无用信息。以前查资料时很少使用图书馆的数据库,可是经过这次课程的培训,我明白了专业数据库是我们获取资料最便捷的工具。检索有时不是在一开始就明白你所要找的东西,可能只有一个模糊的概念,通过逐步的顺藤摸瓜式的检索,其本身就是一个逐渐学习的过程。人类的学习活动必须有交流才能不断进步,在面对面的交流不是那么容易得到时,信息检索在很大程度上能弥补了这一不足。
检索是一个有功夫的细活儿,同样的条件,检索同样的.信息,不同的人所花的时间和所得到的结果会有很大差别。只有再不断的检索过程中善于总结,才能在花费最少的情况下获得最有价值的知识,这在当今世界是至关重要的,因为“学会学习”在信息发达的今天比以往任何时候都显得更加重要。
下面主要谈一下自己的一点体会。
首先,要正确看待文献检索,既不要把文献检索看的太难、太高深,也不能过分低估检索的重要性和难度,要用平常的心态去看待它。
最后,处理好检索过程中“全”与“准”的关系。合适的关键词及检索式对检索结果很重要,但关键词的提取及检索式的确定和检索方法没有关系,主要取决于本人对本领域内容的理解程度。
搜索引擎信息检索篇三
1、以下各项属亍二次信息的是(a)
a、索引
b、期刊
c、学位论文
d、百科全书 2、下列文献中属亍一次信息的是(a)
a、与利说明书
b、百科全书
c、目录
d、综述 3、年鉴属亍下列哪一类别(d)
a、零次信息
b、一次信息
c、二次信息
d、三次信息 4、(c)是出版周期最短的定期连续出版物。
a、图书
b、期刊
c、报纸
d、学位论文 5、为了有效地存储和传播知识,人类利用各种(c)来记录信息。
a、知识
b、文献
c、载体
d、视听资料 6、报道范围主要为能源方面的科技报告为(d)。
a、ad
b、pb
c、nasa
d、doe 7、了解各个国家政治、经济、科技发展政策的重要信息源是(b)
a、科技报告
b、政府出版物
c、标准文献
d、档案文献 8、利用截词技术检索“?英语考试”,以下检索结果正确的是(d)
a、英语四级考试
b、英语考试成绩
c、英语考试报名
d、六级英语考试 9、我国最早的分类法是(b)
a、《中经新簿》
b、《七略》
c、《四库全书总目》
d、《隋书经籍志》 10、《四级英语阅读不完型填空》这本图书的分类号是(d)。
a、g636.33
b、g216.2
c、i247.4
d、h319 11、按照《中国图书馆分类法》,《新编六级英语阅读解析》这本书应属亍哪个类目(a)。
a、h 大类
b、i 大类
c、t 大类
d、o 大类 12、《信息检索》这本书的分类号为 g252.7,这是按照(b)分类。
a、科图法
b、中图法
c、杜威分类法
d、刘国钧分类法 13、布尔逻辑表达式:在职人员 not(中年 and 教师)的检索结果是(a)
a、检索出除了中年教师以外的在职人员的数据
b、中年教师的数据
c、中年和教师的数据
d、在职人员的数据 14、布尔逻辑检索中检索符号“or”的主要作用在亍()。
a、提高查准率
b、提高查全率
c、排除丌必要信息
b、-
c、|
d、*
b、-
c、or
d、“
” 17、根据国家相关标准,文献的定义是指“记录有(c)的一切载体”。
a、情报
b、信息
c、知识
d、数据 18、将存储亍数据库中的整本书、整篇文章中的仸意内容查找出来的检索是(a)
a、全文检索
d、超媒体检索 19、以已知文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法被称为(d)。
a、常规法
b、循环法
c、浏览法
d、追溯法 20、明确用经、史、子、集作为四部名称的分类法是(b)。
a、《中经新簿》
b、《隋书经籍志》
c、《四库全书总目》
d、《七略》 21、《中图法》中基本大类由 22 个字母表示,e 表示的是(c)。
a、政治类
b、生物类
c、军事类
d、航空航天类 22、汇集人类一切知识门类戒所有知识的概述性的检索工具,被成为“工具书之王”。下列属亍这种工具书的是(c)。
a、年鉴
b、手册
c、百科全书
d、类书 23、国内使用的《中国图书馆分类法》是采用的下列(b)方法进行编排的。
a、字顺
b、分类
c、主题
按照一定的方法编排,幵指明出处,为用户提供文献线索的一种检索根据是(c)。
a、目录
b、题录
c、索引
d、文摘 25、利用 cnki 的全文数据库,检索著名作家巴金的作品,应选择的检索途径是(b)。
a、题名
b、作者
c、关键词
d、单位 26、布尔逻辑运算符号”and”可用(b)进行替换使用。
a、空格
b、*
c、()
d、? 27、布尔逻辑运算符号”or”可用(a)进行替换使用。
a、+
b、()
c、*
d、? 28、布尔逻辑运算符号”not”可用(c)进行替换使用。
a、+
b、|
c、-
d、()29、截词检索主要应用亍下列哪种检索系统(b)。
a、中文检索系统
b、外文检索系统|
c、英文检索系统
d、金盘图书馆书目检索系统 30、截词检索中,哪一个检索符号代表的是有限检索(a)。
a、?
b、|
c、*
d、-31、截词检索中,哪一个检索符号代表的是无限检索(c)。
a、+
b、|
c、*
d、? 32、截词检索中,“?”和“*”的主要区别在亍(a)。
a、字符数量的丌同
b、字符位置的丌同|
c、字符大小写的丌同
d、字符缩写的丌同 33、位置检索主要是通过限定相关主题词的(d)来提高检索的效率。
a、语法
b、|含义
c、数量
d、位置 34、(d)表示此算符两侧的检索词之间允许间隔最多 n 个词,丏顺序可以颠倒。
a、(w)
b、(nw)
c、(n)
d、(nn)35、位置运算符号(w)和(n)的主要区别在亍(c)。
a、检索词之间间隔的字符数量的差异
b、检索词是否出现在同一字段中
c、检索词出现的位置是否可以颠倒
d、检索词是否出现在同一文献中 36、(d)是指未检出的相关信息量不检索系统中实际不课题相关的信息总量的比率。
a、查全率
b、查准率
c、误检率
d、漏检率 37、最早出现的主题检索语言是(b)。
a、关键词语言
b、标题词语言
c、单元词语言
d、叙词语言 38、信息的四个属性中,其最高价值所在是(d)。
a、客观性
b、时效性
c、传递性
d、共享性 39、(a)是高校戒科研机构的毕业生为获取学位而撰写的。
a、学位论文
b、科技报告
c、会议文献
d、档案文献 40、sci 是(b)的简称。
a、社会科学引文索引
b、科学引文索引
c、全国报刊索引
d、科学文摘 41、布尔逻辑检索技术属亍(a)。
a、文本检索技术
b、图像检索技术
d、视频检索技术 多项选择题:
1、信息素质的内涵主要包括(abc)。
a、信息意识素质
b、信息能力素质
c、信息道德素质
d、信息职业素质 2、现代经济发展的三大支柱是(bcd)。
a、知识
b、信息
c、材料
d、能源 3、存在的基本形式有(ac)几种。
a、主观知识
b、个人知识
c、客观知识
d、共享知识 4、信息的属性包括(abcd)
a、客观性
b、时效性
c、传递性 d、共享性 5、按检索内容分,信息检索可分为(abcd)。
b、数据信息检索
c、事实信息检索
d、数值信息检索 6、常用的信息检索方法有以下几种(abcd)
a、常规法
b、追溯法
c、循环法
d、浏览法 7、影响检索效果的因素主要来自两个方面(cd)。
a、查全率
b、查准率
c、检索系统本身
d、检索人员的检索水平8、如果检索结果太多,查准率很低,需要调整检索范围,此时调整检索策略的方法有(ad)等。
a、用逻辑“不”戒者逻辑“非”增加限制概念
b、用逻辑“戒”戒截词增加同族概念 c、使用截词检索
d、用二次检索增加限制条件 9、按照《中国图书馆分类法》,下列属亍 o 类的图书是(bc)。
a、《c 语言》
b、《高等数学》
c、《物理》
d、《法语写作》 10、下列属亍文献信息检索的工具的有(acd):
a、目录
b、字典
c、索引
d、文摘 11、下列概念属亍上下位关系的有(abd):
a、电脑不手提电脑
b、家用电器不电视机
c、color 不 colour
d、材料不无机材料 12、在下面的分类号中,(bcd)是中国图书馆图书分类号。
a、22.27
b、tb324
c、g252.7
d、r329.2 13、网络检索系统的特点是(abcd)。
a、资料丰富
b、检索方便
c、费用低廉
d、资源共享 14、文献信息检索工具主要有以下几种类型()。
a、目录
b、题录
c、索引
d、文摘
15、二次文献主要包括(abcd)等。
a、手册
b、年鉴
c、目录
d、题录 16、在计算机信息检索系统中,常用的检索技术由(abc)。
a、布尔检索
b、截词检索 c、位置检索
d、逻辑检索 17、下列(bc)特点属亍图书的基本特征。
a、issn
b、作者单位
c、索书号
d、isbn 18、使用逻辑“戒”是为了(acd)。
a、提高查全率
b、提高查准率
c、扩大检索范围
d、提高利用率 19、检索工具的排检法包括以下几种(abcd)。
a、字顺排检法
b、分类排检法
c、主题排检法
d、时序排检法和地序排检法 20、文摘的特征包括以下几项()
a、语言精练
b、以单篇文献为报道单元
c、二次信息的核心
d、索引的延伸 21、超星数字图书馆提供以下哪些检索字段(abc)。
a、书名
b、作者
c、主题词
d、关键词 22、布尔逻辑检索的运算符号有(abcd)。
a、and
b、or
c、not
d、()
23、布尔逻辑运算符号“不”的作用在亍(abcd)。
a、增加限制条件
b、缩小检索范围
c、提高检索的与指性
d、提高查准率 24、布尔逻辑运算符号“戒”的作用在亍(abd)。
b、扩大检索范围
c、提高检索的与指性
d、提高查全率 25、布尔逻辑运算符号“非”的作用在亍(abcd)。
a、增加限制条件
c、缩小文献范围
d、提高查准率 26、使用截词检索的作用在亍(acd)。
a、扩大检索范围
c、防止漏检
d、提高查全率 27、截词检索中,常用的截词符号有(cd)。
a、+
b、-
c、*
d、? 28、常用的位置检索符号包括(abcd)。
a、(w)
b、(nw)
c、(n)
d、(nn)29、检索式 computer(w)information 检索出来的结果是(ac)。
a、computer information
b、computer
color information
c、computer-information
d、color computer information30、检索式 laser(1w)printer 检索出来的结果是(ab)。
a、laser printer
b、laser color printer c、printer
d、the laser printer 31、检索式 econom??(2n)recovery 检索出来的结果是(abc)。
a、economic recovery
d、t recovery of the chinese economy 32、检索式 money(n)supply 检索出来的结果是(ab)。
a、money supply
b、supply money
c、supply of money
d、rich money supply 33、下列哪种情况下检索人员需要修改检索策略(ab)。
b、检索结果中输出的信息量太少
c、检索过程中需要的时间过长
d、检索人员主观调整 34、下列哪种方法可以提高检索的查准率(abcd)。
a、加强检索词的与指度
b、用“and”/“not”等限制戒排除某些概念
c、从年代、语种和文献类型上进行限制
d、将检索词限定在一定的字段中 35、下列哪种方法可以提高检索的查全率(abcd)。
a、降低检索词的与指度
b、取消“and”/“not”等过严的限制符
c、增加检索年限,减少语种、文献类型的限制,扩大检索词出现的可检字段范围 d、改精确检索为模糊检索 36、信息检索效果评价的指标有(abcd)。
a、查全率
b、漏检率
c、查准率
d、误检率 37、关键词检索语言的特点主要包括(abcd)。
a、非规范化
b、与指性强
c、查准率高
d、查全率低 38、主题检索语言和分类检索语言的丌同之处在亍(abc)。
a、前者侧重特性检索,后者侧重族性检索
b、前者使用文字符号,后者使用数码符号 c、前者采用字顺排列,后者采用等级排列 d、前者书面化,后者通俗化 39、信息检索系统的类型包括(ab)。
a、手工检索系统
b、计算机检索系统
c、文字检索系统
d、符号检索系统 40、描述信息外表特征的信息检索语言包括(abcd)。
a、题名
b、著者
c、出版者
d、号码 41、描述信息内容特征的信息检索语言包括()。
a、分类检索语言
b、关键词语言
c、叙词语言
d、标题词语言 42、下列属亍信息源范畴的是(abcd)。
a、语言交流
b、图书
c、具体实物
d、搜索引擎 43、从内容上来看,图书和期刊的区别主要表现在(abc)。
a、主题的集中度
b、内容的与深度
c、出版的速度
d、检索的方便度 44、下列哪些论述不事实信息检索相关(abd)。
a、又称事项检索
b、是一种确定性检索
c、是一种非确定性检索
d、以文献中抽取的事项为检索内容 45 信息检索系统由哪几部分构成()。
a、检索文档
b、信息存储不检索设备
c、检索规则
d、人员 46、以下属亍综合性检索工具的是(ab)。
a、科学文摘
b、工程索引
c、生物文摘
d、中国与利年度索引 47、根据信息的内容丌同,信息检索技术可分为(abcd)。
a、文本检索技术
b、图像检索技术
d、视频检索技术 判断题 1、文献是记录信息的一切载体。(〤)
2、知识被包含亍信息,是信息的组成部分。(√)
3、文献信息源是各种信息源中检索不利用的主体。(√)
4、语言信息源,即零次信息,也就是指非正式的、口头交换的信息。
(√)
5、与利说明书属亍二次信息的范畴。(〤)
6、一次信息也称为第一手资料,如书目和索引。(〤)
7、把一种期刊和另一种期刊区别开来的唯一标识是 isbn 号。(〤)
8、把一种图书和另一种图书区别开来的唯一标识是 issn 号。(〤)
9、图书一般丌能反映最新的信息,时效性差,相比之下,期刊出版发行速度快,内容新颖。(√)
10、学位论文一般丌对外发行,但可以通过商业手段进行买卖。(〤)
11、档案文献具有原始性特点,客观真实地反映了历史。(√)
12、丌论信息检索的方法是否相同,信息检索的原理都是一样的。(√)
13、文献信息检索是一种相关性检索而非确定性检索。(√)
14、数据信息检索是一种非确定性检索,丌能直接提供用户所需要的确切的数据。(〤)
15、超媒体检索是对超文本检索的补充。(√)
16、使用循环法检索能获得较高的查全率和查准率。(√)
17、利用 cnki 的中国期刊全文数据库检索,有主题法和分类法两种途径。
(√)
18、信息检索语言是一种人工语言。(√)
19、分类检索语言是按信息内容的学科知识属性分门别类来系统标识和组织信息的方法。(√)
20、西晋荀勖的《中经新簿》是我国第一部分类法。(〤)
21、《中图法》的标识符号是汉语拼音字母不阿拉伯数字相结合的混合制号码。(√)
22、《中图法》中,英语类的书籍用 f 来表示。(〤)
23、分类主题一体化语言是分类检索语言和主题检索语言在内容上的结合。(〤)
24、信息检索系统是一种有序化的信息资源结合体。(√)
25、《七略》是我国第一部目录。(√)
25、数据事实检索工具属亍二次信息的范畴。(〤)
26、丌同的检索系统、丌同的文献类型提供的检索字段有可能是相同的。(√)
27、在一个复合逻辑检索式中,运算优先级别是丌可以改变的。(〤)
28、截词检索技术可以有效防止漏检。(√)
29、位置检索符号(nn)表示此算符两侧的检索词之间允许揑入多个词,丏顺序可以颠倒。(〤)
30、查全率和漏检率是一对互逆的检索指标。(√)
很贴近我的真实想法。
信息检索课教案模板
信息检索实习报告
信息检索实践报告
医学信息检索实习报告
《信息检索与知识产权》考试试卷
搜索引擎信息检索篇四
近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展。今天小编要给大家介绍的便是信息检索技术论文,欢迎阅读!
[摘要]通过对近年来计算机科学、人工智能、专利文献加工等领域的发展进行总结,从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。机器翻译技术和多边共同分类体系的完善有助于提高计算机检索效率、消除语言障碍,而语义检索、图像检索和文献自动处理技术的发展有望使面向不同层次用户的计算机智能化检索系统得以实现。
近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展,专利文献的计算机检索技术正成为情报检索领域研究的热点。下文拟从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。
专利文献是由各国、各地区专利局或世界知识产权局出版的官方文献,因此一般以各局官方语言出版。虽然大部分专利文献是英语文献,但是仍然存在大量日文、中文、德文、法文及其他语种的文献。出版语言的多样性给专利文献的检索和利用带来了极大的障碍,要实现多语言混合检索,机器翻译是必不可少的技术。目前一些专利局在其上推出了机器翻译系统,例如我国国家知识产权局提供有汉英机器翻译,日本特许厅提供有日英机器翻译,韩国知识产权局提供有韩英机器翻译等,上述网络机器翻译系统对其他国家的用户阅读方便和使用本国专利文献起到了帮助作用。
随着计算机技术的发展,机器翻译的技术也迅速发展,从传统的基于规则的机器翻译扩展到了基于实例或模版的机器翻译、统计机器翻译等。尤其是近年来语言学和人工智能技术的发展,以语义描述或以知识描述为特征的智能机器翻译系统正逐步成为研究的热点。专利文献作为一种特殊的科技文献,由于其具有特定的句法和语言结构,同时例如权利要求书等具有法律公示性文件的作用,这对翻译的准确性提出了更高的要求,已有研究者通过在机器翻译系统内集成多个翻译引擎、对不同特点的内容使用不同引擎翻译的方式来提高翻译质量。
已有的机器翻译系统基本局限于单篇文献的机器翻译,无法实现真正的多语言混合检索。多语言混合检索系统不仅可以允许混合语言的检索式,而且同一个检索式还可以对不同语言的专利文献进行检索,其实现方式主要有如下三种:翻译检索式、翻译文献或者两者相结合的'混合式。翻译检索式的工作量小,比较适合于因特网检索,但由于检索式通常缺乏语境,翻译难度较大;翻译文献的方式虽然有利于提高翻译质量,进而有利于文献检索,但存在的主要问题是翻译量太大、翻译时间长。
分类号一直是专利文献检索的重要手段。目前除了基本涵盖各国专利文献的国际专利分类(ipc)之外,美国专利商标局、日本特许厅和欧洲专利局各自都有自己的分类体系,分别是uc、fi/ft和ecla。ipc虽然通用,但存在分类标准不统一、分类条目不够完备、文献分类更新不及时等缺陷,导致使用ipc检索的效果欠佳。uc和fi/ft分别只能检索美国和日本的专利文献,ecla虽然能够检索到多国的文献,但仍然不能有效地检索日本、韩国、中国等国的专利文献。
为改善这种局面,美国、日本和欧洲自2000年即开始了“三边分类和谐计划”,该计划旨在推进ecla、uc和fi三个分类体系的融合以增强分类号检索的功能,同时对现有ipc分类体系提出改进建议。依据2009年召开的第27次三边会议,韩国知识产权局已经加入上述计划,而中国国家知识产权局也以观察国的身份参与这项工作。此外,近年来美国专利商标局、日本特许厅、欧洲专利局、韩国知识产权局和中国国家知识产权局五局积极开展合作,其中一个重要的合作项目是“共同的分类”。该项目的实施将有利于提高分类的一致性,扩展或细化部分技术领域的分类,进而提高检索的效率和质量。
不管是美日欧三方开展的“三边分类和谐计划”,还是五局共同开展的“共同的分类”项目,都必将推进专利文献分类体系的进一步发展,实现真正意义上的“基于检索的分类”,进一步增强分类号在专利文献计算机检索中的作用。
当前专利文献检索的主要手段为关键词和分类号检索,而由于一词多义、一义多词,专利文献撰写、加工和翻译质量不一以及关键词的机械匹配等问题,本质上决定了其查全率和查准率受限制。随着计算技术、人工智能、自然语言处理等技术的发展,搜索引擎的智能化有望从根本上提高现有检索系统的检索质量。
搜索引擎的智能化具体表现为语义检索,也称为知识检索或概念检索。语义检索是对检索条件、信息组织及检索结果显示赋予一定语义成分的一种新的检索方式。语义检索的本质在于以语义为对象进行搜索,而不是对字符串进行简单的机械匹配,因此可避免关键词匹配检索中由于词和义不对应所导致的问题。
语义检索过程一般包括对被检索的文档以及输入的检索式进行语义分析和匹配处理。这种语义分析处理依赖于词汇的语义描述技术以及分别用于词义鉴别和词汇过滤的语义识别技术和词汇链算法。可以通过诸如wordnet等语义词典对词汇实现较完备的语义描述,保证人和机器对词汇的理解一致。
最新发展的潜在语义索引通过将文献搜索过程中的向量空间模型和奇异值分解相结合,可以揭示文档中的词间关系,因而适于构建专利文献搜索引擎”…。利用语义进行检索还可以将专利文献中的非技术性信息考虑在内,例如将特定的技术概念和申请人、发明人等信息进行语义联系。此外,语义检索还可以从用户角度出发,考虑用户的检索需求,从而为诸如查新、侵权等不同目的的检索提供相应的结果。
近年来国内一些开发商也纷纷提供具有语义检索功能的专利文献检索系统,例如东方灵盾开发的专利检索系统和patenticst网站。patentics网站除了可以实现传统的关键词检索功能,还支持语义检索,仅通过输入检索所针对的专利文献号,即可自动对其进行语义分析、文献检索,并对结果进行相关度排序。当前专利文献检索领域还未广泛应用语义检索,但随着研究的深入,相信未来的搜索引擎不仅能利用语义技术提高检索的效率,还有望能对检索结果进行分析、评价,甚至自动生成检索报告。
所称专利是指发明和实用新型专利,不包括外观设计专利),不存在颜色和纹理等特征,因此专利文献的图像检索主要是基于形状和区域的图像特征。
虽然目前还没有成熟的专利文献图像检索系统,但一些研究机构已经开发出若干可专门用于专利文献的图像检索原型系统,例如iit kanpur的patseek、informatics and telematics institute的patmediat以及ltutechnologies公司的imageseeker等。patseek专门针对美国专利文献进行图像检索,而patmedia网站上的试验系统仅针对欧洲专利局的专利文献,这两个图像检索系统都可实现直接输入待检索的图像,系统自动进行相似度匹配,直接提供专利附图,同时还可以进行基于文本的图像检索。
文献处理部分又进一步包括文献预处理和视觉、文本元数据提取和索引两部分。前者是找出文献中的图形和对应的文字描述;后者则是进一步进行图像特征分析和文本分析,分别提取基本的图像特征以及能够表示图形含义的高层语义特征的关键词,由此分别形成索引后的图形特征矢量库、图像库、文本描述关键词库和知识库。在图像检索部分,基于上述提取的元数据,进行图像相似度匹配,同时还可以基于文本进行图像检索。与一般领域的图形检索相比,由于专利文献中每幅图形一般都对应有文字描述,即使不再进行人工标注或自动标注,都能提取到较好的高层语义特征,这对提高专利文献图形检索的准确性非常有帮助。
目前,专利文献图像检索系统仅处于试验阶段,只能对数量非常少的特定专利文献进行检索,且检索结果相关度还不是很高,但由于图像检索具有其他任何检索方式都不具备的优点,相信随着人们对专利文献图像检索技术的进一步研究以及语义检索技术的进一步发展,实现高精度的图像检索必将成为现实。
高质量的专利文献是提高检索质量的基础。专利文献分类、标引和摘要改写是专利文献加工的主要内容。传统的专利文献加工方法主要依赖于人工,其成本高且速度受限制,质量不统一。随着人工智能和计算机技术的发展,开始出现对专利文献进行自动分类、自动标引、自动摘要和自动聚类。
专利文献自动分类已经在欧洲、美国、日本得到了广泛的研究和尝试。例如欧洲专利局已经利用自然语言处理的相关技术实现了专利文献的自动初分类;对日本专利文献自动分类研究表明,对于使用k临近算法进行自动分类的情况下,先将专利文献按部分结构化为语义单元可以提高74%的效率。
patexpert代表了目前较先进的专利文献自动处理技术的发展,通过基于语义网的语义处理技术实现了面向内容的专利文献自动处理,其中的一个主要技术是利用一定的语义表示结构实现专利文献知识层面的表达。该系统可以执行的处理任务包括:专利文献内容和元数据的自动抽取;全文、图像、相关性搜索引擎;专利文献的自动分类和聚类;面向多语言的辅助理解工具;专利价值自动评估等。
国内有一些研究机构开展了大量的基于ipc体系的专利文献自动分类的研究,这些研究大部分集中在统计分类技术。近年来随着人工智能技术的兴起,基于人工智能或语义的专利文献自动分类发展迅速,例如上文提到的patentics试验系统也开始尝试对专利文献进行自动分类。
中文专利文献的自动处理仍处于研究阶段,虽然国外专利文献自动处理已经积累了许多宝贵经验,但由于中文表述的特殊性,许多技术还待消化和开发,例如汉语词汇之间的分词技术是制约自动标引质量的一个障碍。随着信息处理自动化相关技术的发展,专利文献的自动分类、自动标引、自动聚类和自动摘要正在逐步由半自动走向全自动化,这给搜索引擎的发展带来了极大的便利。同时,利用语义技术实现基于内容的自动处理将是未来的发展主流,也是提高专利文献自动处理质量的主要手段。
专利文献计算机检索是一个涉及了多学科的研究领域,其中以语义检索为核心的技术推动了搜索引擎、机器翻译、图像检索等相关技术的发展,而由于专利文献的特殊性,分类体系和文献自动处理技术也在其中占据了重要地位。随着研究的进一步深入,现存的语言障碍和检索效率低下等缺陷在不久的将来必将逐渐被克服,不同层次的用户有望借助于智能化的自动检索系统便利地实现专业化检索。