1.了解网络信息检索的的发展进程。
2.初步了解网络信息检索的工作原理和系统架构。
3.掌握通用搜索引擎和垂直搜索引擎的使用方法。
4.了解多媒体信息检索的使用。
2.1信息与信息素养在现代网络环境与经济全球化背景下,是否具有良好的信息素养,能否有效地获取、利用所需信息,正逐步成为衡量高素质人才自主学习能力、创新能力、创业能力的重要标准。
2.1.1信息与信息源一、信息信息,指音讯、消息等,泛指人类社会传播的一切内容。在一切通信系统中,信息是一种普遍联系的形式。创建一切宇宙万物的最基本万能单位是信息。
“信息”在英文、法文、德文、西班牙文中均是“information”,日文中为”情报”,我国台湾称之为“资讯”,我国古代用的是“消息”。“信息”一词作为科学术语最早出现在哈特莱(R.V.Hartley)于年撰写的《信息传输》一文中。20世纪40年代,信息科学的奠基人香农(C.E.Shannon)给出了信息的明确定义,此后许多研究者从各自的研究领域出发,给出了不同的定义。
香农在论文《通讯的数学理论》中指出:“信息是用来消除随机不定性的东西”。这一定义被人们看作是经典性定义并加以引用。控制论创始人维纳(NorbertWiener)认为”信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的名称”,它也被作为经典性定义加以引用。经济管理学家认为“信息是提供决策的有效数据”。
“信息”一词的定义之所以如此多样化,除了定义信息的角度不同之外,主要原因在于两个方面:一是信息本身的复杂性;二是信息科学的新兴性与融合性。
总的来说,信息是对客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征,表现的是客观事物运动状态和变化的实质内容。信息的功能是反应事物内部属性、状态、结构、相互联系以及与外部环境的互动关系,减少事物的不确定性。在不同的时期信息的传递方式也在不断发展变化。从古代的口耳相传、到近代的书信,再到现代社会的电报、电话等,信息的传递速度越来越快,距离越来越远。而计算机网络的出现,使得通信过程中的信息量爆发,呈现信息多样化、传递速度极快、不受地域阻碍等特点。
人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。但在网络世界中,信息的发布具有很大的自由度和随意性,从而导致信息的质量参差不齐。面对海量信息,若不能掌握信息检索与利用的技能,就会浪费时间、甄别不明,对生活和学习造成不良影响。因此,如何合理有效地利用信息就变成一门学问。
二、信息源要想获得有用的信息,必须有可靠的信息源,可以说,信息源是信息检索的基础。从字面意思来看,信息源应该是指信息的来源。联合国教科文组织出版的《文献术语》将其定义为:个人为满足其信息需要而获得信息的来源。不断搜寻、发现和利用对自己工作、生活、学习有用的信息资源,对每个人来说都十分重要。
广义的信息源是指人们获取信息的一切来源,包括人际交流、实物、文献记录等,按照表现方式可将信息源划分为口语信息源、体语信息源、实物信息源和文献信息源。其各自特点如表2-1所示。
表2-1广义信息源类型及其特点
类型
存在形式
特点
口语信息源
授课、演讲、讨论、聊天等
传递快、互动性强、但不易保存,传播的过程中易出现失真
体语信息源
表情、手势、姿势、动作等
直观性强、生动丰富、富有感染力,但不易保存和传播
实物信息源
文物、产品样本、模型、工艺品、雕塑等
直观性强、信息量大,但需要通过知识、智慧、经验和工具挖掘大量隐含的信息。
文献信息源
以文字、图形、符号、音视频等方式记录在各种载体上
经过加工、整理、较为系统、准确、客套,便于保存与利用,但信息的时效性可能相对滞后。
狭义的信息源仅指被记录下来的信息。狭义信息源按载体形式可以分为印刷型信息源、缩微型信息源、声像型信息源、电子型信息源;按照生产加工层次可以分为一次信息、二次信息、三次信息;按编辑出版形式可划分为图书、报刊、研究报告、会议文献、专利文献、统计数据、政府出版物、档案、学位论文、标准文献,它们被认为是十大信息源,其中后8种被称为特种文献。信息源的分类如图2-1所示。
文献信息源,不仅包括各种信息载体,也包括各种信息机构;不仅包括传统印刷型文献资料,也包括现代电子型资源。熟悉信息源分布情况,对于提高获取信息的效率也十分重要。
当前使用最广泛、利用率最高的应当是网络信息源,包括电子图书、商业信息、新闻、软件、数据库以及BBS、博客、微博等一切通过通信设备传播和网络软件管理的信息资源。网络信息源已经成为全球范围内传播科研、教育、商业和社会信息的主要渠道。熟悉网络信息源的基本知识可以更好地利用网络资源为我们的生活和学习服务。
在检索信息时选择信息源,应该考虑以下三个问题,这种资源应该在哪里?哪种资源会跟自己的研究主题相关?面对的问题可以使用哪种资源解决?要把信息源与实际需求结合起来,即不同的信息源基于不同的需求,一个问题可能需查询多种不同的信息源。
2.1.2信息需求与信息素养一、信息需求信息需求是人的基本需求,是引发信息消费的原动力,是信息消费者必备要素。信息需求是有层次的,科亨(Koxhen)曾将消费者的信息需求状态划分为客观状态、认识状态和表达状态三个层次。韦尔效仿马斯洛(AbrahamMaslow)用需求等级结构来分析人们的信息需求。韦尔认为,只有在一定层次的信息需求得到满足之后,人们才会致力于获取更高层次的信息。
对信息的需求,包括:(1)对信息的内容和形式的要求。信息的内容反映信息所属的学科,如“生物信息”、“经济信息”、“环保信息”等,信息的形式是多方面的,比如,是“知识型信息”还是“消息型信息”,是“政策信息”、“市场信息”还是“产品信息”等;(2)对信息源的要求。包括信息来源范围和载体形式等。对获取信息方式的要求,主要有正式途径与非正式途径,或称”直接交流与间接交流”、”组织化的有序交流与非组织化的无序交流”之别。用户会因所需信息类型的不同而选择不同的途径;(3)对获取信息的方法的要求。用户对“要什么”(信息)、“从哪里要”(信息源和行为途径)有了明确要求后,还会对“怎么要”(检索方法)提出具体要求。对获取信息方法的要求主要是对信息检索工具和检索方法的要求等。
在网络环境下,信息需求的新特征体现为:(1)信息用户趋向多元化,在没有网络的年代,文献信息检索是少数人的活动,一般人仅仅通过口耳相传进行信息的传播,而在互联网平台上,人与人之间的认知差距大大减小;(2)信息类型趋向全方位和多层次,所需知识信息不再是一书一刊,而是关于某一问题的全部有关的书刊和声像资料;(3)信息需求求新求快,人们对于信息获取的时效性要求进一步提高,获取信息的等待时间以秒计;(4)信息获取手段自助化,与传统信息获取方式不同,依托互联网的技术特性,人们在权限范围内可以自行登录各类信息资源平台,利用规定的检索式自助搜寻所需信息。
信息需求源于信息需要,其自身有的被表达出来,有的没有被表达出来。它实际上表明了信息需求有现实需求和潜在需求两个层次。有学者提出潜在信息需求的概念。潜在信息需求是指用户目前没有被满足、或未能表达的属于潜意识下的一种需求,是与显性需求相对应而存在的。它的特性有:隐蔽性、随机性、模糊性、短暂性、冗余性、创造性、可转化性。现实需求能以提问的形式表现出来,容易被用户自己和别人识别;潜在需求虽被意识到了但还没有或无法用语言表述出来,在别人或别的客观条件的提醒和刺激下则可能会被表达出来,成为现实需求。另外,由于用户既可能是个人,也可能是群体,因而信息需求也可划分出个别需求和群体需求两个层次。
二、信息素养信息素养又称信息素质。信息素养(素质)(InformationLiteracy)一词最早是由美国信息产业协会主席PaulZurkowski在年给美国政府的报告中提出来的。他认为:信息素质是人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。年,美国图书馆协会用一段话对信息素养进行了定义。“具备较高信息素养的人,是一个有能力觉察信息需求的时机并且能够检索、评价以及高效第利用所需信息的人,是一个知道如何学习的人。他们知道了如何学习的原因在于,他们掌握了知识的组织机理,知晓如何发现信息以及利用信息。他们是由能力终身学习的人,是由能力为所有的任务与决策提供信息支持的人。”目前,该定义已经得到世界范围内的广泛认同。
具备良好信息素养的学习者有能力高效运用各种信息工具,并通过“资源型”学习方式获取知识、锻炼技能、提升能力。美国高校和研究图书馆协会(ACRL)工作组认为,高校学生应当具备的信息素养能力包括:(1)确定所需信息的范围;(2)有效地获取所需的信息;(3)鉴别信息及其来源;(4)将检出的信息融入自己的知识网络;(5)有效地利用信息去完成一个具体的任务;(6)了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息。
年2月5日,美国ACRL理事会正式批准通过了《高等教育信息素养框架》(以下简称《框架》)作为其年制定的《高等教育信息素养能力标准》的更新文件。《框架》的制定出于这样一个信念,即只有通过一套更丰富、更复杂的核心理念,信息素养作为一项教育改革运动的潜力才能得以充分实现。《框架》特意使用了“框架”(Framework)一词,主要因为它是基于一个互相关联的核心概念的集合,可以根据具体需要灵活选择实施,而非一套强制标准,或是一些学习成果或既定技能的列举。本框架按六个框架要素编排,每个要素都包括一个信息素养的核心概念、一组知识技能,以及一组行为方式。代表这些要素的六个概念按其英文字母顺序排列如下:
(1)权威的构建性与情境性(AuthorityIsConstructedandContextual)
(2)信息的价值属性(InformationHasValue)
(3)探究式研究(ResearchasInquiry)
(4)信息创建的过程性(InformationCreationasaProcess)
(5)对话式学术研究(ScholarshipasConversation)
(6)策略探索式检索(SearchingasStrategicExploration)
《高等教育信息素养框架》的中文版由ACRL授权清华大学图书馆翻译并发布。
三、培养信息素养的三个层次1、培养信息意识
信息意识是指人的信息敏感程度,即感受、理解和评价自然界以及社会中的各种现象、行为,理论观点,并从中捕捉、判断有用信息的一种意识。信息意识是人们产生信息需求,形成信息动机,进而自觉寻求信息、利用信息、形成信息兴趣的动力和源泉。信息意识具体表现为对信息的敏感度、观察力、选择能力和吸收能力。通俗地讲,就是面对当下不了解的东西,能积极主动地去寻找答案,并知道到哪里,用什么方法去寻求答案,这就是信息意识。
2、培养信息能力
信息能力是指理解、获取、利用信息以及使用相应技术手段提高这一过程的效率的能力。年美国信息上会协会主席PaulZurkowski首次使用信息能力这个概念。他认为:一个人通过培训能把信息资源应用到其工作中,便可被认为具备了信息能力。信息能力具体包括收集信息、判断信息、表现信息、处理信息、创造信息、发布和传递信息等几个构成因子。信息能力是信息素养诸要素中的核心。大学生只有具备相当的信息能力,才可以在信息社会中生存和发展。为增强训练的可操作性,有学者将信息能力划分为三个层次。
第一层次:知道什么信息在什么地方(熟悉信息源)
第二层次:可以从检索系统中检索出信息(掌握检索技术)
第三层次:信息选取与综合利用(实现信息增值)
3、培养信息道德
信息道德是指在信息的采集、加工、存贮、传播和利用等信息活动各个环节中,用来规范其间产生的各种社会关系的思想观念与行为准则的总和。培养信息道德,应当学会对媒体信息进行甄别判断,自觉选择有益信息;不利用计算机网络从事危害他人信息系统和网络安全的活动;自觉保护他人的知识产权等合法权益,不传播不良信息等。信息道德作为信息管理的一种手段,与信息政策、信息法律有密切的关系,它们各自从不同的角度实现对信息和信息行为的规范和管理。信息道德是信息政策和信息法律建立和发挥作用的基础,在潜移默化中对人们的信息行为予以规范。信息道德、信息政策和信息法律三者相互补充、相辅相成,共同促进各种信息活动的正常进行。
提高信息素养绝非一日之功,必须与信息检索的实践结合起来,将信息检索练习跟学习、思考与生活结合起来,多与老师同学交流、多对比总结,持之以恒,才能达到事半功倍的效果。
2.2信息检索目前我国的信息素养教育主要面向高校学生,教育方式主要是开设信息检索与利用课程。作为互联网时代的大学生,无论是在学习中拓宽知识面,加深对学科知识的理解,还是在工作生活中获取资讯、解决具体的问题都需要掌握信息检索的方法和技能。
信息检索能力是信息素养的集中表现。提高信息素养最有效的途径是通过学习信息检索的基本知识,进而培养自身的信息检索能力。
一、信息检索的定义信息检索(InformationRetrieval)起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。随着年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。Dialog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。
通俗来讲,信息检索就是从信息集合中找出所需信息的过程。信息检索有广义和狭义的之分。广义的信息检索全称为”信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程和技术,包括信息的标引与存储和信息的检索两个过程。狭义的信息检索为”信息存储与检索”的后半部分,通常称为”信息查找”或”信息搜索”(InformationSearch或InformationSeek),是指从信息集合中找出用户所需要的有关信息的过程。
相对于学术或者专业意义上的“检索”,在现实生活中,个体面临的诸如找工作、旅游路线制定、网络购物等,都需要搜索足够的信息以支撑决策。这些信息的获取可能没有严格与规范的检索系统,没有确定与明确的匹配方法,就连检索需求可能都是不确定的。但我们仍可以按照专业信息检索的思路来开展搜索。
二、信息检索的原理信息检索本质上就是将用户信息需求与文献信息集合进行匹配和选择的过程。其原理可以描述为:用户以特定的信息需求为原点,采用一定的方法和技术手段,对特定的信息集合进行查询,根据一定的线索与规则从信息集合中找出相关的信息。
信息检索的一般过程如图2-2所示。
信息组织人员后台建立检索系统包括信息标引和信息存储两个重要的过程:信息标引是指对海量的无序信息按照一定的特征,用特定的标引语言进行著录、标记和组织,使之有序化,形成可供用户检索的检索点的过程;信息存储是指对经过标引的信息进行筛选,形成检索文档和信息数据库的过程。这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等。
用户开展检索活动的核心过程是检索表达。检索表达实际上是用户将自己的需求,按照系统提供的方法和要求,将检索词用逻辑运算符连接起来,形成系统可理解和运算的查询串的过程。它主要由检索词、逻辑运算符、检索指令(检索语法)等构成。检索词是检索式的主体;而逻辑运算符和检索指令则根据具体的查询要求,从不同的角度对检索词进行检索限定。
那么如何使存到数据库中的信息能够被检索出呢?只需要保证存储于检索所使用的规则一致即可。也就是说,标引者与用户必须遵守同样的标引规则。这样,无论谁做标引,无论谁来检索,都能查到目标信息。
三、信息检索的分类信息检索具有广泛性与多样性,可以将信息检索从结果内容、信息存储与检索方式、组织方式等维度进行细分。
图2-3信息检索的类型
常用的是按检索结果内容划分,有数据信息检索、事实信息检索和文献信息检索。
(1)数据信息检索(DataInformationRetrieval)是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要找出可回答某一问题的数据的检索。数据检索是一种确定性检索,信息用户检索到的各种数据,是经过专家测试、评价、筛选的,可直接用来进行定量分析。例如,检索“年中国国民生产总值”和“年北京市城镇职工平均工资”。
(2)事实信息检索(FactInformationRetrieval)是将存储于数据库中的有关某一事件发生的时间、地点、经过等情况查找出来的检索。其检索对象既包括事实、概念、思想、知识等非数值信息,也包括一些数据信息,但需要针对查询要求,由检索系统进行分析、推理后,再输出最终结果。例如,检索“阿里巴巴的创始人是谁?他毕业于那所学校?”。
(3)文献信息检索(DocumentInformationRetrieval)是将存储于数据库中的关于某一主题文献的线索查找出来的检索。检索结果往往是一些可供研究课题使用的参考文献的线索或全文。文献检索是信息检索的核心部分。根据检索内容,文献检索又可分为书目检索和全文检索。例如,“影院票房波动和社会经济发展周期有什么相关性?”,这就需要检索主题根据课题要求,按照一定的检索标识(如主题词、分类号等),从所存储的文献中查出所需要的文献。
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
此外,按检索途径划分,信息检索可以分为直接检索、间接检索。按信息存储的载体和实现查找的技术手段为标准划分,信息检索可分为手工检索、机械检索、计算机检索。
四、信息检索的方法信息检索的方法有多重,分别用于不同的检索目的和检索要求。归纳起来,常用的信息检索方法有常规检索法、回溯检索法、循环检索法。
1、常规检索法
常规检索法又称工具检索法,它是以主题、作者、分类等为检索点,利用检索工具获得信息资源的方法。根据检索结果,常规检索法又分为直接检索法和间接检索法。
(1)直接检索法。是指直接利用检索工具进行信息检索的方法,如词典、手册、百科全书、年鉴、全文数据库等。这种方法一般用于查找一些内容概念较稳定、较成熟、有定论可依的问题的答案。
(2)间接检索法。主要指利用手工检索工具间接检索信息资源的方法。根据检索方式,间接检索法又分为顺查法、倒查法和抽查法。如表2-2所示
表2-2三种间接检索方法对比
类型
定义
适用范围
特点
顺查法
根据检索主题的起始年代,利用选定的检索工具按照由远及近、由过去到现在顺时序逐年查找,直至满足要求。
用于事实性检索。普查一定时间的全部文献,多在缺少评述文献时采取此法。
查全率高,工作量大,有助于掌握研究主题的来龙去脉,了解其研究历史、研究现状和发展趋势。
倒查法
与顺查法相反
多用于新课题、新观点、新理论、新技术的检索,检索的重点在近期信息上,只需基本满足需要。
获取到的信息新颖,节省检索时间,但查全率不高,容易产生漏检的现象。
抽查法
针对某学科的发展重点和发展阶段,拟出一定时间范围,进行逐年检索的一种方法。
根据检索要求,针对所属学科处于发展兴旺时期的若干年进行文献查找。
检索效率较高,但漏检的可能性大,检索人员必须熟悉学科的发展特点。
2、回溯检索法
回溯检索法又称追溯法、引文法、引证法,是一种跟踪查找的方法。这种检索方法不是利用确定的检索工具,而是利用已知文献的某种指引(如文献附的参考文献、有得了白癜风该怎么治疗北京中科白瘕风刘云涛