第一章绪论
【内容提要】
本章介绍与检索相关的基本概念,学习课程的作用、意义及学习方法。知晓信息检索的发展历史和信息道德规范的主要内容。
信息在当今社会中起着重要作用,是与物质、能量相并列的客观世界的三大要素之一,是为决策提供依据的有效数据,是对现实世界事物的反映。在信息化的时代背景下,学会并掌握一套有效的医学信息检索的方法,是每一个医药卫生行业工作者必须具备的能力。
一、信息检索
(一)信息检索的概念与类型
信息检索(information retrieval)是信息用户为解决各种问题而查找、识别、获取相关事实、数据、知识的活动及过程。“检索”一词源于英文“retrieval”,其含义是“查找”,从字面理解有两层含义:检,即查找;索,即索取。广义的信息检索包括信息的存储与检索,狭义的信息检索主要是指检索。
检索的本质是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。从用户需求出发,对一定的信息集合系统采用一定的技术手段,根据一定的线索与准则,找出或命中(locate)相关信息的过程,就是检索。按检索对象的不同可分为:
1.文献检索(document retrieval)是以文献(包括题录、文摘和全文)为检索对象的检索。一般意义的文献检索是对期刊论文、学位论文、图书、专利等文献的检索。
2.数据检索(dataretrieval)是以数值或数据(包括数据、图表、公式等)为对象的检索。
3.事实检索(fact retrieval)是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。
扩展阅读:知识检索
知识检索是在现有的信息检索技术及模型上发展而来的,是为了适应知识组织的发展趋势,以解决传统信息检索不足而提出的一种新的检索理念。知识检索是在对蕴含在信息中的知识和知识关联进行分析的基础上,在知识处理技术和知识组织技术的支持下,强调了语义。不同于信息检索只是基于字面的机械匹配,而是从文章的语义、概念出发,能够揭示文章的内在含义,实现基于语义理解的智能化查询。
知识检索做到了语义和概念层次上的标引工作,提高了查全率和查准率,降低了用户的负担。就检索效率而言,知识检索优于信息检索。
知识检索综合应用了信息科学、人工智能、认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,是一种能充分表达和优化用户需求,高效存取所有媒体类型的知识源(文本、图像、视频、声音等)并能准确精选用户需要结果的高级信息检索方法。
国内外有关专家就信息检索这一概念给予了不同的解释,可从以下几个方面去理解:
(1)信息检索的范围较大:动态信息、静态信息、音频信息、视频信息及各种数字化信息均属信息检索范围。如果将信息检索作为一门学科,它应该包括源于各学科领域的理论、方法和技术,如概率论、*优化理论、矩阵记数法、模式识别及系统分析等。
(2)信息检索主要是文献检索:是从大量的文献中查找出与需求有关的文献,或者是包含用户所需事实与消息等文献的过程。其对象不仅指文献线索,也包括文献的片段,如章、节、段落及与事实有关的直接情报等。
(3)医学信息检索的资源类型复杂:包括医学科研文献、病历信息、健康档案、公共卫生基础数据、医学实验方案、数据等。
扩展阅读:几个相关概念
1.数据是对现实生活的理性描述,尽可能地从数量上反映现实世界,是未经组织的数字、词语、声音和图像等。数据是*原始的记录,没有回答特定问题,且与其他数据之间没有建立相互联系,是分散和孤立的。
2.信息是人体感官对事物存在或运动状态的客观反映,不同事物具有不同的运动状态、特征和方式,千变万化,因而产生千差万别的信息。信息是构成一定含义的一组数据。是现代社会*普遍和应用*广泛的概念。利用信息技术对数据进行加工处理,使数据之间建立联系,回答谁(who)、什么(what)、哪里(where)或何时(when)等问题。
3.知识是人们在认识和改造世界的社会实践中所获得的经验的总和。知识需要通过信息使用归纳、演绎等方法得到,且经过广泛深入的实践检验,被人消化吸收,并成为个人的信念和判断取向之后才能成为知识。
经合组织(OECD)将知识分为四大类:知道是什么的知识(know-what),知道为什么的知识(know-why),知道怎么做的知识(know-how),知道是谁的知识(know-who)。
4.文献是记录知识的一切载体的统称。
5.情报是动态的知识,是一切*新的经过加工和传递的信息。
进行信息检索的*终目的是为了获取知识。
(二)起源与发展
信息检索是伴随着科学研究的发展而发展的。信息检索昀初发源于文摘索引和参考咨询工作。世界上第一种学术期刊《学者杂志》既是昀早的期刊,也是昀早以专栏和附录形式出现文摘的刊物,可谓昀早的文摘性检索刊物。第一个正规的文摘性检索刊物是1830年创刊的《药学总览》,后改为《化学文摘》(Chemisches Zentralblatt),1969年并入美国《化学文摘》。继《药学总览》之后,许多独立的文摘刊物纷纷出现,受到了科学界的重视和推广。
索引与文摘都在19世纪得到了很大的发展。1851年出现了《纽约时报索引》(New York Time Index);1879年出现了第一种医学文献索引——《世界昀新医学文献季度分类记录》(Quarterly Classified Record of the Current Medical Literature of the World),后改名为Index Medicus,著名的MEDLINE数据库就是其电子版。
1964年美国国家医学图书馆(NLM)的“医学文献分析与检索系统”(MEDLARS)研制成功并投入使用。之后,随着计算机技术和通信技术的发展,相继出现了功能更加强大的联机检索系统,如Dialog、Orbit等。在因特网、移动网络的推动下,信息检索朝着智能化、简单化、个性化和专业化方向不断发展。
1.检索平台通用化全世界有数万种数据库,信息资源存在结构化数据、非结构化数据和半结构化数据,资源组织形式不同,分属不同的出版商或制作者,其检索平台、检索的界面、检索的语法控制及检索方式都不相同。鉴于此,一些通用的检索平台被开发出来,实现异构资源的统一检索,如NCBI-Entrez、Dialog、OVID、EBSCO等。
因特网上的搜索引擎可以算得上是另一类通用检索平台。现在流行的搜索引擎大多与Google相似,其检索界面和检索语法等都非常相似甚至相同。
2.检索功能智能化通过对文献的自然语言具有特定语义的词或词组的抽取、规范化、归一化处理,实现对词或词组的过滤与深度分析,用本体、SFX等技术实现不同知识点的内在关联,从而实现学者关联、机构关联、主题关联、知识关联、期刊关联、兴趣关联等智能检索。
3.检索系统个性化检索系统可以根据用户的个人爱好和检索习惯定制用户自己喜欢的检索界面和主题。国内外大多数据库和搜索引擎都有此功能。
4.检索服务专业化、多样化包括提供专业的数据库和专题信息的推送服务、移动应用等。如医学专业的MEDLARS系统,只提供生物医学领域的数据库服务。SDI定题服务则可根据用户的专业需求向检索系统订制某一(些)主题的信息,系统就可定期向用户推送有关主题的昀新信息,如RSS(丰富站点摘要)、E-mail等信息推送服务。
二、检索的作用和意义
以往,拥有知识意味着一个人必须把知识牢记在大脑里。而今,微信、新闻、课本知识等海量的信息充斥着我们的世界,面临着纷至沓来的海量信息,拥有知识则意味着知晓如何去获得有用信息的通道。随着搜索引擎的广泛使用,人类开始调整自己记忆信息的方式,大脑依靠互联网来记忆,就像依赖朋友、家人或同事来记忆信息一样。人们会忘记自己能在网上找到的信息,而记住自己认为无法在网上找到的信息;人们更容易记住在互联网的何处能找到这些信息,而不是记住信息内容本身。占有知识的概念已经被掌握获得知识的通道所取代。这个“通道”就是信息检索的目标地,利用好这个通道,就是检索的目的。
检索的目的是为了获取新知识,解决生活、学习、临床、科研等实际工作中遇到的问题。
1.丰富生活,便捷获取生活资讯科普知识、网络购物商品选择、地图导航、食谱查找、生活常识技巧等查找,可以解答生活中的疑问,如衣物染色如何清洗?冰箱异味如何去除?
2.帮助学习,更新知识计算机网络及信息科技的蓬勃发展带动了数字化学习的浪潮,借助各种信息设备的辅助使学习不再局限于固定的时间、地点及学习教材,而是任何时间、任何地点、任何情境的数字化学习甚至是终身学习。学习资源的获取是数字化学习的关键,数字化学习要求学习者具有良好的信息素养。
科学技术的迅猛发展导致了知识“新陈代谢”频率的日益加快。由于文献出版落后于科学技术的发展,有些文献还未出版或刚出版就被新的知识所代替,新技术、新材料、新理论、新方法不断取代旧工艺、旧材料、旧理论、旧方法,科学文献的老化周期已从19世纪的50年左右缩短到现在5~10年,文献寿命缩短。
3.支撑研究,提高科研能力古今中外有成就的科学家,都是在广泛吸收前人和同代人知识的基础上,受到启发而取得成功的。通过利用前人的知识成果,可以避免别人的重复劳动,提高科研的速度和效益。
4.助力临床,提高医疗质量为解决在临床诊疗工作中遇到的疑难问题,遵循证据,开展循证医疗,信息检索必不可少。有关疾病诊断、治疗,尤其是用药等信息是临床信息需求的主要类型。
5.学术评价,批判利用知识通过交流传播、质疑、批判性吸收、再生,得以增值,而留存于人类文明中。通过对留存信息的利用情况,如文献贡献者、文献引用、文献下载、文献数量、研究主题变化等的统计分析,可知晓领域研究的核心人物、核心机构、主要贡献等,从而间接评价学术贡献。
三、信息素养
(一)信息素养的内涵
信息素养(information literacy)的概念昀早由美国信息产业协会主席保罗.泽考斯基(Paul Zurkowski)于1974年提出,概括为“利用大量的信息工具及主要信息源使问题得到解答的技术和技能”。其含义包括对传统文化素养的延续和拓展,对信息源及信息工具的了解和运用,具有对信息检索、筛选、评估、组织、处理等的技能。
信息素养是信息意识、信息能力和良好的信息道德的集合,是人的综合素质的一个构成部分,更是现代信息社会生活必备的基本能力,是创新型人才的基本素养,是个人众多其他相关素养形成的基础和源泉,是其他素养的概念基石。
信息意识是指对信息的敏锐程度,能认识到信息和信息活动的功能和作用,认识到信息的效用,认识各种信息源的价值和信息机构提供的产品和服务,形成对信息的积极体验。
信息能力主要包括信息系统的基本操作能力,各种软件的使用能力,信息资源的利用能力,信息资源的加工与开发能力。信息道德是指涉及信息开发、信息传播、信息的管理和利用等方面的伦理要求、伦理准则、伦理规约,以及在此基础上形成的新型伦理关系。
扩展阅读:“全球医学教育*基本要求”(GMER)的主要精神
1999年6月9日,经纽约中华医学基金会(China Medical Board of NewYork,CMB)理事会批准,资助成立了国际医学教育专门委员会(IIME)。该委员会提出了世界各地医学院校培养的医生都必须具备的基本素质,在这些基础上制定了本科医学教育“全球医学教育*基本要求”(global minimum essential requirements,
展开