免费热线:13220535006
   演讲网全国各地分站

关于医学知识组织与知识服务的再思考--中国演讲网

发布时间:2011-01-19 10:54 作者:演讲网 点击:
精彩导读:
关于医学知识组织与知识服务的再思考--中国演讲网 (亲爱的客户朋友您好!您正在浏览的文章是由我站编辑人员为您搜集整理的范文,仅供您参考。如果你有相关的写作需要请与我们业务经理王老师联系:13220535006 在线客服QQ:316327876 您的满意是我们永恒的追

关于医学知识组织与知识服务的再思考--中国演讲网

  (亲爱的客户朋友您好!您正在浏览的文章是由我站编辑人员为您搜集整理的范文,仅供您参考。如果你有相关的写作需要请与我们业务经理王老师联系:13220535006 在线客服QQ:316327876  您的满意是我们永恒的追求:中国演讲网www.yanjiangwang.com。)
  引言传统的知识组织体系主要是指以分类法、主题词表、叙词表等为主体架构的文献信息服务系统。
  它初步实现了将知识的检索和信息服务从文献载体深入到文献的事实单元,把用于传统知识表达的关系模式的组织工具——叙词表及其相互关系联接起来,组成一个基本的传统知识组织体系。
  传统的医学知识组织平台和工具贯穿在医学知识管理的各个方面,并在实践应用中获得了成功。
  例如国外有建立在MeSH,SNOMED,ICD一10,HL7等基础上的医学信息传递与数据交换系统、医学检索工具和各种医学文献数据库。但是,在传统的医学知识管理理论和工具基础上产生的知识组织体系,在解决将知识组织从人为的物理层面文献索引提升到机器自动认知程度的知识联系单元的时候,就必须对知识组织的概念、目标、原则、特征、方法、功能、联系等方面的内容重新进行描述与界定。
  传统知识组织方式存在的问题。
  1 网络资源组织的先天不足随着网络应用的普及和快速发展,网络医学信息资源的数量急剧增长。与传统的医学知识表示不同,网络信息主要是以HTML的标记形式存在的,缺乏必要的语义关系描述和规范的逻辑定义,不能用计算机自动进行逻辑推理和在人工智能模式指导下的协同处理。这就成为海量的网络医学信息获取、发布、共享和组织管理的致命缺陷。
  2知识发现和数据转换的瓶颈因特网上绝大多数医学知识是以自然语言为载体,以非结构化或半结构化形态出现的。分布在数亿个网页上的医学信息,随时随地都在变化,而且充满各种未经证实的、不规范的,甚至相互矛盾的内容。上述问题的存在使得知识规范表示和建模挖掘利用,以及异构系统平台之间的数据转换变得非常困难。一些数字资源开发机构,耗费大量的人力、财力、物力,经过劳动密集型的手工编排、加工形成的原始医学事实单元,同样缺乏元数据置标和语义关系描述,不仅不能保证医学知识得到永久保存和规范统一的链接调用,更不具备在今后进行更大范围的协同调用和共建共享的基本条件。
  3信息检索利用噪声的困惑网络上的生物医学信息资源非常庞杂,各种医学专业信息检索工具和网络搜索引擎也层出不穷。但由于计算机无法做到自然语言的内容识别和医学知识内在联系的自动理解,因此,通过自由词进行检索的结果,往往都是鱼龙混杂。又由于传统的信息检索技术仅仅是根据检索词和目标文档匹配度进行的简单比对计算,并把所有基本符合查询要求的内容反馈给用户,忽视了用户根据查询目的进行查询内容的关联和扩展检索的需求。而且还有许多信息查询条件是难以用简单的关键词组合来准确描述的。尽管目前全文检索技术已经成熟,基本上能够解决对网页内容的检索问题,只要在网页上出现某个指定的关键词,计算机就能够机械地完成关键词匹配的操作,但又不可避免地存在返回信息太多、太杂,不完整、不精确的问题。
  网上的导航浏览与分类目录体系也存在很多疏漏,信息的重复交叉和无序归类,给用户带来大量毫不相干的信息垃圾,影响了网络信息检索的全面性和准确性。
  综上所述,检索结果不准确、知识处理智能性差、知识单元可集成性差、知识组织协同性差、知识利用共享性差,在医学知识单元之间不能形成内在的逻辑联系,知识组织与知识服务不能组成科学、合理的网格关联结构,都是传统知识组织体系无法克服的弊端。
  为了有效地解决网络环境下的知识组织问题,以知识本体理论为核心,以基于语义网络环境的知识组织体系理念为指导,深入研究医学知识组织体系建设和医学知识服务策略,就成了医学图书情报界和医学信息管理领域的现实课题。
  基于语义网络的统一医学语言系统及其应用统一医学语言系统(Unified Medical LanguageSystem,UMLS),是美国国立医学图书馆研制的生物医学资源和医疗保健信息组织体系。建立UMLS的目的,就是试图解决计算机信息系统自动理解生物医学和医疗卫生领域的语言问题。它结合了很多概念本体、语义网络和术语表的优点,使计算机能够自动理解用户的检索要求,协同完成在不同类型的医学信息系统之间的资源整合与用户检索查询。
  由3个医学知识库组成,即多元分类词表(Metathesaurus)、语义网络(Semantic Network)和专家词典(Specialist Lexicon)。第一个知识库是多元分类词表。它是一个多用途、多语言词汇库,包括了多个术语表、分类表、序词表及其概念名称和属性及生物医学和卫生健康方面的概念与名词术语及其相互关系,其词汇来源于各种医学叙词表、分类表、编码集、公共卫生统计、文献目录与索引,以及各种基础医学、临床医学和医疗卫生方面的研究文献。
  通过概念关联,多元分类词表可以将同一概念的不同名称和形式联结在二起,可以标识不同概念之间的关系。每个概念都分为至少一个语义网的语义类型,保证其所有概念在语义网络中具有相对一致的分类。它的语义网络还包括130多个语义类型和多个关系,提供了多元分类词表中所有概念的统一分类,揭示了各个概念之间的关系。第二个知识库是语义网络,由较为宽泛的主题类目,也称作语义类型和语义类型之间的关系,即语义关系组成。第三个知识库是专家词典,其作用是为自然语言处理系统提供词汇信息。专家词典的词汇,包括通用英语词汇和生物医学专业词汇。
  从UMLS的3个知识库中可以看出,它吸收了,HL7,ICD一9等许多医学信息标准规范的研究成果,使孤立分散的医学词汇和术语得到集中融合,较好地解决了传统的知识组织系统难以解决的信息检索协同性差、知识利用共享性低等瓶颈问题。从概念表达方式和概念术语表达的统一性方面,建立起用户检索查询与医学知识资源之间的有机联系。应用基于知识本体理论建立起来的医学语义网络,即可将精心设计的各种医学知识(如词表)封装到计算机信息系统中,协同实现医学知识的语义检索。例如UMLS应用在数据库检索时,用户只需输入自由词,系统即可自动将其转换成规范的医学主题词并完成相应的主题和分类的一体化检索,极大地提高了医学知识服务的效率。
  基于语义Web技术的知识组织研究针对因特网页面内容缺少语义信息,Web技术服务缺少语义表达,不能进行语义检索等传统弱点,之父Tim Bemers—Lee早在1998年就提出了语义Web(Semantic web)的设想。2000年12月,他又在XMl20(D会议上提出了关于语义Web的体系结构,标志着基于语义Web技术的知识组织理论开始了实际的研究应用,对全球医学知识组织和医学知识服务体系建设具有重大的理论研究和实践指导意义。
  语义Web的实现需要3种关键技术的支撑。
  即使用XML(Extensible Markup Language)和RDF(Re.来定制和表达数据信息,利用Ontology(本体)网络语言来描述各种网络文档中的概念、术语及其相互关系。首先解决语义层次上的知识共享与信息交换的瓶颈问题。其次,在语义Web技术环境下,进行基于知识关联的语义层次上的匹配,使信息检索的查全率和查准率得到充分的保证。
  1 XML XML是表示结构化信息的一种文本格式,同HTML一样发源于SGML(标准通用标记语言)。由于Web技术的深入应用,HTML在实际应用中已显得力不从心。为此,Web标准化组织W3C推出了精简的SGML版本——xML。与SGML一样,是一个用来定义其他语言的元语言,是一种既无标签集又无语法的新一代标记语言。它具有规范的数据存储格式和良好的扩展性、高度结构化及便于共享传输等突出优点,用户可以根据需要自行定义各种标记及属性名称。
  2 RDF RDF是W3C于1997年在XML的基础上推荐的一种标准,用于表示任何的资源信息,对所描述对象的结构和内容提供规范的说明。它克服了的语义限制,具有易交换、易扩充、易集成、易综合等特点。。RDF由RDF Data Model,和RDF Syntax 3部分组成,采用3种对象来描述事物,即资源、属性以及声明。RDF不仅可以表达那些既能被用于显示浏览又能被机器自动识别处理的信息,还可以通过XML语法实现对各种元数据的集成。
  3 Ontology它原本是个哲学上的概念,用于对客观世界本质的研究。现在也被广泛地用在计算机科学、智能检索、数据挖掘和数字图书馆建设等领域。目前Ontology仍然没有一个统一的定义。但是,美国斯坦福大学的Gruber教授提出的定义“本体是概念化的显示规范”得到了大多数同行的认可。
  本体需要使用某种语言来对概念化进行描述。
  有许多语言都可用于表示Ontology,其中大多数语言是基于XML语法并用于语义Web的。如,棚;;l坩ge)以及由W3C组织创建的RDF与。还有建立在RDF与RDPS之上的、较为完善的Ontology语言Ⅸ蝴L(DARPA Agent Mark.,OIL和DAML+OIL‘3|。
  语义Web就是要致力于建立一个支持知识在上的分布式表示,具有面向网络共享应用功能和明确语义的知识空间,同时又能满足基于本体概念化描述的表示语言。
  基于语义web技术的知识服务应用。1基于语义web的智能代理服务面向知识服务的智能代理服务(Agent),也可以从语义Web技术中受益。由于各种医学知识资源在语义w曲中克服了其在传统的知识组织体系中的无序化、非结构化的缺陷,可以重新由一种结构化、逻辑化、本体化、语义化的方式来表示。面向医学知识服务的智能代理就可以利用已经建立起来的本体概念来描述,完成协调一致的语义级别的交换、传输,有望从根本上改进医学资源的动态获取和共享利用。
  2基于语义Web的医学知识组织应用有效的知识组织是保证知识共享利用的关键。医学知识之间的交换、传送、共享,是基于Web的知识服务的重要内容。现在国外的一些生物医学信息学术团体,已经设计出基于XML语法和OKBC语言的XOL本体交换语言,围绕着基于本体的语义标注和知识交换展开工作。基于语义Web技术的知识组织可以利用语义Web和XML置标的元数据,针对各种异构环境下具有不同数据格式、不同存储方式的数据库应用系统,对其内部数据文档进行语义标注和概念化描述,建立起大规模的分布式、动态化、专业性、跨平台的Web医学资源共享虚拟组织模式。
  3基于语义Web的医学知识检索服务对网上海量的医学信息进行智能化的知识检索,一直是知识组织和知识服务的重要课题。使用HTML的网页显示形式单调枯燥,仅仅是把一个网页链接到另一个网页,整个网络都可能是混乱和无序的。XML网页虽然对网页进行了结构化描述,但仍无法对网页的内容进行语义标注,难以实现基于知识检索的智能化和自动化功能。如果检索信息仅仅采用机械的关键词匹配来实现,就仍然无法把信息检索从关键词层面提高到知识(或概念)的层面。为了解决信息检索中存在的诸如此类的问题,语义Web将本体技术结合到Web技术中去,就能够从HTML或XML中提取到具有语义的医学内容信息,使实现自动化的知识发现、知识查询、知识搜索,跨平台、智能化的医学知识检索成为可能。
  4基于语义Web的医学知识挖掘应用XML和在语义web中的广泛使用,为web医学知识挖掘技术的应用带来新的契机。由于医学知识数据的语义有了明确的定义,医学专业搜索引擎就可以进行语义级别的Web分析和信息抽取,改变过去使用复杂的算法都无法实现的非结构化(或半结构化)数据挖掘的效果。如果在语义清晰的Web环境下,数据挖掘能够变得简洁、高效,不仅能够使知识发现和数据挖掘的准确性提高,而且还可以使传统搜索引擎和挖掘算法无法实现的网状关联知识表达变成现实。在语义Web中,可以采用开放、协同、共享的网格链接方式,在若干个Web页面和若干个异构医学数据库资源中挖掘出最终的结果,促进网络医学知识挖掘技术向高精度、智能化的方向发展。
  展望传统的知识组织体系在信息表达和检索方面的缺陷,主要源于它是以面向用户的直接阅读理解与线性关联处理为目的。由于它不能提供可被计算机自动理解和智能处理的语义信息,限制了其在知识组织和知识服务过程中实施逻辑推理、自动分析和智能联想作用的发挥,不能广泛地应用于因特网上的知识组织与协作、共享。
  基于语义Web环境的知识组织方式是实现医学知识服务的最佳选择,也是完成医学知识管理的最好归宿。解决目前国内医学知识组织和服务方面与国外先进理论和应用之间存在的差距,关键的问题是要尽快建立和统一中国医学知识组织的体系与标准规范。尽管W3C组织已经推出了一系列的知识组织体系标准和规范,美国国立医学图书馆的也已在世界范围得到成功应用。但是,在基于语义Web技术的医学本体、医学知识组织体系建设与知识服务研究方面,国内比较成熟的阶段性研究应用成果报道并不多见。除了在20世纪90年代中期,中国医学科学院信息研究所研制的“统一的中国医学语言系统”基本建成,并应用于“中国生物医学文献数据库”的主题标引,实现了中文医学语言与主题、分类检索语言的一体化功能以外[4],还有中国科学技术信息研究所庞景安研究员的“基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究”,以及国家科技部中药基础数据库项目课题组尹爱宁等关于“建立中医药学一体化语言系统的方法学研究”的文献报道。
  与此同时,近年来少数卫生健康门户网站和数据库营销商,相继推出一些加工粗糙、杂乱无章的“寻医问药”栏目和“医学知识”频道,非但不能起到提供医药卫生知识咨询服务的效果,反而产生了大量网上冗余的垃圾信息。鉴于此,从“十五”以来,国家加大了卫生信息化标准研究的力度,相继组织启动了《国家卫生信息标准基础框架》、《公共卫生信息系统基本数据集标准体系》、《医院基本数据集标准》
  等课题研究项目。由第四军医大学卫生信息研究所牵头研制的“卫生信息标准基础框架研究”已经取得阶段性成果。我们相信,把中国医疗卫生信息标准化的系列研究与国外医学本体研究、医学知识组织体系建设的先进理念相结合,对促进中国医学信息管理和医学知识服务的发展将会起到里程碑作用。
  (您现在浏览的文章来自中国演讲网《http://www.yanjiangwang.com》 如果你有相关的写作需要请与我们联系24小时辅导代写热线:13220535006 王老师。 专家QQ在线:316327876 )

[责任编辑:演讲网 admin]

更多>>写作顾问

王 临
王 临
中国演讲网站长、《中国好口才》项目组组长、中国著名公文写作专家、公务员《能讲会写》创始人...[详细]

更多>>培训顾问

文若河
文若河
北京大学公众演讲与管理沟通课题组组长,中国着名口才理论家与实践家、“口才树”理论体系创始...[详细]