搜索:非结构化信息管理的核心



在过去的10年,我们经过了由信息匮乏到信息过量的转变。在销售额过30亿的企业,或市级以上主要政府机构,拥有的IT系统数量一般会超过10个。这些系统中的信息,包括结构化数据,也包括非结构化信息,如多格式的文档、邮件、网页等。根据调查,85%的信息是非结构化的,每三个月增加一倍。在因特网上,每天增加7百万张新网页。

知识工作者,面临着寻找信息的挑战。根据调查,知识工作者每天30%的工作时间,用于收集信息;72%的管理者认为,知识没有在他们的组织得到重复利用。从这些异构、繁杂、丰富的内容中,准确、快速地找到自己所需要的信息,减少信息搜寻时间,能够创造巨大的价值。

非结构化信息管理的应用热点

知识管理,有不同的应用点。这些应用点的设计开发,已经考虑了怎么帮助用户更好地获取他所需要的知识。

1) 门户。门户应用的核心在于展现和集成。企业内部所拥有的信息系统的数量在增多,导致用户需要登录和浏览多个系统,会浪费时间,亦会耽误工作事项的及时处理。门户可以将多个系统的应用点集中在一个界面上。所以,集成是门户的应用重点。门户的第二个应用重点是:怎么能够高效、快捷、多样、美观地对内容进行展现,减少程序设计量和改版工作量。

aihuau.com

2) 文档管理。文档的价值,重在重用。无论是记载了既往的经验、诀窍、心得、数据的工作文档,还是承载了规范、方法、工具的工作模版,如果能够供后来者使用,都能带来效益和效率的提高。文档管理亦是知识管理的基础所在。它看似简单,但如果以高水准的要求看待文档管理,并不是容易做的水准高、做的持久。

3) 协同。要点在知识与业务过程结合。无论是办公自动化系统中的文档,或是营销系统中的文档管理,还是产品数据管理中的文档管理,都是将文档与业务的运作结合起来,在具体业务的经营管理中,同步进行知识管理。

4) 社区。重在隐性知识向显性知识的转化。随着Web 2.0应用的普及化,博客、论坛、问题库、圈子、人脉网络等在大型企业内部的应用,亦逐步增多。由此,企业的社区不仅仅是论坛这一个应用。社区,促进了隐性知识向显性知识的转化。

5) E-learning系统。也是企业知识管理的应用重点之一,使得受制于讲师、空间、时间的面授培训,变成用户来点播使用的基于网络的培训。对于知识性的培训来说,这不仅有品质的保障,而且大大降低了成本。

上述这些不同的应用,外加企业内部建设的业务类、管理类系统,带来了信息量的膨胀,异构的数据。用户如何从这些系统中获取所需的信息,所费的时间越来越多。

如何帮助用户更好地获取信息?

 搜索:非结构化信息管理的核心
与企业内部应用相比,互联网站对提高用户友好性、提高用户点击量,倾注的热情更多。所积累的诸多经验,形成了系列规则和约定俗称的规范,值得企业内部知识管理系统学习借鉴。

1) 属性的广泛应用。无论是行业、产品类别、厂商类别等,还是新闻、首页、置顶、标红等,这些属性,作为目录的补充,其应用使得前台展现的纬度更加多元化,也使得计算能力得到节约。

2) Tag的应用。作为Web 2.0应用的符号性应用之一,Tag使得信息分类的颗粒度变得更小、更个性化、更长尾化。

3) 关联性的应用。关联性效果好的话,可以有效地帮助用户获取他所需要的信息,可以增加用户访问某一网站或应用系统的点击量。当用户在浏览某篇文章的时候,系统自动给出与该篇文章相关度高的其他文章的列表,或者给出与此文章相关的内容分类、内容属性或Tag,可以有效地提高用户获取信息的系统友好性。

4) 信息展现方式的改进。将页面分解为版式、模块、样式、信息来源,每块都可以自定义,这样使得页面的样式改变不需要重写程序,效率大大提高。

5) 用户自定义。有了目录、多样的属性、Tag、模版作为基础,用户可以自定义自己所关心、所偏爱的内容、样式,使得系统界面及内容能够个性化。

上述方法的使用,可以帮助系统管理员,方便地从业务的视角,来帮助用户获取知识。

搜索:信息展现的核心应用

对用户来说,企业级搜索所提供的服务,与公众类搜索引擎类似。在企业内部部署后,其提供的核心价值在于:

1) 搜索的准确性。专业的企业级搜索软件基于自己的算法,可帮助用户更准确地找到与其关心的关键词相匹配的内容。当搜索用户并不熟悉的专业内容时,软件所提供的搜索结果,比目录、属性甚至人工推荐更值得信赖。搜索准确性,除依赖于搜索算法外,也依赖于分词技术。比如搜索“制造业商业智能”,搜索软件能够根据专业的词库将其分解为制造业和商业智能两个词对内容进行精确搜索。搜索准确性,也依赖于附件搜索技术,即对常见的文本处理文档,能够进行索引和搜索。

2) 内容自动分类、摘要和关键词的自动提取。如果人工对大量的内容进行入库处理,如标注分类、属性、Tag、提取摘要,质量依赖人工监控,不稳定。每个编辑人员,每天处理的内容在250篇。随着信息量的增多,内容入库的成本也在增加。用技术实现内容自动分类,关键词和摘要的自动提取,使得编辑人员的工作从人工入库变为对机器分类结果的审核。这样,既可以兼具机器分类和人工分类的优势,又可以帮助提高效率节约入库成本。

依赖于上述两个核心应用点,面向用户端,在门户系统、文档管理系统、业务系统、社区系统、在线培训系统等知识管理系统中,灵活地使用属性、Tag、关联性、信息展现方式、用户自定义等,可以使得用户获取信息的效率和质量得到非常大的提高。

1) 搜索结果展现方式的多样化。可按时间、相关度等排序;用户或管理员可配置搜索选项。从而将丰富内容的威力,充分地发挥出来。

2) 推出高质量的推送服务。根据用户的特点,如性别、区域、行业、职业、兴趣、爱好等,向用户提供推送服务。如畅享网所经营的、面向机构用户的商务资讯库KNET中,就提供“我所关注的竞争对手”、“我所关注的客户”“我所关注的行业”、“我关注的管理知识”、“我所关注的信息化知识”等推送服务。

3) 提高单用户的访问量。搜索结果页,可以实现实时的推送,即用户在浏览某一内容时,系统自动匹配及推送他可能关心的其他内容。亦可以提供动态的相关分类或关键词,为用户动态提供相关的数据、文章、人员、应用系统等。这可以大大提高单用户访问单一系统的点击量。在很多情况下,这可以帮助用户更迅速、更准确地定位他所需要的内容。

4) 结构化数据与非结构化信息的关联。将非结构化信息与结构化数据,关联起来。在用户搜索非结构的文章时,可以将结构化的相关数据、人员、订单等展示给用户。当用户搜索结构化的数据、人员、订单、财务、材料等数据时,可将非结构化的文件展示给用户。

建立高质量搜索系统的难点

从当前的应用实践来看,建立高质量的企业级搜索系统,有如下值得关注的难点:

1) 软件的选择或开发。搜索软件是高质量搜索系统的基础所在。从技术来源上说,自己开发搜索软件,因为面临算法、性能等技术难题,可行性小。采用商品化的搜索软件,是可行办法。需要从市场上不多的专业搜索软件中,选择合适的搜索软件。

2) 搜索结果展示。搜索结果是为了让搜索的目标用户能够在最短的时间内找到最准确的内容,同时,给用户提供更多相关性的内容,挖掘用户的潜在需求,增加搜索的易用性,例如,相关的搜索词,相关的文章、相关的关键词等等。展示的页面要做到简洁、友好,必须在用户调研的基础上不断的完善和改进。

3) 专业词库的建立。建立企业级搜索系统的机构,对搜索的准确性比一般机构有更高的要求。搜索引擎自带的词库,不足以胜任对搜索准确性的高要求。根据自身机构的专业特点,建立分级、分类的专业词库,是基础的、繁杂的、长期的、高价值的工作。

4) 搜索软件的实施。搜索软件提供的是搜索和分类两个核心应用点。如何充分地应用两个核心应用点,进行用户搜索页、搜索结果页、文章阅读页的设计?如何提供与用户自身个性化特点相匹配的内容的推送服务,从而提高用户获取信息的效率和主动性?从而使得搜索在非结构化信息的应用系统中无处不在,大大提高系统的用户友好性。这都依赖于对搜索软件的有效的实施。

  

爱华网本文地址 » http://www.413yy.cn/a/9101032201/337668.html

更多阅读

何新共济会:全球资本主义世界性结盟组织的核心

何新 共济会:全球资本主义世界性结盟组织的核心(1)本书披露了一个全球性资本主义核心领导组织——共济会的秘密。本书提供的国际资料可以证明,资产阶级不是一个抽象名词,也不是分散的商业性经济人。发达国家最富有的资产阶级上层精英

关联交易非关联化 市值管理的手段和方法

一、关联交易非关联化手法1、形式上消失但仍具有一定实质意义的关联关系,尽管从名义上看不再是其关联方,但在以后一段时间内仍能对相互间的交易发挥影响。如天津磁卡2001年与天津环球高新公司签订购销合同,将价值2.15亿元的静态验钞机

面向对象 管理 面向对象的结构化培训管理

  有效培训体系的建设是培训管理绩效的保证,现有常见的培训体系由于概念和体系定位原因,或多或少存在着先天缺陷,如忽视管理职能、概念错位、忽视关联职能联系等。   实质上,培训体系的实质就是培训管理架构或模型。这个培训管理模

最紧迫的培训需求 生产现场管理的核心--车间作业,需求紧迫

   经过前期的内部论证和与客户的交流,最近我们开始为LS的车间作业设计优化的流程和E化方案。 车间作业向来是制造业最基本的生产组织内容,是生产现场管理的核心,分厂领导、车间调度每天的必修课。具体来说包括车间作业计划、现场调

声明:《搜索:非结构化信息管理的核心》为网友纯净的眸子分享!如侵犯到您的合法权益请联系我们删除