商务智能(business。intelligence,简称BI)是在ERP等信息化管理工具的基础上提出的,是基于信息技术构建的智能化管理工具,它可实时地对ERP,CRM,SCM等管理工具生成的企业数据进行各种分析。在商务智能技术的产品实现上,IBM,ORACLE,Cognos,SAS,NCR,Brio等软件厂商通过自行研制或收购的方式推出了相关产品,然而现有的BI系统仅能对本企业内部信息进行分析处理,与其相应的Web信息发掘技术也只限于用户访问模式的分析、网页链接分析和网页检索,这就造成大量潜在利用价值的商业信息未能充分利用。部分具有Web分析功能的商用系统,如SAS的Text Analysis也仪对客户的E-mail纯文本信息这类数据做处理,因此它的用途也只局限于客户关系管理(CRM)。本文针对现有的BI系统不能充分利用具有潜在利用价值的商业信息的问题,拟提出KB4WBI(knowledge mining for Web business intelligence)平台,并相继引出本体演化的问题,给出演化模型的具体方案、基于时间概念标识的知识表示模型以及关于时间概念的相关理论。
1 KB4wBI平台的基本架构
Web上的信息随着互联网的快速发展,网页的数据和信息也以惊人的速度增长。笔者在本文中提出一种基于知识挖掘的Web商务智能(KB4WBI)平台,其目的就在于更有效地从庞大的网页信息资源中提取出有用的知识或信息建立一个知识库,然后经过一系列分析处理最终提交给用户使用。
KB4WBI可分为3个大的功能模块:web数据资源模块、知识库模块和用户模块,参见图1。Web数据资源包含Web上的文本数据、视频数据、文件数据、数据库数据、网页数据、图像数据、文件和E-mail数据等。Web数据资源经过web爬行、文本分析、用户模块提供的多Agent支持来创建知识库模块,而领域专家和知识工程师在知识库模块中进一步创建知识库模块中的术语盒子模块(Tbox),它其实是若干个术语的组合,是一种ontology语义和知识表达层次上的知识集合,它描述概念和关系的一般属性,大量的概念根据彼此之间的包含关系形成了Tbox的层次结构。而断言盒是术语盒的实例化(术语盒的填值处理),是一个描述具体个例事实的公理集,它包含概念断言和角色断言,断言盒把个体映射到术语盒的概念中去,这种映射也就是本体解释过程的表现。
知识库模块还要用到描述逻辑和本体论、并发进程演算(CCS),描述逻辑定义了良好的语义。支持推理:对本体设计的支持、检查类一致性(尤其是对大的本体或多人设计的本体);支持本体集成:表达内本体关系、建立完整的类层次;支持本体开发:检查是否事实的一个集是关于一个本体一致的、回答关于本体的查询,并发进程演算把动态知识添加到知识库中。
用户模块包含以下6个子模块:知识设计和推荐(knowledge design and recommendation)子模块、专家系统(expert system)子模块、知识服务(knowledge services)子模块、基于案例的推理(case based reasoning)子模块、决策支持系统(decision support system)子模块和知识推理(knowledge reasoning)子模块,其中的知识设计和推荐子模块是用户基于用户模型推出的,而知识服务子模块可以通过简单对象访问协议(SOAP)或者统一资源发现和集成服务(UDDI)来达到网络共享的目的,最后用户可以通过一定的接口访问决策支持系统子模块。
KB4wBI平台致力于知识维护问题,例如每一条知识都具有时间属性.KB4wBI平台支持适时知识服务,往往不断地需要修改知识.例如当KB4WBI平台应用于不同的数据库模式新的任务或新的领域,或者由一种知识表示语言翻译成另一种知识表示语言时,本体就要进行一系列的演化。本体演化就是在不丢失数据的情况下,本体根据各种变化进行自适应变更来保持本体的一致性。