<%@ page contentType="text/html; charset=GB2312" %> 教育部科技发展中心  
繁 体
 
当前位置: 首页 >> 高校最新鉴定成果简介 >> 按学科分类 >> 计算机
面向领域的数据分析与挖掘技术研究
来源: 教育部科技发展中心  发布时间: 2005-08-01  点击数:
成果名称:面向领域的数据分析与挖掘技术研究
申请单位:中国人民大学
成果编号:鉴字[教TP2005] 第009号
鉴定日期:2005.7.5.
学科:14计算机
成果简介:
“面向领域的数据分析与挖掘技术研究”是中国人民大学、清华大学、北京理工大学共同承担的国家863课题的研究成果。该课题研究以海量数据为基础的面向领域的数据仓库、联机分析和数据挖掘技术及其系统,发表和录用了64篇学术论文,获得软件著作权一项,申请国家发明专利一项。具体成果包括:
(1)研制了集成化的数据仓库—联机分析处理—数据挖掘系统ParaDAM。ParaDAM采用三层C/S体系结构,支持多用户,支持标准多维查询语言MDX,对国产数据库KingBase提供了专用接口,提供了建模服务器、计算服务器和查询服务器,提供了ETL工具、联机分析工具和多种数据挖掘工具。ParaDAM已在三家用户中得到应用并取得了很好的结果。
(2)提出并实现了基于Chunk的压缩的多维数据存储结构和MDX查询的直接处理、优化;实现了数据清洗、智能数据分析、数据仓库的增量维护、基于模型的预测分析和序列数据中关联规则挖掘等功能。
(3)深入研究了数据方体的存储、计算和实体化技术。提出了多种能够有效缩减Cube体积的精简数据方体技术和精简数据方体的维护技术;提出并实现了适用于高维大数据量环境的基于多维数组的并行两层流水线Cube计算算法和Cube的断点续算技术;提出了一种新的实体化视图选择方法以及动态选择和调整实体化视图的算法。
(4)提出了一种新的多维数据模型ER(H)和两种新的多查询处理方法以及索引选择框架PWIS;提出了在OLAP服务器和数据仓库服务器上同时设立缓存的两层缓存管理策略、基于预取的缓存管理技术、基于Chunk的缓存优化与管理机制和基于知识的缓存管理策略,并借助缓存机制实现了动态实体化视图和由已有查询结果导出新查询结果。
(5)该课题提出了能够保持分类能力不变的约简计算方法和针对非矢量时序数据进行聚类分析的方法;提出了过程语义向状态演算和事件演算进行转换的规则和策略,证明了转换的合理性与完备性,并将其置于逻辑程序设计框架之中,从而实现针对时序和变化情况的自动推理。
在教育部组织的鉴定会上,专家一致认为:课题成果在总体水平上达到国际先进水平,在精简数据方体技术、基于多维存储的MDX查询处理与优化等方面进入国际领先行列。ParaDAM作为国内第一个集成了数据仓库、OLAP和数据挖掘的原型系统,它的完成对推动我国数据仓库与数据挖掘的研究和开发,促进国产数据库的发展都有着重要的意义。

 


打印】【 发送给朋友】【关闭
客户服务信箱  Tel:010-62514689,62514697  Fax:010-62514678  京ICP备:05004627号
2007 版权所有:教育部科技发展中心  未经书面许可  不得转载本站信息
Produced By HZCMS协同内容管理系统 内容管理专家 publishdate:2008/09/23 15:05:05