HUABASE华鼎数据库是基于列存储的关系型数据库系统,包括三层架构:核心层、接口层和应用层。核心层完全基于Java实现,包括支持列存储的所有关键组件。接口层支持ODBC和JDBC标准接口。应用层支持各种数据库应用开发,华鼎数据库系统本身提供了多种基于JDBC接口的数据库管理工具。
华鼎数据库非常适合于商业智能分析领域,华鼎数据库用户可以利用ETL工具从多种数据源抽取数据然后存放到华鼎数据库中,华鼎数据库可以存放和管理海量的数据并用于智能分析。
HUABASE华鼎数据库技术优势
1) 数据压缩技术:华鼎数据库按列存储并在列上进行数据压缩,在构建大型数据仓库时可以表现出突出的优势,节省了大量的存储空间。
2) 查询优化技术:华鼎数据库把记录的列分开存储,查询引擎可以按需读取列,从而减少了硬盘输入输出,显著地提高了数据库的查询性能。
3) 稀疏索引技术:华鼎数据库所建立的索引是稀疏索引,列值已被排序存储,索引只建立到数据块级,当查询通过索引定位到数据块后,就可以使用二分法查找,这样索引的存储空间很小,维护代价很低,可以给所有需要索引的列都建立索引,从而显著提高了数据库的查询性能。
HUABASE 用户可以利用 ETL 工具从多种数据源抽取元数据然后存放到HUABASE 数据库中, HUABASE 可以存放和管理海量的数据并用于智能分析,比如:一个数据库最大可以支持 232 个表空间;一个表空间最大可以支持 256 个数据文件;一个数据文件最大可支持 32TB 数据。
HUABASE 数据库管理系统是一个三层架构:核心层、接口层和应用层。核心层完全基于 Java 实现,包括支持列存储的所有关键组件。接口层支持 ODBC 和 JDBC 标准接口。应用层支持各种数据库应用开发, HUABASE 本身提供了多种基于 JDBC 接口的数据库管理工具。
HUABASE 将记录进行分段存储,表段内数据按列排序存储,表段中列值的个数有一个上限,连接数据存储记录号与数据块序列号。数据插入时,尽管列值的位置会发生变化,只要它仍然在同一个数据块中,连接数据就不需要更新,除非由于数据块溢出导致列数据被移到新的数据块中,数据块的序列号才发生变化。连接数据可以用来把相应的列值连接起来形成一条记录。
版权© 2021 清华大学信息国家研究中心 - 华鼎数据库项目 -保留所有权利。