MPP数据库非功能测评指标及其效率测试方法
作者:郭盈 周润松
来源:《工业技术创新》2018年第01期
常见mpp数据库        摘 要: 构建MPP数据库的非功能测评指标体系,探讨其效率测试方法。结合MPP数据库自身特点,将MPP数据库产品的非功能测评指标划分为安全性、兼容性、容错性、可扩展性和效率五个方面。采用TPC-H和TPC-DS基准模型,将效率测试划分为生成数据、生成SQL测试语句和结果分析三个阶段。在中国大数据生态产业联盟对国产主流MPP数据库进行测试,表明测评指标和测试方法行之有效。为用户选型和MPP数据库厂商提升产品质量提供了测评依据和测试方法论、实践论。
        关键词: 大数据;MPP数据库;测评指标;效率测试;TPC-H;TPC-DS
        中图分类号:P208 文献标识码:A 文章编号:2095-8412 (2018) 01-030-05
        工业技术创新 URL: http: //www.china-iti DOI: 10.14103/j.issn.2095-8412.2018.01.008
        引言
        目前,我国行业大数据系统建设正从前期的需求分析,逐渐过渡到系统总体技术架构设计阶段。大数据系统架构设计师们(以下简称架构设计师)在设计架构时,通常会碰到两难的困境:是采用MPP(Massively Parallel Processing,大规模并行处理)数据库设计还是采用基于Hadoop的设计呢?如采用基于Hadoop的设计,首先,编程较为复杂;其次,虽然随着HP Vertica在Facebook系统上取得巨大成功,SQL-on-Hadoop数据库不断涌现,包括开源和商用的,如Hive、Hadapt、Citus、Impala、Stinger和Apache Drill等,使得Hadoop更像SQL,便于使用[1],但性能方面还有待优化。MPP数据库采用非共享集的技术,接口符合标准的SQL语法规范,同时又是从成熟的关系型数据库产品和数据库理论发展而来的,故在成熟性上大大优于Hadoop技术。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。