什么是MPP?
嗯哼,不是MMP ,我们今天要讲的是MPP~
什么是MPP数据库?
1、⾸先,什么是MPP数据库?
1、⾸先,
MPP (Massively Parallel Processing),⼤规模并⾏处理系统。MPP架构是将任务并⾏的分散到多个服务器和节点上,在每个节点上计算完成后,将各⾃部分的结果汇总在⼀起得到最终的结果。通过增加节点数⽬达到系统线性扩展。通俗⼀点讲,就像是把⼩数据库组织起来,联合成⼀个⼤型数据库。采⽤MPP架构的数据库称为MPP数据库。
2、其次,为什么需要MPP数据库?
2.1 海量数据的分析需求
传统数据库⽆法⽀持⼤规模集与PB级别数据量;
单台机器性能受限、成本⾼昂,扩展性受限;
2.2 ⽀持复杂的结构化查询
复杂查询经常使⽤多表联结、全表扫描等,牵涉的数据量往往⼗分庞⼤;
⽀持复杂sql查询和⽀持⼤数据规模;
2.3 Hadoop技术的先天不⾜
Hive等sql-on-hadoop性能太慢;
分析场景不⼀样;
SQL兼容性与⽀持不⾜;
2.4 MPP数据库应⽤领域
⼤数据分析:MPP数据库做⼤数据计算或分析平台⾮常适合,例如:数据仓库系统、历史数据管理系统、数据集市等。
有很强的并⾏数据计算能⼒和海量数据存储能⼒,但是他不擅长⾼频的⼩规模数据插⼊、修改、删除,每次事务处理的数据量不⼤。这类数据衡量指标是TPS,适⽤的系统是OLTP数据库。所以,报表统计分析、运维统计数据,快速⽣成报表展⽰都可以使⽤mpp数据库。常见mpp数据库
3、最后,新型数据库的未来趋势是?
"⼤数据"关注的更多是⽤户⾏为、体趋势、事件之间的相关性等,⽽不仅仅是过去的KPI,。这就对数据分析平台对数据的分析能⼒和性能提出了新的要求和挑战。未来趋势是新型数据库将逐步与Hadoop⽣态系统结合混搭使⽤,⽤MPP处理PB级别的、⾼质量的结构化数据,同时为应⽤提供丰富的SQL和事务⽀持能⼒。⽤Hadoop实现半结构化、⾮结构化数据处理。这样可同时满⾜结构化、半结构化和⾮结构化数据的处理需求。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。