DorisDB升级为StarRocks,全⾯开源!
今天被朋友圈刷屏了,StarRocks开源——携⼿未来,星⾠⼤海!
原⽂链接:
可能⼤家对StarRocks不太熟悉,但是DorisDB想必都是听说过的。
在过去相当长的⼀段时间,对于ClickHouse 与 DorisDB的性能之争⼀直经久不息。
对于实时OLAP引擎的选择,Doris也越来越多并企业所应⽤。
DorisDB是⼀款纯国产的⾼性能的,分布式关系型列式数据库。
DorisDB脱胎于百度⼴告业务的实时分析场景,于2018贡献给Apache开源社区,之后在美团,⼩⽶,字节跳动,京东等互联⽹企业被适⽤于核⼼业务实时数据分析。DorisDB致⼒于满⾜企业⽤户的多种数据分析场景. ⽀持多种数据模型(明细表,聚合表),多种导⼊⽅式(批量,可整合和接⼊多种现有系统(Spark,Flink,Hive,ElasticSearch)。
DorisDB特性
DorisDB的架构设计融合了MPP数据库,以及分布式系统的设计思想,具有以下特性:
架构简单
DorisDB集的正常运⾏不需要依赖任何其他系统,易部署,易维护. 极简的架构设计,降低了DorisDB系统的复杂度和维护成本,同时也提升了系统的可靠性和扩展性。管理员只需要专注于DorisDB系统,⽆需学习和管理任何其他外部系统。
分布式架构
DorisDB采⽤分布式架构,存储容量和计算能⼒可近似线性⽔平扩展。DorisDB集的规模可扩展到数百节点,⽀持的数据规模可达到10PB级别。元数据和数据管理采⽤热备保证⾼可⽤,能够⾃愈,服务和数据安全可靠。
⾃治系统,管理简单
DorisDB是⼀个⾃治的系统。节点的上下线,集扩缩容都可通过⼀条简单的SQL命令来完成; 在此操作期间, DorisDB后台⾃动完成数据rebalance; ⽤户的查询和数据导⼊操作可同时正常运⾏。
另外DorisDB表模式热变更,可通过⼀条简单SQL命令动态地修改表的定义,例如增加列、减少列、新建物化视图等。同时,处于模式变更中的表也可也正常导⼊和查询数据。
标准SQL
DorisDB⽀持标准的SQL语法,包括聚合,JOIN,排序,窗⼝函数,⾃定义函数等功能,⽤户可以通过标准的SQL对数据进⾏灵活的分析运算。此外,DorisDB还兼容MySQL协议语法,可使⽤现有的各种客户端⼯具、BI软件访问DorisDB,对DorisDB中的数据进⾏拖拽式分析。
MPP(Massively Parallel Processing)执⾏框架
DorisDB内部通过MPP计算框架完成SQL的具体执⾏⼯作。MPP框架本⾝能够充分的利⽤多节点、多CPU,多核的算⼒,充分地将整个查询并⾏执⾏,从⽽实现很好的交互式分析体验. DorisDB能够⽀持亚秒级查询,并且查询QPS可达10000以上。
流批导⼊
DorisDB⽀持实时和批量两种数据导⼊⽅式,⽀持的数据源有Kafka,HDFS,本地⽂件. ⽀持的数据格式有ORC,Parquet和CSV等. DorisDB可以实时消费Kafka数据来完成数据导⼊,保证数据不丢不重(exactly once)。DorisDB也可以从本地或者远程(HDFS)批量导⼊数据。
⾼可⽤
doris
DorisDB的元数据和数据都是多副本存储,并且集中服务有热备,多实例部署,避免了单点故障。集具有⾃愈能⼒,可弹性恢复. 节点的宕机、下线、异常都不会影响DorisDB集服务的整体稳定性。
DorisDB可以满⾜企业级⽤户的多种分析需求,包括OLAP多维分析,定制报表,实时数据分析,Ad-hoc数据分析等。
在企业对于⼤数据分析⾯临的越来越多的问题情况下。
DorisDB升级为StarRocks,并全⾯开源(Github搜索“StarRocks”)
另外,官⽅下载地址与⽂档,请关注下⾯的地址。
也希望⼤家为国产开源软件贡献⼀份⾃⼰的⼒量。
获取更多StarRocks资料,欢迎关注⼤数据流动回复 “StarRocks”

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。