⼤数据圈盘点:你不知道的15个新技术
⼤数据中的⼤作为
对于⼤数据来说,业界这⼏周算是⽐较忙碌的。因为很多初创公司和⼀些⽼牌的公司都推出了数据分析和数据管理产品,以及更新了现有产品,提供更丰富的功能与性能。
虽然这些技术都还只是蓝图规划,但是⼀些常见的主题还是对其贯穿始终:为⽤户提供简单的获得数据的访问⽅式,更好的管理⼤规模数据以及预先分析的功能,例如Spark、HAWQ 和 Geode等新兴的⼤数据技术来实现更多的功能。
下⾯⼀起来看看吸引眼球的⼗五项⼤数据公告。虽然罗列了很多,但还不是全部内容,只是最近在加利福尼亚州圣何塞市Strata + Hadoop World⼤会上亮相的部分技术。
Altiscale Insight Cloud
Altiscale作为⼤数据服务的提供者,最近推出了Altiscale Insight Cloud产品,是⼀个⾃主服务型的数据分析服务产品,能够帮助业务分析⼈员使⽤BI⼯具等类似于Tableau和Excel的产品,实现快速的数据湖查询,⽽不需要IT部门投⼊过多的精⼒参与。
Altiscal Insight Cloud可以驱动SQL查询、动态可视化、实时仪表板和其他报告及分析能⼒。它不再因为聚合数据⽽需要⼀个单独的关系数据存储,绕过了价格昂贵的、专属的数据库系统。
Altiscale还与Tableau建⽴了⼀个战略联盟,能够让Altiscale客户通过使⽤Tableau的数据可视化软件与Altiscale服务结合的产品,⽽实现数据发现的应⽤服务。
AtScale Intelligence Platform 4.0
AtScale软件提供了⼀种使⽤流⾏的商业智能⼯具的⽅法,包括Tableau和Qlik,可以访问存储在Hadoop集中的数据。该软件创建了Hadoop和第三⽅⼯具之间的语义层级,从本上来说,通过联机分析处理服务器⽽实现多维分析的⽅法。
4.0版本提供了多达100项的新功能和系统改进,其中许多都与企业的安全和性能有关。
新AtScale Hybrid Query Service(AtScale混合查询服务),是可以在本地实现⽀持SQL和MDX查询语⾔的商业智能⼯具。由于许多企业和组织在其整个组织中使⽤多种BI⼯具,所以说AtScale对于SQL和MDX的⽀持也就意味着这些企业不需要在其⽤户的电脑中下载新的客户端软件或者⾃定义驱动了。
BlueData EPIC Spring Release
BlueData EPIC是⼀个⼤数据即服务平台,旨在减少实施⼤数据技术的复杂性,例如Hadoop 和Spark。
EPIC发布的春季版本中提供了⼏⼗种的新性能和功能改进,包括在多租户部署中提⾼服务的安全性和服务质量。该清
EPIC发布的春季版本中提供了⼏⼗种的新性能和功能改进,包括在多租户部署中提⾼服务的安全性和服务质量。该清单包括更多的颗粒资源管理控制、基于QoS的分配、性能优化和⽤于多租户部署的配额执⾏功能。
新版本还⽀持更⼤范围的⼤数据的应⽤程序和⼯具,包括⽤于数据管理和安全管理的Cloudera Navigator以及Ranger,⽤于⼤规模并⾏处理分析的HAWQ,以及Geode、Cassandra和⽤于实时分析的Kafka。
Domo商务云
Domo 商务云是⼀个对于商务管理应⽤的⽣态系统,包括免费和付费的预包装,为企业决策者提供数据、见解和访问的⽀持,以及所有可以帮助到商务问题的答案,甚⾄是特定⾏业和特定⾓⾊中。该公司提供云计算的免费版本,如果⽤户需要存储更多的数据或者获取更先进的企业功能,例如⾏政管制得话需要另⾏付费。
Domo最近还推出了应⽤商店,带有1000多个商务管理应⽤以扩张商务云系统,并开始了Domo应⽤发布合作伙伴计划,为第三⽅独⽴软件开发商开发商务云软件。
Domo 同时还推出了Buzz,是与商务云⼀起⼯作的社交协作平台,以及允许商务云访问任何移动设备的Domo Mobile产品。
Kyvos Insights With Azure HDInsight
Kyvos Insights的旗舰产品运⾏在Hadoop系统上,并允许企业⽤户通过可视化,探索和分析的存储在Hadoop中⼤数据的可⼤规模扩展的联机分析处理(OLAP)系统。
该Kyvos软件现在与Azure的HDInsight协同⼯作,微软基于云计算的Hadoop的平台,可以帮助Azure HDInsight⽤户通过部署Kyvos从⽽实现分析任务。
IBM云数据服务的Looker Blocks
Looker为基于Web的商业智能平台提供了访问驻留在数据库中或者云中的数据。去年,该公司推出了被称为Looker Blocks的可复⽤、可定制的业务逻辑组件,可以创建完整的业务分析查询功能。
Looker与IBM合作开发了⼀套Looker Blocks组件,通过利⽤IBM的云数据服务实现更加简化和可定制的数据分析服务。根据这两家公司所称,该组合将允许客户在数天内部署⼀个完整的数据平台。
云数据库服务
MapD Technologies GPU-Powered Database
MapD Technologies推出了新的数据库和可视化分析软件,利⽤图形处理单元芯⽚帮助数据分析师交互式地探索⼤型数据集。
通过利⽤GPU的强⼤动⼒,数据库可以在每台服务器将近4000个核上并⾏查询,⽐领先的内存数据库提供更快的性能。使⽤带有MapD Immerse分析前端⼯具的数据库可以更快的处理复杂数据库的可视性问题。(例如政治捐款,在此地图上就可以看到数据)。
MemSQL 5
MemSQL开发了其同名的数据库,⽤于事务处理和实时分析。在该公司公布的最新版本MemSQL 5中,提供了⼀系列的新技术和增强的功能,以提⾼软件的数据库、数据仓库和流媒体的⼯作负载性能。
在新版本中,通过混合的事务处理或者分析处理将事务和分析合并成⼀个单⼀的数据库,以⽀持OLTP和OLAP查询。⽤户可以在⼤量的写⼊负载中实现实时查询。借助于可插拔的认证模块以及类似于Kerberos的⼯具提⾼了安全性。⽤户可以通过使⽤MemSQL Streamliner来部署Apache Spark,创建了⽤户可视化界⾯的实时数据管道,同时消除了批量的ETL任务。
Paxata Spring ’16 Release
Paxata的⾃适应数据准备平台,建⽴在Apache Spark之上,运⾏在最优化的Hadoop环境中,提供了数据集成、数据质量、语义丰富、协作和管理能⼒。
量、语义丰富、协作和管理能⼒。
新版本提⾼了软件的能⼒,通过先进filtergrams综合数据分析,跨越列宽数据集的细粒度搜索,对于数据发现与统计选项的新的选择,以及在Hadoop压缩⽂件下集成复杂的嵌套JSON/XML数据,为⽤户提供了连接信息的能⼒。
该版本还包括新的IT控制,以提⾼系统的管理、安全性和规模。
Platfora Big Data Discovery 5.2
Platfora是⼀个很⼤的数据发现平台,建⽴本地的Apache Hadoop 和Spark。最新的版本”democratizes(民主化)”⼤数据,使其更容易使⽤现有的商业智能⼯具来访问Hadoop数据。
新版本提供了本地Tableau直接出⼝,⽤以准备和丰富数据集成的Tableau (画⾯数据提取)数据到Tableau桌⾯和Tableau服务器中。其他前端BI⼯具可以通过lens-accelerated SQL访问Platfora数据,通过SparkSQL和ODBC处理查询。
Platfora5.2也直接运⾏在Hadoop集上,除了传统的专⽤配置外,可以助其更容易地利⽤现有的硬件,并重新调整计算资源。⽤于数据可视化的Platfora Vizboard已经得到增强,能够”更加智能化”的默认可视化效果。
Ryft One Cluster
Ryft系统开发的硬件/软件设备,使⽤FPGA的并⾏处理能⼒处理器加速了tb和pb级别的数据分析能⼒。
新版的Ryft One Cluster使⽤带有开放API接⼝的混合FPGA / x86计算架构,该公司表⽰,这可以实现以100倍的速度加速⼤数据⽣态系统的发展,同时降低70%的成本。
新系统扩展了数据分析性能和存储线性,处理分析速度达到每秒200GB以上。它可以作为⼀个独⽴的集或作为现有的Apache Spark系统或其他⼤数据⽣态系统的⼀部分⼯作。
Tableau 9.3
Tableau公布了Tableau 9.3全⾯上市,在最新的版本中,其最受欢迎的数据可视化软件可以永久地连接桌⾯功能和Snowflake Elastic Data数据仓库。
Tableau Desktop 的”⼀直连接”功能可以更容易的与他⼈分享结果,同时留存在流动的分析过程中。该软件的全球地图覆盖功能获得了显著地提升,新数据添加到了地址解析数据库和Tableau Map Service中。
在9.3版本中,本地连接到本机连接到Snowflake Computing的云数据仓库系统更易于Tableau⽤户执⾏简单和复杂数据探索和分析。这两家公司还将继续合作,帮助客户将他们的业务分析过程转移到云端。
Talena ActiveRx
Telena的软件是⽤于在测试和开发、备份和恢复、归档和法规遵从和灾难恢复系统中优化数据。
Talena最近推出了ActiveRx,是⼀款新的预测分析软件,它采⽤机器学习算法和数据可视化,以更好地管理⼤数据的管理⼯作负载,和更准确地预测数据的可⽤性。
ActiveX软件还提供了”驱动副本分析”功能,企业可以⽤它来把闲置的备份数据转换成有⽤的资产。
Tamr Apache Spark Compatibility
Tamr的数据统⼀平台拥有丰富的企业的数据,汇聚了从企业内部和外部的数百甚⾄数千数据源进⾏分析。
Tamr宣布其软件可与Apache Spark兼容,其内存处理引擎可⽤于扩展机器学习,Tamr表⽰,其补充了机器驱动⽅式以备企业数据之需。
Tamr也在开发开放的接⼝和核⼼组件来⽀持由Spark驱动的数据监护系统。
Trifacta Photon
Trifacta开发了”数据争论”软件,揭开了光⼦计算框架,新技术的核⼼⽤户界⾯,在⼤规模的内存数据集时为⽤户提供了丰富的交互式数据探索和转型的经验。
数据争论是原始数据的转化过程,将复杂的数据转换成清洁的,结构化的数据转化成可分析的,这是数据分析过程中最具有挑战性的⼀个部分。
Photon产品符合Apache Arrow内存数据架构的说明要求,在与数据内容交互的时候为⽤户提供了即时的反馈。Photon 引擎在更⾼⽔平的计算中实现更多的数据探索。
⽂章来源36⼤数据,www.36dsj ,号dashuju36 ,36⼤数据是⼀个专注⼤数据创业、⼤数据技术与分析、⼤数据商业与应⽤的⽹站。分享⼤数据的⼲货教程和⼤数据应⽤案例,提供⼤数据分析⼯具和资料下载,解决⼤数据产业链上的创业、技术、分析、商业、应⽤等问题,为⼤数据产业链上的公司和数据⾏业从业⼈员提供⽀持与服务。
End.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。