NBI可视化集成clickhouse,实现百亿级数据分析能力

摘要:
ClickHouseClickHouse是一个具有MPP架构的列存储数据库。它允许您使用SQL查询实时生成分析报告,并可以自动管理多个数据库节点。其原理是在CPU寄存器级别实现数据并行操作。这也是因为ClickHouse提供了标准协议SQL查询接口。5.多样化的表引擎ClickHouse具有组合的树、内存、文件、接口和其他六类20多个表引擎。
什么是ClickHouse
ClickHouse是一款MPP架构的列式存储数据库,并允许使用SQL查询实时生成分析报告,也是一个新的开源列式数据库。
随着业务的迅猛增长,Yandex.Metrica目前已经成为世界第三大Web流量分析平台,每天处理超过200亿个跟踪事件。能够拥有如此惊人的体量,在它背后提供支撑的ClickHouse功不可没。ClickHouse已经为Yandex.Metrica存储了超过20万亿行的数据,90%的自定义查询能够在1秒内返回,其集群规模也超过了400台服务器。虽然ClickHouse起初只是为了Yandex.Metrica而研发的,但由于它出众的性能,目前也被广泛应用于Yandex内部其他数十个产品上。
 NBI可视化集成clickhouse,实现百亿级数据分析能力第1张
ClickHouse的核心特性:
1、ClickHouse拥有完备的管理功能,所以它称得上是一个DBMS ( Database Management System,数据库管理系统 ),而不仅是一个数据库。作为一个DBMS,它具备了一些基本功能,如下所示。
(1)DDL ( 数据定义语言 ):可以动态地创建、修改或删除数据库、表和视图,而无须重启服务。
(2)DML ( 数据操作语言 ):可以动态查询、插入、修改或删除数据。
(3)权限控制:可以按照用户粒度设置数据库或者表的操作权限,保障数据的安全性。
(4)数据备份与恢复:提供了数据备份导出与导入恢复机制,满足生产环境的要求。
(5)分布式管理:提供集群模式,能够自动管理多个数据库节点。
2、列式存储与数据压缩
列式存储和数据压缩,对于一款高性能数据库来说是必不可少的特性。一个非常流行的观点认为,如果你想让查询变得更快,最简单且有效的方法是减少数据扫描范围和数据传输时的大小,而列式存储和数据压缩就可以帮助我们实现上述两点。列式存储和数据压缩通常是伴生的,因为一般来说列式存储是数据压缩的前提。
3、向量化执行引擎
向量化执行,可以简单地看作一项消除程序中循环的优化,需要利用CPU的SIMD指令。SIMD的全称是Single Instruction Multiple Data,即用单条指令操作多条数据。现代计算机系统概念中,它是通过数据并行以提高性能的一种实现方式 ( 其他的还有指令级并行和线程级并行 ),它的原理是在CPU寄存器层面实现数据的并行操作。
4、关系模型与SQL查询
因为关系型数据库和SQL语言,可以说是软件领域发展至今应用最为广泛的技术之一,拥有极高的"群众基础"。也正因为ClickHouse提供了标准协议的SQL查询接口,使得现有的第三方分析可视化系统可以轻松与它集成对接。
5、多样化的表引擎
ClickHouse共拥有合并树、内存、文件、接口和其他6大类20多种表引擎。其中每一种表引擎都有着各自的特点,用户可以根据实际业务场景的要求,选择合适的表引擎使用。
6、分布式架构
ClickHouse在数据存取方面,既支持分区 ( 纵向扩展,利用多线程原理 ),也支持分片 ( 横向扩展,利用分布式原理 ),可以说是将多线程和分布式的技术应用到了极致。
ClickHouse采用Multi-Master多主架构,集群中的每个节点角色对等,客户端访问任意一个节点都能得到相同的效果。
 NBI可视化集成clickhouse,实现百亿级数据分析能力第2张
NBI可视化平台介绍:
NBI大数据可视化分析平台作为新一代自助式、探索式分析工具,在产品设计理念上始终从用户的角度出发,一直围绕简单、易用,强调交互分析为目的的新型产品。我们将数据分析的各环节(数据准备、自服务数据建模、探索式分析、权限管控)融入到系统当中,让企业有序的、安全的管理数据和分析数据。
NBI大数据可视化分析平台特性介绍:
(1)丰富的数据源接入能力:(关系型数据源、大数据分析引擎、MPP数据库、时序数据库...)
NBI可视化集成clickhouse,实现百亿级数据分析能力第3张
(2)易于操作的可视化编辑器:(通过简单的点击、拖拽实现数据的连接和处理,快速实现数据可视化需求)
NBI可视化集成clickhouse,实现百亿级数据分析能力第4张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第5张
(3)丰富的展示组件:(NBI可视化平台中有多大50余种可视化组件)
NBI可视化集成clickhouse,实现百亿级数据分析能力第6张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第7张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第8张
 
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第9张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第10张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第11张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第12张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第13张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第14张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第15张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第16张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第17张
 
NBI可视化集成clickhouse,实现百亿级数据分析能力第18张
 
更多信息请参考(http://www.easydatavis.com
 

免责声明:文章转载自《NBI可视化集成clickhouse,实现百亿级数据分析能力》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇词向量之word2vec实践镜像的各种版本区别下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

postman和fiddler的基本使用

本文转自:https://www.cnblogs.com/qq909283/p/6826578.html 写在前面:本文主要的章节规划: 1.什么是接口测试 另外,有的时候会直接调用别的公司的接口,比如银行的、淘宝的、支付宝的,此时也需要做接口测试以及验证数据; 做接口测试的好处: 其中, get和post请求是用的最多的 (截图来自fiddler)...

ORA-01089 数据库无法正常关闭

今天在做SOA几个数据库的重启操作,其中一个数据库在关闭过程中一直处于HANG住状态,十几分钟没有任何进展,具体操作过程如下: 一:当时的情景 SQL> shutdown immediate      --无任何返回结果 二:问题定位过程 1.查询相关进程只有ORACLE的关键进程存在    ps -ef |grep ora_    soadb  4...

windows上备份mysql数据库

方案一:采用mysql自带的工具mysqldump。 脚本文件backup.bat如下: set  "YMD=%date:~,4%%date:~5,2%%date:~8,2%"cd    /d   C:\Program Files\MySQL\MySQL Server 5.7\binmysqldump  --no-defaults    -uroot   ...

数据库系列(五)之 mysql的伸缩性

      这篇文章,主要讲述mysql的伸缩性。在国内mysql一直都是使用得最多的数据库,在国外也排名前三。mysql是一款开源的、性能较高的数据库。       伸缩性是指在软件设计中,软件(数据库、应用程序)通过特定的配置或升级,可以进行横向或纵向扩展,来达到软件适应越来越多用户访问的目的。数据库达到一定瓶颈,需要考虑伸缩性,这是大部分软件设计人...

php连接数据库(一)

1、php链接数据库: 1、链接数据库  2、判断是否连接成功 3、设置字符集 4、选择数据库 5、准备SQL语句 6、发送SQL语句 7、处理结果集 8、释放资源(关闭数据库)   $result = mysqli_querry($link,$sql) //返回一个对象   mysqli_fetch_assoc($result) 一个一个往下读,返回的时...

linux入门系列19--数据库管理系统(DBMS)之MariaDB

前面讲完Linux下一系列服务的配置和使用之后,本文简单介绍一款数据库管理系统(MySQL的兄弟)MariaDB。 如果你有MySQL或其他数据的使用经验,MariaDB使用起来将非常轻松。 本文讲解Centos7默认的数据MariaDB,由于是入门系列文章因此不会深入讲解,后面有机会在单独深入。 一、MariaDB产生背景 数据处理是软件的核心,软件的本...