• Clickhouse初认识


    技术主题-clickhouse

    一什么是clickHouse

    1)本质上就是一款数据库管理系统,能提供海量数据的存储和检索
    2)基于列存储,数据是按照列进行存储的(数据格式一样,方便进行压缩)
    3)具备功能(多核并发处理、分布式处理、兼容sql)兼容mysql的sql语法,有sql经验,便于快速上手熟悉
    4)基于OLAP,和传统的事物数据库不同,倾向于大数据量的分析

    二clickHouse的4个概念

    1)granule: a logical breakdown of rows inside an uncompressed block;default is 8192 rows
    逻辑的概念,默认是8192行,最小的不可分的数据集

    2)primary key:the sort order of a table
    表的主键,用来排序的一个键

    3)primary index: an in-memory index containing the values of the primary keys of the first row of each granule
    稀疏索引,加速查询

    4)part: a folder of files consisting of the column files and index file of a subset of a table is data
    就是一个目录,目录里面包含列文件和索引文件,批量插入一次创建一个part

    三Inserting data into a table

    1)创建数据表-primary key

    请添加图片描述

    2)每次批量插入创建一个part,官方建议最少1000行,举个例子
    请添加图片描述

    3)数据的存储,文件是基于主键的顺序,有索引文件,每个列是一个文件

    请添加图片描述

    4)mergetree合并part

    请添加图片描述

    5)mergetree合并part,默认最大的part由参数控制
    请添加图片描述

    6)primary indexs

    请添加图片描述

    5)每一个granule用单独的线程去处理,处理快的线程可以处理慢线程的任务

    请添加图片描述

  • 相关阅读:
    dns隧道的通信原理及特征
    volatile
    【蓝桥杯冲击国赛计划第5天】哈希表
    【C】为什么7.0会被存储为6.99999
    Pr:基本图形(文本)
    #你我都是国家队#,与泸州老窖一起为中国荣耀干杯
    8个很棒的Vue开发技巧
    数据类型 (C语言)
    改ant design的气泡卡片组件popover的样式
    pytorch笔记
  • 原文地址:https://blog.csdn.net/ZhiguoXue_IT/article/details/134321749