文章目录
大数据入门核心技术栏目里集合Hadoop、Hive、HBase、Spark、Flink等大数据必学的核心技术。初学者选择这个栏目,可以快速了解大数据知识体系,为后面的扩展性的深度学习大数据打下坚实的基础。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11740108.html
数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进行加工,例如:大数据处理、实时分析、机器学习,以指导做出更好地决策。
在大数据中属于很火的技术,学会它让你大数据项目里游刃有余。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11838152.html
在大数据中进行数据分析时,我们用到大数据分析技术体系有Clickhouse、Apache Druid、Presto、Kudu、Kylin、Phoenix、Doris等。
学会这些技术组件,让你升职加薪无压力。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11944903.html
大数据可以根据市场进行数据分析,提高运营管理效率,合理规划分配资源,调整业务结构,确保每个业务均可盈利。根据数据分析结果,规划、预计,提高客户的满意度,提高客户粘度。
本栏目会有各种市场业务的大数据项目,详细介绍项目搭建的整体过程,技术含金量高。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11546321.html
大数据进阶知识,对知识进行浓缩精华,对于基础进行深度概括,让知识更简单且容易记忆,里面还会包含进阶大数据知识,数据中台建设的一套方法论,让你开始有架构的思路。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11768491.html
Apache Airflow是一个提供基于DAG有向无环图来编排工作流的、可视化的分布式任务调度平台,与Oozie、Azkaban等任务流调度平台类似,后面会加入更多流行任务调度平台知识体系。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11697023.html
数据治理是一种数据管理的概念,能够确保数据的全生命周期存在高数据质量的能力,其最终目标是提升数据的价值。
栏目地址:https://blog.csdn.net/xiaoweite1/category_11731926.html
在大数据数据分析中,数据采集分为离线数据采集和实时数据采集两类,针对离线数据采集,典型的代表工具为Sqoop,针对实时数据采集,典型的代表工具为Flume,当然还有其他类似以上两种的数据采集工具,这些工具都有一个特点:将数据由某个源头采集到大数据存储系统中,本栏目将学习各种数据采集工具。
栏目地址:https://blog.csdn.net/xiaoweite1/category_12187724.html
大数据分析工具PowerBI手把手教程,欢迎零基础的读者订阅学习,体验数据分析的乐趣!
栏目地址:https://blog.csdn.net/xiaoweite1/category_12245754.html
以上都是价值较高的大数据栏目,后面会更新更多大家想学的体系知识,关注我学习大数据不迷路~