• 数据库、数据仓库相关


    1. 数据库与数据仓库的区别

    • 数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理。
    • 数据仓库 Datawarehouse (Amazon Redshift, Hive)主要用于数据分析。

    数据库和数据仓库是两种不同的数据存储方式,它们的设计目的和使用场景也有所不同。数据库通常用于存储和管理应用程序的事务性数据,例如用户信息、订单信息、库存信息等。它们通常被设计为支持高并发读写操作,并且需要保证数据的一致性和完整性。数据库通常采用关系型数据模型,使用 SQL 语言进行数据查询和操作。

    数据仓库则用于存储和管理大量的历史数据和分析数据,例如销售数据、客户数据、市场数据等。它们通常被设计为支持复杂的数据分析和报表查询,需要快速地处理大量的数据,并提供高度可靠的数据质量。数据仓库通常采用维度模型或星型模型,使用 OLAP(在线分析处理)工具进行数据查询和分析。

    总之,数据库和数据仓库是两种不同的数据存储方式,它们的设计目的和使用场景也有所不同。如果你需要存储和管理事务性数据,你可以考虑使用数据库;如果你需要存储和管理历史数据和分析数据,你可以考虑使用数据仓库。

    数据库事务处理是指将一系列数据库操作(例如插入、更新、删除等)作为一个整体进行处理的过程。在事务处理中,如果任何一个操作失败,整个事务都会被回滚,即所有操作都会被撤销,以保持数据库的一致性和完整性。

    事务处理通常具有以下特征:

    • 原子性(Atomicity):事务中的所有操作要么全部成功,要么全部失败回滚,不会出现部分成功的情况。
    • 一致性(Consistency):事务执行前后,数据库的约束和规则都必须保持一致性。
    • 隔离性(Isolation):事务之间是相互隔离的,每个事务都应该认为自己是唯一的,不应该受到其他事务的影响。
    • 持久性(Durability):事务成功提交后,对数据库的修改应该永久保存,即使系统崩溃或重启也不会丢失。

    2. ElasticSearch

    ES不适合的场景
    1.不推荐ES用在高性能场景:ES不能保证低延迟,面向C端用户对实时性要求较高的业务,不建议使用ES;这些场景可以考虑使用缓存、数据库等产品承载业务流量。
    2.不推荐将ES当数据库使用:ES产品定位是检索引擎,不能保障事务的ACID特性、默认不开启定时备份,如果您对数据的一致性、持久性有严格要求,建议使用其他关系/非关系型数据库。

  • 相关阅读:
    Hive执行计划之hive依赖及权限查询和常见使用场景
    [C++](8)模板的初步了解
    【LeetCode】每日一题 2023_11_18 数位和相等数对的最大和(模拟/哈希)
    20天深度复习JavaSE的详细笔记(十二)——集合(Collection、数据结构、List、泛型深入)
    Python基础语法(四)—— 列表+元组+字典
    QStandardPaths
    又一款超好用开源知识库管理工具
    30行自己写并发工具类(Semaphore, CyclicBarrier, CountDownLatch)是什么体验?
    排序——直接插入排序&&折半插入排序
    每一天的努力,都会让远方变得更近——中国人民大学与加拿大女王大学金融硕士
  • 原文地址:https://blog.csdn.net/yexudengzhidao/article/details/134011973