• AWS DAS认证考点整理(Redshift篇)


    Copy命令

    1. Copy命令优化手段: 压缩, 2. 对大文件进行分割,一次copy多个文件。(文件数对应slice个数)3. 使用temporary staging table(这种方法的本质利用table的drop和create代替delete, update,insert,因为后者是DML会触发事务。)
    2. Copy命令如果文件过多,可以使用manifest文件。
    3. Reshift Copy可以直接从S3和DynamoDB导入数据。
    4. DynamoDB encryption client只加密某几列,Redshift Copy命令不能解密,需要用DynamoDB stream+Lambda。
    5. Redshift copy对应slices数量,slice是一片内存和计算资源,一个node有多个slice。

    信息安全

    1. Redshift日志本身加密=对日志的S3加密。
    2. Redshift enable HSM加密,必须新启动一个集群,已创建的集群无法enable。(classic resize)
    3. Redshift连On-Premises HSM用VPN
    4. Reshift column level access control=Grant SQL command。Row-level=SQL(CREATE POLICY&Attach)
    5. Query级别日志=audit logging

    资源管理

    1. Redshift Concurrency Scaling:按需另起一个集群实现快速扩容,它支持读操作和少部分写操作比如insert。Concurrency Scaling比elastic resize更方便高效。
    2. Redshift resize类型:classic新建一个集群然后数据迁移,elastic新增一个节点,比classic快。两者都可以更改node类型,此时会先创建snapshot再迁移倒新集群。
    3. Redshift dense compute=SSD, CPU好,内存大,dense storage=HDD,存储大。
    4. Redshift auto vaccum会有通知,如果没有通知则vaccum可能被阻塞无法执行,导致查询慢。
    5. 不常用的数据放到S3里用Spectrum读取。
    6. RA3 nodes利用S3扩容。
    7. Redshift WLM query monitoring rules设定规则对满足条件的query进行特定action,比如abort。一个rule包括name,predicate(谓词)和action。
    8. WLM另一个功能小query优先执行。

    其他

    1. Redshift使用federate query跨VPC用VPC peering 
  • 相关阅读:
    JavaScript基础语法的简单了解
    Linux 安装配置Nginx
    FlinkSQL类型系统
    【LeetCode周赛】LeetCode第364场周赛
    【web前端面试宝典】经典10问(上篇)
    嵌入式Ubuntu设置用户名、密码、自启及权限
    前端面试知识查漏补缺
    第七届中美创新链接峰会-区块链与绿色发展
    OkHttp原理解析
    Java 超经典面试题
  • 原文地址:https://blog.csdn.net/rav009/article/details/128070569