• Greenplum 实用工具-gpinitsystem


    注:本文翻译自https://docs.vmware.com/en/VMware-Greenplum/7/greenplum-database/utility_guide-ref-gpinitsystem.html

    gpinitsystem工具使用gpinitsystem_config文件中指定的配置参数初始化Greenplum数据库系统。

    语法

    gpinitsystem -c <cluster_configuration_file> 
                [-h <hostfile_gpinitsystem>]
                [-B <parallel_processes>] 
                [-p <postgresql_conf_param_file>]
                [-s <standby_coordinator_host>
                    [-P <standby_coordinator_port>]
                    [-S <standby_coordinator_datadir> | --standby_datadir=<standby_coordinator_datadir>]]
                [-m <number> | --max_connections=number>]
                [-b <size> | --shared_buffers=<size>]
                [-n <locale> | --locale=<locale>] [--lc-collate=<locale>] 
                [--lc-ctype=<locale>] [--lc-messages=<locale>] 
                [--lc-monetary=<locale>] [--lc-numeric=<locale>] 
                [--lc-time=<locale>] [-e <password> | --su_password=<password>] 
                [--mirror-mode={group|spread}] [-a] [-q] [-l <logfile_directory>] [-D]
                [-I <input_configuration_file>]
                [-O <output_configuration_file>]
    
    gpinitsystem -v | --version
    
    gpinitsystem -? | --help
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    描述

    gpinitsystem实用程序使用集群配置文件中定义的值和您提供的任何命令行选项创建Greenplum数据库实例或写入输入配置文件。有关配置文件的更多信息,请参见初始化配置文件格式。在运行此实用程序之前,请确保已在阵列中的所有主机上安装了Greenplum Database软件。

    使用<-O output_configuration_file>选项,gpinitsystem将所有提供的配置信息写入指定的输出文件。该文件可以与-I选项一起用于创建新集群或从备份的配置重新创建集群。

    在Greenplum Database DBMS中,必须在系统中的所有主机上初始化每个数据库实例(协调器实例和所有段实例),以便它们都可以作为统一的DBMS一起工作。gpinitsystem实用程序负责初始化Greenplum协调器和每个segment实例,并对整个系统进行配置。

    在运行gpinitsystem之前,必须将$GPHOME环境变量设置为指向协调器主机上安装的Greenplum Database的位置,并使用gpssh-exkeys在数组中的所有主机地址之间交换SSH密钥。

    这个实用程序执行以下任务:

    • 验证配置文件中的参数是否正确。
    • 确保每个主机地址都能建立连接。如果无法到达主机地址,则该实用程序将退出。
    • 验证区域设置。
    • 显示将要使用的配置并提示用户进行确认。
    • 初始化协调器实例。
    • 初始化备用协调器实例(如果指定)。
    • 初始化主segment实例。
    • 初始化镜像segment实例(如果配置了镜像)。
    • 配置Greenplum数据库系统并检查错误。
    • 启动Greenplum Database系统。

    选项

    -a
    不提示用户确认。

    -b parallel_processes
    要并行创建的segment数量。如果未指定,该实用程序将一次启动最多4个并行进程。

    -c cluster_configuration_file
    必需的。配置文件的完整路径和文件名,其中包含用于配置和初始化新Greenplum Database系统的所有已定义参数。有关该文件的说明,请参见初始化配置文件格式。必须为gpinitsystem提供-c 选项或-I 选项。

    -D
    将日志输出级别设置为debug。

    -h hostfile_gpinitsystem
    可选的。包含segment主机地址的文件的完整路径和文件名。如果没有在命令行中指定,可以使用gpinitsystem_config文件中的MACHINE_LIST_FILE参数指定主机文件。

    -i input_configuration_file
    输入配置文件的完整路径和文件名,它使用QD_PRIMARY_ARRAY、PRIMARY_ARRAY和MIRROR_ARRAY参数定义了Greenplum Database主机系统、主机上的协调器实例和segment实例。输入配置文件通常是通过使用gpinitsystem和-O output_configuration_file选项创建的。编辑这些参数,以便初始化新集群或从备份配置重新创建集群。必须为gpinitsystem提供-c 选项或-I 选项。

    -n locale |–locale=locale
    设置Greenplum数据库使用的默认语言环境。如果没有指定,默认的区域设置是en_US.utf8。区域设置标识符由语言标识符和区域标识符以及可选的字符集编码组成。例如,sv_SE是瑞典语,en_US是美式英语,fr_CA是法语加拿大语。如果一个区域设置可以使用多个字符集,那么规范如下:en_US。UTF-8(区域设置规范和字符集编码)。在大多数系统上,命令locale将显示语言环境设置,而locale -a将显示所有可用的语言环境列表。

    –lc-collate =locale
    类似于–locale,但设置用于排序(排序数据)的区域设置。在初始化Greenplum Database之后,不能更改排序顺序,因此选择与计划用于数据的字符集编码兼容的排序区域设置非常重要。有一个特殊的排序规则名称C或POSIX(相对于字典顺序排序的字节顺序排序)。C排序可以用于任何字符编码。

    –lc-ctype =locale
    类似于–locale,但设置用于字符分类的区域设置(哪些字符序列是有效的以及如何解释它们)。在初始化Greenplum Database之后,这一点无法更改,因此选择与您计划存储在Greenplum Database中的数据兼容的字符分类区域设置非常重要。

    –lc-messages =locale
    类似于–locale,但设置Greenplum Database输出消息使用的区域设置。当前版本的Greenplum Database不支持输出消息的多个语言环境(所有消息都是英文),因此更改此设置不会产生任何影响。

    –lc-monetary =locale
    类似于–locale,但设置用于格式化货币金额的区域设置。

    –lc-numeric =locale
    类似于–locale,但设置用于格式化数字的区域设置。

    –lc-time =locale
    类似于–locale,但设置用于格式化日期和时间的区域设置。

    -l logfile_directory
    写入日志文件的目录。默认为~/gpAdminLogs。

    –max_connections=number
    设置协调器允许的最大客户端连接数。默认值是250。

    -O output_configuration_file
    可选,在新集群初始化期间使用。该选项将cluster_configuration_file信息(与-c一起使用)写入指定的output_configuration_file。该文件使用QD_PRIMARY_ARRAY、PRIMARY_ARRAY和MIRROR_ARRAY参数定义Greenplum数据库成员。使用该文件作为-I input_configuration_file选项的模板。有关更多信息,请参见示例。

    -p postgresql_conf_param_file
    可选的。包含要为Greenplum Database设置的postgresql.conf参数设置的文件名。这些设置将在初始化单个协调器和段实例时使用。您还可以在初始化后使用gpconfig实用程序设置参数。

    -q
    在安静模式下运行。命令输出信息不显示在屏幕上,但仍被写入日志文件。

    -b size |–shared_buffers=size
    设置Greenplum服务器实例用于共享内存缓冲区的内存量。您可以以千字节(kB)、兆字节(MB)或千兆字节(GB)指定大小。默认值是125MB。

    -s standby_coordinator_host
    可选的。如果希望配置备份协调器实例,请使用此选项指定主机名。必须已经在该主机上安装和配置了Greenplum数据库软件。

    -p standby_coordinator_port
    如果使用-s配置备用协调器实例,请使用此选项指定其端口号。默认端口与协调器端口相同。要在同一台主机上运行备用和协调器,必须使用此选项为备用指定不同的端口。在备主机上必须已经安装并配置了Greenplum数据库软件。

    -S standby_coordinator_datadir |–standby_dir=standby_coordinator_datadir
    如果使用-s配置备用协调器主机,请使用此选项指定其数据目录。如果在与协调器实例相同的主机上配置备用服务器,则协调器和备用服务器必须具有单独的数据目录。

    -e superuser_password |–su_password=superuser_password
    使用此选项指定要为Greenplum Database超级用户帐户(例如gpadmin)设置的密码。如果不指定此选项,则将默认密码数组分配给超级用户帐户。以后可以使用ALTER ROLE命令修改密码。

    –mirror-mode={group|spread}
    使用此选项可以指定镜像segment实例在segment主机上的位置。默认的group将一个主机的所有主segment的镜像segment分组到一个备用主机上。spread在Greenplum Database阵列中的不同主机上传播主机上主segment的镜像segment。只有当主机数量大于每个主机的segment实例数量时,才允许扩展。

    -v |–version
    打印gpinitsystem版本并退出。

    -?|–help
    显示关于gpinitsystem命令行参数的帮助,然后退出。

    示例

    通过提供集群配置文件和segment主机地址文件初始化Greenplum数据库系统,并设置spread镜像(–mirror-mode=spread)配置:

    $ gpinitsystem -c gpinitsystem_config -h hostfile_gpinitsystem --mirror-mode=spread
    
    • 1

    初始化Greenplum数据库系统并设置超级用户远程密码:

    $ gpinitsystem -c gpinitsystem_config -h hostfile_gpinitsystem --su-password=mypassword
    
    • 1

    用一个可选的备用协调器主机初始化一个Greenplum数据库系统:

    $ gpinitsystem -c gpinitsystem_config -h hostfile_gpinitsystem -s host09
    
    • 1

    初始化一个Greenplum数据库系统,并将提供的配置写入输出文件,例如cluster_init.config:

    $ gpinitsystem -c gpinitsystem_config -h hostfile_gpinitsystem -O cluster_init.config
    
    • 1

    输出文件使用QD_PRIMARY_ARRAY和PRIMARY_ARRAY参数定义协调器和段主机:

    TRUSTED_SHELL=ssh
    CHECK_POINT_SEGMENTS=8
    ENCODING=UNICODE
    SEG_PREFIX=gpseg
    HEAP_CHECKSUM=on
    HBA_HOSTNAMES=0
    QD_PRIMARY_ARRAY=cdw~cdw.local~5433~/data/coordinator1/gpseg-1~1~-1
    declare -a PRIMARY_ARRAY=(
    cdw~cdw.local~6001~/data/primary1/gpseg0~2~0
    )
    declare -a MIRROR_ARRAY=(
    cdw~cdw.local~7001~/data/mirror1/gpseg0~3~0
    )
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    使用输入配置文件(定义Greenplum数据库集群的文件)使用QD_PRIMARY_ARRAY和PRIMARY_ARRAY参数初始化Greenplum数据库:

    $ gpinitsystem -I cluster_init.config
    
    • 1
  • 相关阅读:
    单片机——基础概念
    python的公有和私有属性,方法的使用
    Anaconda3安装pyLDAvis以及找不到funcy库的解决方法
    精英荟聚,入海捉蛟 | 2022年全国水下机器人大赛线上赛圆满举办
    小功率弧焊电流源设计及建模仿真
    深度学习基础--神经网络(2)
    【3】Spring Boot 3 集成mybatis-plus+druid+mysql
    Linux有哪些指令
    小红书店铺的所有商品API接口(整店商品详情查询接口)
    18.(arcgis api for js篇)arcgis api for js点采集(SketchViewModel)
  • 原文地址:https://blog.csdn.net/Post_Yuan/article/details/132720741