• 用Go实现yaml文件节点动态解析


    1.摘要

    在大多数Go语言项目中, 配置文件通常为yaml文件格式, 在文件中可以设置项目中可灵活配置的各类参数, 通常这类参数都是比较固定的, 可以将其映射为对应的结构体在项目中进行使用, 如果需要调整参数时, 只需要增减结构体参数字段内容即可。

    但同时还存在另外一种情况, 例如: 在ubuntu系统中, netplan网卡配置文件同样也是yaml格式文件(配置文件在/etc/netplan目录下), 但该配置文件的节点内容可能是动态变化的, 例如:当dhcp开启或关闭时, 其节点展示的内容差异会很大, 要动态读取和写入对应的节点内容使用结构体已无法满足实际需求。本章节主要分享一种动态解析yaml格式文件节点内容的相关知识。

    2.静态解析方法

    首先还是回顾一下静态解析的方法, 假如我们的yaml配置文件内容如下:

    1. database:
    2. mysql:
    3.   db_host: 192.168.201.200
    4.   db_user: root
    5.   db_port: 3306
    6.   db_name: datas

    以上是一个关于数据库连接方式的节点定义, 在Go代码中, 我们定义一个综合结构体:

    1. type (
    2. Config struct {
    3. Database DatabaseConfig
    4. }
    5. DatabaseConfig struct {
    6. Mysql MysqlConfig
    7. }
    8. MysqlConfig struct {
    9. DbHost     string `mapstructure:"db_host"`
    10. DbUser     string `mapstructure:"db_user"`
    11. DbPassword string
    12. DbPort     string `mapstructure:"db_port"`
    13. DbName     string `mapstructure:"db_name"`
    14. }
    15. )

    在以上配置中, database是根节点, 子节点是mysql, 在子节点下有四个叶子节点db_host、db_user、db_port和db_name。在结构体中, MysqlConfig是代表叶子节点结构, 使用mapstructure关联了yaml配置文件中的字段名, 然后使用DatabaseConfig包含MysqlConfig, 使用Config包含DatabaseConfig, 与yaml文件中的节点层级一一对应。

    在应用过程中也比较简单, 只需要以下代码即可将yaml配置文件中的内容解析到结构体:

    1. var cfg Config
    2. if err := unmarshal(&cfg); err != nil {
    3. return nil, err
    4. }

    3.动态解析方法

    动态解析方法分为读和写两种方式, 在正式使用前,需要在工程中导入和同步:import "gopkg.in/yaml.v3", 然后我们看一下一个简单的网卡配置文件结构,如图:

    在该配置文件中, 当dhcp4内容为true时,表示自动获取IP, 那么下面的addresses和name servers将是空的; 当dhcp4为false时, 下面的字段内容跟图中的一致, 并且ens22这个是网卡名称, 这个没有固定的名字, 网卡名称是动态变化的, 因此无法通过定义固定的结构体层级来解析内容。

    看一段下面的代码:

    1. import "gopkg.in/yaml.v3"
    2. func main() {
    3. var err error
    4. var RootNode yaml.Node
    5. configs, _ := os.ReadFile(rootPath)
    6. err = yaml.Unmarshal(configs, &RootNode)
    7. if err != nil {
    8. log.Panic(err)
    9. return
    10. }
    11. }

    在上面的代码片段中, 我们没有定义任何结构体, 只定义了一个变量RootNode, 其类型为: yaml.Node, 然后使用通过os.ReadFile()函数读取网卡配置文件内容, 保存到变量configs中, 接着调用yaml.Unmarshal()函数将configs中的内容反序列化到RootNode变量中,那么RootNode变量中到底是一个怎样的结构呢? 实际上在RootNode变量中已经保存了配置文件所有节点的名称和内容, 通过Key:Value的方式在内存中保存。例如:

    网卡配置文件中,根节点名为network, 所以network就作为一个key保存, 而network下面的所有内容就作为value保存, 看下内存的分布情况:

    从上图中可以看到, 标号1的部分保存了1个元素, 这个元素实际上就是network, 在yaml节点中, 所有的内容都是保存在Content字段中, 所以在整个结构中, 可以递归的遍历Content内容来查找整个yaml文件中的所有节点名称和内容。

    从上图的标号2中,我们可以看到network节点内容实际上被标记为!!map类型, 上面已经讲过, 节点的名称和内容都是通过key:value的类型在内存中保存, 所以其Content内容中有2个元素,一个元素是network节点名称,也就是Key名, 另一个元素就是network的value部分。那么这里有个问题, 在编写程序遍历的过程中, 如何区分key名和值的内容呢? 这里我们继续点开network树状结构,看一下key的内容,如图:

    从上图可以看到, 实际上不管是Key还是Value,只要是字符串,其Tag内容都为"!!str", 同理,int内容其tag为"!!int", bool内容其tag为"!!bool", 如果某个字段的内容保存了多条内容, 那么该字段的Tag类型是"!!seq",例如配置文件中的DNS内容可以有多个,那么其字段的Tag内容就是!!seq, 如图:

    在Go工程中,我们可以写一个递归函数专门查找Content内容,代码如下:

    1. func findNode(n *yaml.Node, key string) *yaml.Node {
    2. switch n.Kind {
    3. case yaml.MappingNode:
    4. for i := 0; i < len(n.Content); i++ {
    5. if n.Content[i].Value == key {
    6. return n.Content[i+1]
    7. }
    8. }
    9. for i := 0; i < len(n.Content); i++ {
    10. if found := findNode(n.Content[i], key); found != nil {
    11. return found
    12. }
    13. }
    14. case yaml.SequenceNode:
    15. for i := 0; i < len(n.Content); i++ {
    16. if found := findNode(n.Content[i], key); found != nil {
    17. return found
    18. }
    19. }
    20. default:
    21. for i := 0; i < len(n.Content); i++ {
    22. if found := findNode(n.Content[i], key); found != nil {
    23. return found
    24. }
    25. }
    26. }
    27. return nil
    28. }

    在上面的代码中, yaml库使用yaml.MappingNode来识别Tag为"!!map"的内容;使用yaml.SequenceNode来识别Tag为"!!seq"的内容。注意: 上面findNode()函数只负责递归查找, 如果要读取或写入指定的节点内容, 我们仍然要控制节点的操作过程,例如: 我们要保存配置文件中addresses的内容, 当通过findNode函数找到address后,需要继续判断并获取值的内容,代码如下:

    1. if foundObj.Kind != yaml.SequenceNode {
    2. err = errors.New("检测到网卡配置选项addresses的内容类型有误,请统一格式,IP地址前面加上-符号")
    3. return nil, err
    4. }
    5. if len(foundObj.Content) == 0 {
    6. err = errors.New("网卡配置选项addresses的内容为空,请确保网卡配置文件中的该参数至少有一条IP信息")
    7. return nil, err
    8. }
    9. if len(foundObj.Content) > 1 {
    10. err = errors.New("网卡配置选项addresses的内容不能存在多个,网卡配置信息存在格式错误")
    11. return nil, err
    12. }
    13. addressInfo := foundObj.Content[0]
    14. if addressInfo.Tag != "!!str" {
    15. err = errors.New("检测到网卡配置选项addresses的内容不是字符串,网卡配置信息存在格式错误")
    16. return nil, err
    17. }
    18. totalInfo = append(totalInfo, addressInfo.Value)

    同理, 如果要改变addresses内容, 只需要找到对应的Key, 改变其Value的内容即可,以下是参考代码:

    1. if node.Kind != yaml.SequenceNode {
    2. err = errors.New("检测到网卡配置选项addresses的内容类型有误,请统一格式,IP地址前面加上-符号")
    3. return err
    4. }
    5. if len(node.Content) == 0 {
    6. err = errors.New("网卡配置选项addresses的内容为空,请确保网卡配置文件中的该参数至少有一条IP信息")
    7. return err
    8. }
    9. if len(node.Content) > 1 {
    10. err = errors.New("网卡配置选项addresses的内容不能存在多个,网卡配置信息存在格式错误")
    11. return err
    12. }
    13. addressInfo := node.Content[0]
    14. if addressInfo.Tag != "!!str" {
    15. err = errors.New("检测到网卡配置选项addresses的内容不是字符串,网卡配置信息存在格式错误")
    16. return err
    17. }
    18. // NodeContent是从外面传参进来的修改的值,类型为list,默认只有一个元素,将其赋给value即可改变配置文件内容
    19. addressInfo.Value = NodeContent[0].(string)

    最终修改后的内容已经保存在我们上面定义的变量RootNode中,最后通过以下代码写回文件即可:

    1. // 打开网卡文件
    2. f, err := os.Create(NetcardFilePath)
    3. if err != nil {
    4. logging.Log.Errorf("%T %s", err, err)
    5. return err
    6. }
    7. defer f.Close()
    8. // 将节点内容序列化
    9. d, err := yaml.Marshal(&RootNode)
    10. if err != nil {
    11. logging.Log.Errorf("%T %s", err, err)
    12. return err
    13. }
    14. // 将序列化内容写入文件
    15. if _, err = f.Write(d); err != nil {
    16. logging.Log.Errorf("%T %s", err, err)
    17. return err
    18. }
    19. if err = f.Sync(); err != nil {
    20. logging.Log.Errorf("%T %s", err, err)
    21. return err
    22. }

    4.总结

    从上面的例子我们可以看到, 定义一个变量var RootNode yaml.Node, 无论是读取还是写入, 始终在操控yaml.Node中的树状结构, 树状结构存放map结构的方式是按照: key-value-key-value-key-value...交替顺序的方式存放, 因此在循环遍历的时候要注意,使用以下代码来取出节点名称和对应的值,也可以传入一个节点名称来查找指定节点和对应的值,代码如下:

    1. for i := 0; i < len(found); i += 2 {
    2. content := found[i].Value
    3. if content == NodeName {
    4. node = found[i+1]
    5. break
    6. }
    7. }

    其中,found是调用上面函数findNode()查找到的节点位置,NodeName是需要查找的节点。其中found[i+1]可以取到所有的Key内容,found[i].Value可以取到对应的值。

  • 相关阅读:
    C++标准库分析总结(九)——<适配器、istream_iterator、ostream_iterator、bind>
    互联网Java工程师面试题·Java 并发编程篇·第八弹
    Android 获取SIM卡号码权限申请
    PGO in Go 1.21
    神经网络-前向传播Forward propagation
    操作系统学习笔记7 | 进程同步与合作
    神经网络如何避免过拟合,神经网络过度拟合
    HR350学习笔记-人事管理流程
    Python 打印所有水仙花数
    【vue】使用无障碍工具条(详细)
  • 原文地址:https://blog.csdn.net/suntiger/article/details/134404853