• 分类预测 | Matlab实现GA-XGBoost遗传算法优化XGBoost的多特征分类预测


    分类预测 | Matlab实现GA-XGBoost遗传算法优化XGBoost的多特征分类预测

    效果一览

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    5

    基本介绍

    Matlab实现GA-XGBoost遗传算法优化XGBoost的多特征分类预测,输入多个特征,分四类。
    XGBoost的核心算法思想基本就是:不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差。当我们训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数。最后只需要将每棵树对应的分数加起来就是该样本的预测值。

    程序设计

    %%  清空环境变量
    warning off             % 关闭报警信息
    close all               % 关闭开启的图窗
    clear                   % 清空变量
    clc                     % 清空命令行
    
    %%  读取数据
    res = xlsread('data.xlsx');
    
    %%  分析数据
    num_class = length(unique(res(:, end)));  % 类别数(Excel最后一列放类别)
    num_res = size(res, 1);                   % 样本数(每一行,是一个样本)
    num_size = 0.7;                           % 训练集占数据集的比例
    res = res(randperm(num_res), :);          % 打乱数据集(不打乱数据时,注释该行)
    flag_conusion = 1;                        % 标志位为1,打开混淆矩阵(要求2018版本及以上)
    
    %%  设置变量存储数据
    P_train = []; P_test = [];
    T_train = []; T_test = [];
    
    %%  划分数据集
    for i = 1 : num_class
        mid_res = res((res(:, end) == i), :);           % 循环取出不同类别的样本
        mid_size = size(mid_res, 1);                    % 得到不同类别样本个数
        mid_tiran = round(num_size * mid_size);         % 得到该类别的训练样本个数
    
        P_train = [P_train; mid_res(1: mid_tiran, 1: end - 1)];       % 训练集输入
        T_train = [T_train; mid_res(1: mid_tiran, end)];              % 训练集输出
    
        P_test  = [P_test; mid_res(mid_tiran + 1: end, 1: end - 1)];  % 测试集输入
        T_test  = [T_test; mid_res(mid_tiran + 1: end, end)];         % 测试集输出
    end
    
    %%  数据转置
    P_train = P_train'; P_test = P_test';
    T_train = T_train'; T_test = T_test';
    
    %%  得到训练集和测试样本个数
    M = size(P_train, 2);
    N = size(P_test , 2);
    
    %%  数据归一化
    [p_train, ps_input] = mapminmax(P_train, 0, 1);
    p_test  = mapminmax('apply', P_test, ps_input);
    
    t_train = T_train;
    t_test  = T_test;
    
    %%  数据转置
    p_train = p_train'; p_test = p_test';
    t_train = t_train'; t_test = t_test';
    
    %%  参数设置
    fun = @getObjValue;                 % 目标函数
    dim = 3;                            % 优化参数个数
    lb  = [001, 001, 0.01];             % 优化参数目标下限(最大迭代次数,深度,学习率)
    ub  = [ 50, 012,  0.1];             % 优化参数目标上限(最大迭代次数,深度,学习率)
    

    参考资料

    [1] https://blog.csdn.net/kjm13182345320/article/details/128163536?spm=1001.2014.3001.5502
    [2] https://blog.csdn.net/kjm13182345320/article/details/128151206?spm=1001.2014.3001.5502

  • 相关阅读:
    【ROS2原理17】ROS 2 安全飞地
    git使用说明
    ORM数据库操作
    研发效能之环境管理
    【OpenGL】四、坐标系统和摄像机
    分析谐波失真
    昇思25天学习打卡营第8天|保存与加载
    初识RNN1
    Junit5 + YAML 轻松实现参数化和数据驱动(一)
    【方法】如何取消ZIP压缩包的密码?
  • 原文地址:https://blog.csdn.net/kjm13182345320/article/details/139799594