• Topsis与熵权法


    定义

    熵权法是一种客观赋权方法。
    原理:指标的变异程度(方差)越小,所反映的信息量也越少,其对应的权值也应该越低。(客观 = 数据本身就可以告诉我们权重)

    如何度量信息量的大小

    在这里插入图片描述
    通过上面的例子我们可以看出,越有可能发生的事情,信息量越少;越不可能发生的事情,信息量就越多。如果用概率表示的话,即概率越大,信息量越少,概率越小,信息量越大。
    如果把信息量用I表示,概率用p表示,那么我们就可以建立一个函数关系:
    在这里插入图片描述
    假设x表示事件X可能发生的某种情况,p(x)表示这种情况发生的概率,则我们可以定义为:
    在这里插入图片描述

    信息熵

    假设x表示事件X可能发生的某种情况,p(x)表示这种情况发生的概率。
    在这里插入图片描述
    注:当p(x)均为1/n时,H(x)取最大值,此时H(x) = ln n。

    算法步骤

    1.判断输入的矩阵中是否存在负数,如果有则要重新标准化到非负区间(后面计算概率时需要保证每一个元素为非负数)。
    在这里插入图片描述
    2.计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率。
    在这里插入图片描述
    3.计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权。
    在这里插入图片描述

    代码

    计算熵权:

    function [W] = Entropy_Method(Z)
    % 计算有n个样本,m个指标的样本所对应的的熵权
    % 输入
    % Z : n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
    % 输出
    % W:熵权,1*m的行向量
    
    %% 计算熵权
        [n,m] = size(Z);
        D = zeros(1,m);  % 初始化保存信息效用值的行向量
        for i = 1:m
            x = Z(:,i);  % 取出第i列的指标
            p = x / sum(x);
            % 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数
            e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
            D(i) = 1- e; % 计算信息效用值
        end
        W = D ./ sum(D);  % 将信息效用值归一化,得到权重    
    end
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    由于担心概率为0自己定义的函数:

    % 重新定义一个mylog函数,当输入的p中元素为0时,返回0
    function [lnp] =  mylog(p)
    n = length(p);   % 向量的长度
    lnp = zeros(n,1);   % 初始化最后的结果
        for i = 1:n   % 开始循环
            if p(i) == 0   % 如果第i个元素为0
                lnp(i) = 0;  % 那么返回的第i个结果也为0
            else
                lnp(i) = log(p(i));  
            end
        end
    end
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    总函数:

    %%  第一步:把数据复制到工作区,并将这个矩阵命名为X
    
    clear;clc
    load data_water_quality.mat
    
    %%  第二步:判断是否需要正向化
    [n,m] = size(X);
    disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) 
    Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0:  ']);
    
    if Judge == 1
        Position = input('请输入需要正向化处理的指标所在的列,例如第236三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]
        disp('请输入需要处理的这些列的指标类型(1:极小型, 2:中间型, 3:区间型) ')
        Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]:  '); %[2,1,3]
        % 注意,Position和Type是两个同维度的行向量
        for i = 1 : size(Position,2)  %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数
            X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
        % Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数
        % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))   回顾上一讲的知识,X(:,n)表示取第n列的全部元素
        % 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)
        % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
        % 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量
        end
        disp('正向化后的矩阵 X =  ')
        disp(X)
    end
    
    
    %% 第三步:对正向化后的矩阵进行标准化
    Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
    disp('标准化矩阵 Z = ')
    disp(Z)
    
    
    %% 让用户判断是否需要增加权重
    disp("请输入是否需要增加权重向量,需要输入1,不需要输入0")
    Judge = input('请输入是否需要增加权重: ');
    if Judge == 1
        Judge = input('使用熵权法确定权重请输入1,否则输入0: ');
        if Judge == 1
            if sum(sum(Z<0)) >0   % 如果之前标准化后的Z矩阵中存在负数,则重新对X进行标准化
                disp('原来标准化得到的Z矩阵中存在负数,所以需要对X重新标准化')
                for i = 1:n
                    for j = 1:m
                        Z(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];
                    end
                end
                disp('X重新进行标准化得到的标准化矩阵Z为:  ')
                disp(Z)
            end
            weight = Entropy_Method(Z);
            disp('熵权法确定的权重为:')
            disp(weight)
        else
            disp(['如果你有3个指标,你就需要输入3个权重,例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);
            weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);
            OK = 0;  % 用来判断用户的输入格式是否正确
            while OK == 0 
                if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m  % 注意,Matlab中浮点数的比较要小心
                    OK =1;
                else
                    weight = input('你输入的有误,请重新输入权重行向量: ');
                end
            end
        end
    else
        weight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同,即都为1/m
    end
    
    
    %% 第四步:计算与最大值的距离和最小值的距离,并算出得分
    D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D+ 与最大值的距离向量
    D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;   % D- 与最小值的距离向量
    S = D_N ./ (D_P+D_N);    % 未归一化的得分
    disp('最后的得分为:')
    stand_S = S / sum(S)
    [sorted_S,index] = sort(stand_S ,'descend')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77

    其余函数均为Topsis中的函数,想了解的可以看这篇文章:Topsis

  • 相关阅读:
    springboot:整合mybatis-plus
    【Linux】自己实现一个bash进程
    【MySQL】MVCC(多版本并发控制)详解
    请做好3年内随时失业的准备?
    python 实现 rsa 加密
    JavaScript对象:我们真的需要模拟类吗?
    分布式链路追踪-常用技术选型
    C/C++ 常见数组排序算法
    传统防火墙与Web应用程序防火墙(WAF)的区别
    linux 安装配置github
  • 原文地址:https://blog.csdn.net/weixin_51711289/article/details/125978471