• 矩阵分析与应用


    向量的相似度

    考虑M个类型的模式,它们分别被记作w_{1},w_{2},.. .w_{3}。假定通过已知类型属性的观测样本,抽取出M个模式向量s _{1},s _{2},.. .,s_{M},给定一任意的未知模式向量x,希望判断它归属于哪一类模式,这个问题就被称为模式分类,是模式识别的基本问题之一。

    模式分类的基本思想是将未知的模式向量x同M个样本模式向量进行比对,看x与哪一个样本模式向量最相似,并据此作出模式分类的判断。

    假定(x,s_{1}),(x,s_{2}),.. .,(x,s_{M})分别作为未知模式向量x与已知样本模式向量s _{1},s _{2},.. .,s_{M}之间的相似关系的符号。以x与s_{1},s_{2}的相似关系为例,若

    (x,s_{1})\leq (x,s_{2})

    则称未知模式向量x与样本模式向量s_{1}更相似,为了建立这种相似关系,需要定义相似度或者相异度。

    接下来介绍五种相似度。

    Euclidean距离

    最简单的且最直观的相似度是两个向量之间的Euclidean距离,未知模式向量x与第i个模式向量s_{i}之间的Euclidean距离记作D(s_{i},x),定义为:

    D(s_{i},x)=\left \| x-s_{i} \right \|_{2}=\sqrt{(x-s_{i})^{T}(x-s_{i})}

    D(s_{i},x)=minD(s_{k},x),k=1,2,.. .,M

    s_{i}\in \left \{ s _{1},s _{2},.. .,s_{M} \right \}是到x的近邻(即最近的邻居)
    近邻分类法作为一种广泛使用的分类法,它将未知类型的模式向量x归为它的近邻所属的模式类型。

    Mahalanobis距离

    除了Euclidean距离外,还有一个距离函数是Mahalanobis距离。令:
    m=\frac{1}{N}\sum_{k=1}^{N}s_{i}

    代表N个样本模式向量的均值向量,并使用

    C=\frac{1}{N}\sum_{k=1}^{N}(s_{i}-m)(s_{i}-m)^{T}

    表示N个样本模式向量的协方差矩阵

    从未知模式向量x到均值向量m之间的Mahalanobis距离定义为:
    D(m,x)=(x-m)^{T}C(x-m)

    类似地,从第i个样本模式向量s_{i}到均值向量m的Mahalanobis距离定义为:

    D(m,s_{i})=(s_{i}-m)^{T}C(s_{i}-m)

    根据近邻分类法,将未知模式变量x归为满足

    D(s_{i},x)=min|D(s_{k},x)-D(m,x)|,k=1,2,.. .,N

    的近邻s_{i}所属的模式类型。

    夹角余弦

    两个向量之间的相似度的测度不一定局限于距离函数。两个向量的夹角的余弦函数:
    S(s_{i},x)=cos(\theta _{i})=\frac{x^{T}s_{i}}{\left \| x \right \|_{2}\left \| s_{i} \right \|_{2}}

    这也是相似度的一种有效测度,若cos(\theta _{i})<cos(\theta _{j}),\forall j\neq i成立,则认为未知模式向量x与样本模式向量s_{i}最相似。

    Tanimoto测度

    Tanimoto测度:S(s_{i},x)=\frac{x^{T}s_{i}}{x^{T}x+s_{i}^{T}s_{i}+x^{T}s_{i}}

    Tanimoto测度广泛应用于信息恢复,疾病分类,动植物分类等领域。

    目标-概念距离

    待分类的信号称为目标信号,分类通常是根据某种物理或者几何概念进行的。令X为目标信号,A_{i}代表第i类目标的分类概念,于是有以下关系:

    (X,A_{i})\leqslant (X,A_{j}), \forall i,j
    这类有效关系一般用目标-概念距离D(X,A_{i})来描述,因此若目标-概念距离D(X,A_{i})最小,则将X归为第i类目标C_{i}

  • 相关阅读:
    JVM 高级面试题及答案整理,最新面试题
    【JVM】并发可达性分析-三色标记算法
    板带纠偏控制系统伺服比例阀放大器
    JSP 购物商城系统eclipse定制开发mysql数据库BS模式java编程servlet
    【仿牛客网笔记】Spring Boot实践,开发社区登录模块-显示登录信息
    为什么客户端和服务器不支持SSL协议
    【Java 进阶篇】Session 使用详解
    shopee平台现在好做吗
    MySQL数据库的简介及select语句的执行流程
    golang中出于性能考虑的那些实用代码片段 |字符串篇
  • 原文地址:https://blog.csdn.net/weixin_46007132/article/details/125507983