• 点乘和余弦相似度


    点乘(Dot Product)和余弦相似度(Cosine Similarity)都是用于比较两个向量之间的相似性的度量方法,常用于各种数据分析和机器学习任务中。以下是它们的详细说明:

    ### 点乘(Dot Product):

    点乘也称为内积,是两个向量之间的数学运算,它将两个向量的对应元素相乘,并将结果相加。对于两个向量 $A$ 和 $B$,它们的点乘表示为:

    AB=ni=1AiBi

    其中,$n$ 表示向量的维度,$A_i$ 和 $B_i$ 分别表示向量 $A$ 和 $B$ 中的第 $i$ 个元素。

    点乘的计算结果是一个标量(单个数字),它可以用来度量两个向量在同一方向上的相似性。如果两个向量的点乘结果越大,表示它们在同一方向上更相似;如果点乘结果为零,表示它们垂直于彼此;如果点乘结果为负值,表示它们在相反方向上。

    ### 余弦相似度(Cosine Similarity):

    余弦相似度是用于比较两个向量之间的夹角的一种相似性度量。它衡量了两个向量在多维空间中的方向相似性,而不是幅度或长度相似性。余弦相似度通常用于度量向量之间的夹角余弦值。

    余弦相似度的计算如下:

    Cosine Similarity(A,B)=ABAB

    其中,$A \cdot B$ 表示向量 $A$ 和 $B$ 的点乘,$\|A\|$ 和 $\|B\|$ 分别表示向量 $A$ 和 $B$ 的模(长度)。

    余弦相似度的结果范围在 -1 到 1 之间,其中:
    - 如果余弦相似度接近 1,表示两个向量在相似的方向上;夹角接近 0 度。
    - 如果余弦相似度为 0,表示两个向量垂直(夹角 90 度)。
    - 如果余弦相似度接近 -1,表示两个向量在相反的方向上;夹角接近 180 度。

    ### 应用:

    - 点乘通常用于计算两个向量在相同方向上的相似性,特别适用于推荐系统中的协同过滤。
    - 余弦相似度通常用于文本相似性、图像处理、自然语言处理中的文档检索、文本分类、文本聚类等任务,以及在推荐系统中计算用户兴趣的相似性。

    总之,点乘和余弦相似度都是用于度量向量之间相似性的有用工具,但它们关注的方面略有不同,适用于不同的应用领域。

  • 相关阅读:
    ctfhub-web-warmup
    查看及测试网络
    链表(1)
    词云图大揭秘:如何从文本中挖掘热点词汇?
    ReentrantLock源码浅析
    Python tkinter-- 第16章 菜单(Menu)属性
    代码随想录算法训练营Day59 | 503.下一个更大元素II 42. 接雨水
    leetcode-1678-设计 Goal 解析器(简单,基本逻辑)
    part_two:多媒体软硬件平台技术
    从代码层面分析STM32 标准库和HAL库的差异
  • 原文地址:https://blog.csdn.net/qq_44154915/article/details/133972991