• 人工智能知识全面讲解:最简单的神经元模型


    2012年?,微软研究院的创始人里克·雷斯特(Rick Rashid)教授在一
    次大会做主题演讲时,展示了一套实时语音机器翻译系统。他在系统中输入一
    些英文内容,系统自动翻译成中文并且合成他的声音用中文朗读,在场观众无
    不惊叹。实际上这套实时语音翻译系统是基于神经网络算法研发的,会前雷斯
    特用自己的声音反复训练模型,在神经网络的帮助?,让模型学习他的声音,
    最终实现用机器合成他的中文声音,将以往难以想象的事情变成了现实。
    谈起神经网络,很多对它不了解的产品经理会认为这是一种很深奥、复杂
    的算法。在工作中,有机会?工程师提起这项技术也是各种调参以及网络结构
    设计,渐渐变得敬而远之。实际上神经网络是一种模仿人类思考方式的模型,
    就像飞机为了减小空气阻力,模仿鸟的形态一样,其借鉴了生物学的结构。如
    果将神经网络拆开来看,结构非常简单,它就是一种将简单结构进行组合,从
    而解决复杂问题的典型案例之一。
    神经网络(Arti?icial Neural Network)算法,是20世纪80 年代以来人
    工智能领域兴起的研究热点之一,也是当今应用最广泛的算法。无论是脸书的
    人脸识别、微软的翻译还是谷歌的搜索,背后都有神经网络的身影。神经网络
    发展到今天已经变成多学科交?的研究领域,各相关学科对神经网络的定?多
    样,目前最广泛使用的定?是托伊沃·科霍宁(Teuvo Kohonen)教授于1988
    年给出的定?,即神经网络是由具有适应性的简单单元组成的广泛并行互连的
    网络,这种结构使得它能够模拟生物神经系统对真实世界物体所做出的交互反
    应。
    上述定??起来有点拗口,表达的意思?很简单。用通俗的话讲,神经网
    络由很多个计算单元组成,每一个计算单元都有强大的计算能力。这些计算单
    元之间相互连接形成一个网状的结构,网状结构具有很强的包容性,因此这
    种设计使得神经网络具有很强大的学习能力 。
    通常我们理解的神经网络包含两种:一种是生物神经网络;一种是人工神
    经网络。人工神经网络由生物神经网络发展而来,所以在学习人工神经网络之
    前,首先我们要搞清楚生物神经网络是怎么一回事。
    一直以来科学家都在研究人脑的构造,希望有朝一日能够模拟人类思考过
    程,造出实现“自主”思考的计算机。人类为什么能够思考呢?生物学家经过
    不懈的探索终于发现,在人脑中大约有860亿个神经元,这些神经元相互联结
    构成了极其复杂的神经系统,这是人类能够思考的物质基础。
    神经元细胞主要由树突、轴突和细胞体构成,如图7-1所示。一个神经元
    有多个树突,树突用于接收其他神经元传导过来的信号,并将信号传递给细胞
    体。细胞体是神经元中的核心模块,用于处理所有的传入信号,它把各个树突
    传递过来的信号加总起来,得到一个总刺激信号。轴突是输出信号的单元,它
    有很多个轴突?梢,可以给其他神经元的树突传递信号。神经元的突触会和其
    他神经元的树突连接在一起,从而形成庞大的生物神经网络。

    神经元有两种状态,即激活状态和非激活状态。在生物神经网络中,神经
    元与神经元互相连接。当神经元处于激活状态时,就会向相连的神经元发送化
    学物质,从而改变这些神经元内的电位。如果某神经元的电位超过了一个“阈
    值”,那么它就会被激活,即该神经元“兴奋”起来,向其他神经元发送化学
    物质。

    7.1.2 神经元模型
    1943年,美国心理学家麦卡洛克(McCulloch, W. S.)和数学家皮特斯
    (Puts, W.)参考了生物神经元的结构,把神经元视为二值开关,通过不同的
    组合方式来实现不同的逻辑运算,并且将这种逻辑神经元称为二值神经元模型
    (McCulloch-Pitts Model, MP模型),结构如图7-2所示。 

    MP模型是一个包含输入、输出与计算功能的模型。可以将输入功能类比为
    神经元的树突,而将输出功能类比为神经元的轴突,计算功能则可以类比为细
    胞体。神经元接收来自其他神经元传递过来的输入信号,这些输入信号通过带
    权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,
    然后经过“激活函数”(Activation Function)的处理才能够产生神经元的
    输出 。
    在MP模型中,非线性的激活函数是整个模型的核心。在数学上的定?为,
    当函数的自变量大于某个阈值时,则等于1,否则等于0。具体的公式如?: 

    实际上MP模型的原理非常好理解,有点类似于我们学生时代的考试,把模
    型中很多个影响因素看成很多道题目的得分,不同的题目重要程度不同,我们
    对每道题的掌握程度也不同,将题目的重要程度与掌握程度相乘,就是我们这
    次考试的分数。
    通常我们考完试,老师如何评判考得好不好呢?最简单的方法就是设置一
    条阈值线,看看得分有没有超过阈值线,如果超过了就是及格了(正结果),
    即对应的输出值为1,如果没有超过就是不及格(负结果),对应的输出值
    为-1。
    很多同学不理解为什么MP模型中也需要使用激活函数,为什么不用总输出
    值直接与阈值比较,然后直接判断输出结果?原因很简单,和逻辑回归函数一
    样,如果没有激活函数,无论我们如何训练神经网络的参数,得到的模型都是
    一个线性模型,在二维空间?是一条线,在三维空间?是一个平面。而线性模
    型是有非常大的局限性的,因为在现实世界中线性模型的应用十分有限,如图
    7-3所示。

     

    激活函数能够帮助我们通过对加权的输入进行非线性组合产生非线性决策
    边界。简单理解就是将线性模型转变成非线性模型,扩大使用场景。
    接?来我们用一个例子帮助大家理解MP模型的决策过程。小李今天的工作
    比较忙,正在犹豫中午饭是与同事出去吃还是叫外卖。影响他决定的因素主要
    有如?三个方面。
    (1)工作量:今天的工作是否能在?班前完成?
    (2)同伴:有没有同事一起出去吃饭?
    (3)餐厅远近:午休时间较短,选择的餐厅距离是否合适?
    遇到这样的问题你是否马上想起了决策树算法?今天我们用另外一种思路
    来解决这个问题。值得注意的是,在决策树算法中这三个问题存在先后顺序,
    但是对于 MP 模型来说,上面三个问题是并列的,三个影响因素就是三个外部
    输入,最后小李决定去还是不去是模型的输出。如果三个问题的答案都
    是“YES”,则对应的输出值为1,即去外面吃;如果三个问题的答案都
    是“NO”,则对应的输出值为0,即点外卖。
    以上两种情况是最理想的情况,判断比较简单。但是在生活中最让人纠结
    的地方在于,有一部分因素成立,另一部分因素不成立,在这种情况?最后的
    输出会是什么呢?比如今天的工作能做完,但是没有人陪小李出去吃饭,餐厅
    也比较远。
    在我们实际考虑问题时,每个因素对我们的影响都是不同的。某些因素是
    决定性因素,有些因素是次要因素。因此可以给这些因素指定权重,表示不同
    的重要性。
    工作量:6
    同伴:2
    餐厅远近:2
    通过以上权重可以看出来,工作量是决定性因素,同伴和餐厅远近都是次
    要因素。如果三个因素的初始赋值都为 1,它们乘以权重的总和就是
    6+2+2=10。如果工作量和餐厅远近因素的初始赋值为1,同伴因素为0,则总和
    就变为6+0+2=8。
    最后,我们还需要指定一个阈值。如果总和大于阈值,模型输出1,否则
    输出0。假定阈值为7,那么当总和超过7时表示小李决定出去吃饭,当总和小
    于7时表示小李决定叫外卖。
    以上就是一个MP模型的直观解释。1943年发布的MP模型,虽然简单小巧,
    但已经建立了神经网络大厦的地基。MP模型最大的缺陷在于,权重的值都是预
    先设置的,模型没有办法根据数据的情况进行学习,这让当时的研究人员意识
    到,MP模型与人类真正的思考方式仍然有很大区别。直到心理学家唐纳德·赫
    布(Donald Olding Hebb)经过研究后指出,人脑神经细胞的连接的强度是可
    以变化的,于是科学家们开始考虑用调整权值的方法让机器学习,这为后面的
    神经网络算法奠定了基础。 

  • 相关阅读:
    使用 RAG、Langchain 和 Streamlit 制作用于文档问答的 AI 聊天机器人
    如何制作有专业水准的的电子杂志:专家教你秘籍
    vue与安卓原生定位的交互
    神经网络权重初始化方法,神经网络如何训练权重
    Spring框架系列(7) - Spring IOC实现原理详解之IOC初始化流程
    OpenAI Assistants-API简明教程
    Qt | UDP广播通信、简单使用案例
    NVIDIA基于Code Llama发布在线版本Llama,人人可以免费使用
    又一个阿里云盘资源搜索引擎实现效果展示
    1.1 大数据简介-hadoop-最全最完整的保姆级的java大数据学习资料
  • 原文地址:https://blog.csdn.net/tysonchiu/article/details/125485696