码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 机器学习(公式推导与代码实现)--sklearn机器学习库


    一.scikit-learn概述

    1.sklearn模型

      sklearn全称是scikit-learn,它是一个基于Python的机器学习类库,主要建立在NumPy、Pandas、SciPy和Matplotlib等类库之上,基本上覆盖了常见了分类、回归、聚类、降维、模型选择和预处理模块。

    2.sklearn源码

    下图是sklearn在GitHub上的源代码,编程语言主要包括:91.4%的Python,6.5%的Cython,1.3%的C++和0.8%的Other。如下所示:

    二.模型选择和预处理

    1.模型选择
    解析:网格搜索,交叉验证
    2.预处理
    解析:评估指标,数据预处理

    三.有监督学习模型

      可以将有监督模型分为生成式模型和判别式模型,常见的生成式模型包括朴素贝叶斯、HMM和隐含狄利克雷分配(LDA),其它的基本都是判别式模型。
    1.线性模型
    解析:线性回归,对数几率回归,LASSO回归,Ridge回归,线性判别分析(LDA)
    2.k" role="presentation" style="position: relative;">kk近邻
    3.决策树
    解析:ID3,C4.5,CART
    4.神经网络
    解析:感知机,神经网络
    5.支持向量机
    解析:线性可分,近似线性可分,线性不可分
    6.集成模型
    (1)Boosting
    解析:AdaBoost,GBDT,XGBoost,LightGBM,CatBoost
    (2)Bagging
    解析:随机森林

    四.无监督学习模型

    1.聚类
    解析:k" role="presentation" style="position: relative;">kk均值聚类,层次聚类,谱聚类
    2.降维
    解析:主成分分析(PCA),奇异值分解(SVD)

    五.概率模型

    1.最大信息熵模型
    2.贝叶斯概率模型
    解析:朴素贝叶斯,贝叶斯网络
    3.期望最大化(EM)算法
    4.概率图模型
    解析:隐马尔科夫模型(HMM),条件随机场(CRF)
    5.马尔可夫链蒙特卡洛(MCMC)

    参考文献:
    [1]scikit-learn:https://scikit-learn.org/stable/
    [2]scikit-learn(sklearn)官方文档中文版:https://sklearn.apachecn.org/#/?id=scikit-learn-sklearn-官方文档中文版
    [3]scikit-learn安装:https://scikit-learn.org/stable/install.html
    [4]scikit-learn用户指南:https://scikit-learn.org/stable/user_guide.html
    [5]scikit-learn API参考:https://scikit-learn.org/stable/modules/classes.html
    [6]scikit-learn例子:https://scikit-learn.org/stable/auto_examples/index.html
    [7]scikit-learn博客:https://blog.scikit-learn.org/
    [8]scikit-learn教程:https://scikit-learn.org/stable/tutorial/index.html
    [9]scikit-learn FAQ:https://scikit-learn.org/stable/faq.html
    [10]scikit-learn GitHub:https://github.com/scikit-learn/scikit-learn
    [11]scikit-learn不同版本文档:https://scikit-learn.org/dev/versions.html
    [12]scikit-learn wiki:https://github.com/scikit-learn/scikit-learn/wiki
    [13]scikit-learn版本更新日志:https://scikit-learn.org/stable/whats_new/v1.1.html
    [14]scikit-learn开发指南:https://scikit-learn.org/dev/developers/index.html
    [15]scikit-learn相关类库:https://scikit-learn.org/stable/related_projects.html
    [16]Hugging Face:https://huggingface.co/
    [17]《机器学习:公式推导与代码实现》

  • 相关阅读:
    差分矩阵 C++实现
    HTB-Curling
    商业智能BI开发和报表开发有什么本质区别?
    计算机网络自学笔记004_Real(数据链路层002)
    Android 组件逻辑漏洞漫谈
    SpringBoot集成文件 - 如何基于POI-tl和word模板导出庞大的Word文件?
    cocos2d-x引擎基础使用(1)--整体架构
    Hive SQL案例
    69. x 的平方根
    [BJDCTF2020]Mark loves cat-1|源代码泄露|变量覆盖
  • 原文地址:https://www.cnblogs.com/shengshengwang/p/16545743.html
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号