码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 《机器学习实战》笔记


    《机器学习实战》笔记一:K近邻 KNN

      • K近邻算法概述:工作原理,一般流程;

      • KNN示例:加载数据,分析数据,数据归一化,定义KNN算法,划分数据集,训练测试,使用算法构建完整可用系统;

    《机器学习实战》笔记二:决策树

      • 决策树构造:伪代码,一般流程,信息增益,划分数据集,递归构造决策树;

      • 测试和存储决策树:使用决策树执行分类,决策树存储;

    《机器学习实战》笔记三:朴素贝叶斯

      • 基于贝叶斯决策理论的分类方法:贝叶斯准则,使用条件概率进行分类;

      • 使用朴素贝叶斯进行文档分类:朴素贝叶斯一般过程,假设条件;

      • 使用Python进行文本分类:从文本中构建词向量,从词向量中计算概率,根据现实情况修改分类器,文档词袋模型;

      • 示例:使用朴素贝叶斯过滤垃圾邮件;

    《机器学习实战》笔记四:逻辑回归

      • 逻辑回归一般过程;

      • 基于逻辑回归和Sigmod函数的分类;

      • 基于最优化方法的最佳回归系数确定:梯度上升法,使用梯度上升寻找最佳参数,绘制决策边界,随机梯度上升,处理数据中的缺失值的方法,模型预测;

    《机器学习实战》笔记五:支持向量机 SVM

      • 基于最大间隔分隔数据;

      • 寻找最大间隔;

      • SMO高效优化算法:SMO算法,应用简版SMO算法处理小规模数据集;

    《机器学习实战》笔记六:AdaBoost 自适应提升树

      • 基于数据集多重采样的分类器:集成方法的多种形式,bagging,boosting,Adaboost算法流程;

      • 基于单层决策树构建弱分类器:构建数据集,构建单层决策树;

      • 完整Adaboost实现;

      • 基于Adaboost的分类;

      • 在马疝病数据集上应用AdaBoost:加载数据;训练集训练Adaboost,测试集预测,观察随着分类器的个数的增加,算法的训练和测试效果;

      • 非均衡分类问题:其他分类性能度量指标(正确率、召回率、ROC曲线),基于代价函数的分类器决策控制,处理非均衡问题的数据抽样方法(欠采样,过采样);

    《机器学习实战》笔记七:线性回归

      • 用线性回归找到最佳拟合直线:回归的一般方法,最小二乘法求解回归方程,python实现线性回归;

      • 局部加权线性回归:训练,测试,评估拟合效果;

      • 缩减数据来理解数据:岭回归;Lasso回归,前向逐步回归;

      • 权衡偏差与方差:

    《机器学习实战》笔记八:树回归

      • 树回归:优点,缺点,一般流程;

      • 将CART算法用于回归:加载数据,查看数据分布,二元切分法,构建数据集切分函数,构建回归树,查看切分后数据集分布,测试其他数据集;

      • 树剪枝:预剪枝,后剪枝;

      • 模型树:分段线性数据集,模型树的叶节点生成函数,生成模型树,绘制数据集划分边界,使用模型树对新数据集进行预测;

    《机器学习实战》笔记九:K-means聚类

      • K-means算法:工作流程,伪代码,一般流程,加载数据,构建k-means支持函数,构建k-means算法,查看簇分布;

      • 使用后处理提升聚类性能:如何才能直到生成的簇比较好?k选择多少才合适?

      • 二分k-means算法:加载数据,构建二分k-means算法,查看树分布;

    《机器学习实战》笔记十:Apriori 关联分析

      • 关联分析:频繁项集,关联规则,支持度,可信度或置信度;

      • Apriori原理:一般过程,Apriori原理;

      • 使用 Apriori 算法来发现频繁项集:生成候选项集,组织完整的Apriori算法;

      • 从频繁项集中挖掘关联规则:可信度,一个频繁项集可以产生多少条关联规则,生成关联规则,示例:发现毒蘑菇的相似特征;

    《机器学习实战》笔记十一:使用 FP-growth 算法来高效发现频繁项集

      • FP树用于编码数据集的有效方式:FP树,FP树示例说明,FP-growth 算法工作流程,FP-growth 一般流程;

      • 构建FP树:FP树类的定义,构建FP树;

      • 从一棵FP树中挖掘频繁项集:抽取条件模式基,创建条件 FP 树;

    《机器学习实战》笔记十二:PCA 主成分分析

      • 降维技术:主成分分析,因子分析,独立成分分析;

      • PCA:移动坐标系,在 numpy 中实现 PCA(数据准备,PCA 算法),示例:利用 PCA 对半导体制造数据降维(加载数据,使用 PCA 对数据降维,分析特征值结果,绘制总方差的百分比);

    《机器学习实战》笔记十三:SVD 奇异值分解

      • SVD的应用:隐性语义索引,推荐系统;

      • 矩阵分解;

      • 利用 Python 实现 SVD:使用numpy直接对矩阵进行奇异值分解,在更大的数据集上进行更多的分解,使用奇异值信息重构原始矩阵;

      • 基于协同过滤的推荐引擎:相似度计算,基于物品的相似度还是基于用户的相似度,推荐引擎评价;

      • 示例:餐馆菜肴推荐引擎:推荐未尝过的菜肴,利用 SVD 提高推荐的效果,构建推荐引擎面临的挑战;

      • 基于 SVD 的图像压缩;

  • 相关阅读:
    电子印章怎么弄?三步教你电子印章在线生成免费教程!
    连续仨月霸占牛客榜首,京东T8呕心巨作:700页JVM虚拟机实战手册
    深入Linux:权限管理与常用命令详解
    【Java八股文总结】之Redis数据库
    PHP笔记-->读取JSON数据以及获取读取到的JSON里边的数据
    JDK8中HashMap底层源码解析-put和putVal方法以及数组下标的计算方式
    面向C++模块的开源 IFC SDK
    Axure基础详解二十二:随机点名效果
    netcore Polly.Core
    分类预测 | MATLAB实现POA-CNN鹈鹕算法优化卷积神经网络多特征分类预测
  • 原文地址:https://blog.csdn.net/OnePiece_97/article/details/133161952
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号