码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Python数据分析与机器学习34-DBSCAN实例


    文章目录

    • 一. 数据源介绍
    • 二. 使用DBSCAN进行聚类
    • 参考:

    一. 数据源介绍

    数据源:
    一个啤酒的数据源,为了方便演示,数据只有20行。
    image.png

    • name 啤酒的名称
    • calories 啤酒的卡路里
    • sodium 纳元素含量
    • alcohol 酒精含量
    • cost 价格

    二. 使用DBSCAN进行聚类

    代码:

    import pandas as pd
    from sklearn.cluster import DBSCAN
    from pandas.plotting import scatter_matrix
    import matplotlib.pyplot as plt
    import numpy as np
    from sklearn.preprocessing import StandardScaler
    from sklearn import metrics
    
    
    # 读取数据源
    beer = pd.read_csv('E:/file/data.txt', sep=' ')
    X = beer[["calories","sodium","alcohol","cost"]]
    
    # 训练数据源
    db = DBSCAN(eps=10, min_samples=2).fit(X)
    
    # 加上标签
    labels = db.labels_
    beer['cluster_db'] = labels
    beer.sort_values('cluster_db')
    
    # 画图
    colors = np.array(['red', 'green', 'blue', 'yellow'])
    pd.scatter_matrix(X, c=colors[beer.cluster_db], figsize=(10,10), s=100)
    plt.show()
    
    # 验证模型效果
    score_scaled = metrics.silhouette_score(X,beer.cluster_db)
    print("使用DBSCAN的模型效果:")
    print(score_scaled)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30

    测试记录:
    使用DBSCAN的模型效果:
    0.49530955296776086
    image.png

    分析:
    从评分及可视化效果来看,聚类效果不理想,不如K-Means效果。
    对于样本集复杂的使用DBSCAN。
    对于样本集简单的直接使用K-Means即可。

    参考:

    1. https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1
  • 相关阅读:
    美容院拓客活动方案多套
    【django+vue】项目搭建、解决跨域访问
    信息学奥赛一本通:陶陶把手伸直的时候能够达到的最大高度
    看神州数码如何借助连接型CRM打破数据孤岛,让多系统发挥价值
    华为防火墙:GRE over IPSec
    Unicode编码
    Three.js Shader 与自定义材质—深入理解与应用
    NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM的原理和差异有哪些-详细解读
    Unity设计模式——装饰模式
    Java中配置RabbitMQ基本步骤
  • 原文地址:https://blog.csdn.net/u010520724/article/details/126029904
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号