码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【毕业设计】大数据分析的客户细分 (聚类分析) - python k-means


    文章目录

    • 0 前言
    • 1 数据分析步骤
    • 2 数据观察与预处理
      • 2.1 引入库
      • 2.2 查看数据
      • 2.3 数据可视化
        • 2.3.1 查看数据分布
        • 2.3.2 单独查看直方图分布
        • 2.3.3 样本数据中的性别比
        • 2.3.4 年龄与年收入之间的关系
        • 2.3.5 年龄与消费得分之间的关系
        • 2.3 6 年龄与消费得分与年收入之间的分布
    • 3 kmeans聚类分析
    • 4 最后


    0 前言

    🔥 Hi,大家好,这里是丹成学长的毕设系列文章!

    🔥 对毕设有任何疑问都可以问学长哦!

    这两年开始,各个学校对毕设的要求越来越高,难度也越来越大… 毕业设计耗费时间,耗费精力,甚至有些题目即使是专业的老师或者硕士生也需要很长时间,所以一旦发现问题,一定要提前准备,避免到后面措手不及,草草了事。

    为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天要分享的新项目是

    🚩 基于大数据挖掘分析的客户细分 (k-means 聚类分析)

    🥇学长这里给一个题目综合评分(每项满分5分)

    • 难度系数:4分
    • 工作量:4分
    • 创新点:3分

    🧿 选题指导, 项目分享:

    https://gitee.com/yaa-dc/BJH/blob/master/gg/cc/README.md

    1 数据分析步骤

    • 1、导入必要的库
    • 2、了解数据
    • 3、数据可视化
    • 4、使用k-means 进行聚类分析

    2 数据观察与预处理

    2.1 引入库

    import numpy as np 
    import pandas as pd 
    import matplotlib.pyplot as plt
    %matplotlib inline
    import seaborn as sns
    plt.style.use('fivethirtyeight')
    
    from sklearn.cluster import KMeans
    import plotly as py
    import plotly.graph_objects as go
    import warnings
    import os
    warnings.filterwarnings('ignore')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    2.2 查看数据

    df=pd.read_csv('/home/kesci/input/1564558710/超市数据.csv')
    df.head()
    
    • 1
    • 2

    在这里插入图片描述
    在这里插入图片描述

    2.3 数据可视化

    2.3.1 查看数据分布

    在这里插入图片描述

    2.3.2 单独查看直方图分布

    在这里插入图片描述

    2.3.3 样本数据中的性别比

    在这里插入图片描述

    2.3.4 年龄与年收入之间的关系

    在这里插入图片描述

    2.3.5 年龄与消费得分之间的关系

    在这里插入图片描述

    2.3 6 年龄与消费得分与年收入之间的分布

    在这里插入图片描述

    3 kmeans聚类分析

    x1=df[['Age','Spending Score (1-100)']].iloc[:,:].values
    from sklearn.cluster import KMeans
    inertia=[]
    for i in range(1,11):  
        km=KMeans(n_clusters=i,init='k-means++',max_iter=300,n_init=10,random_state=100)
        km.fit(x1)
        inertia.append(km.inertia_)
    plt.figure(1,figsize=(12,6))    
    plt.plot(range(1,11),inertia)
    plt.title('The Elbow Method',fontsize=20)
    plt.xlabel('Number of Clusters')
    plt.ylabel('inertia')
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    在这里插入图片描述

    km = KMeans(n_clusters = 4, init = 'k-means++', max_iter = 300, n_init = 10, random_state = 100)
    y_means = km.fit_predict(x1)
    
    plt.figure(1 , figsize = (12 , 6) )
    plt.scatter(x1[y_means == 0, 0], x1[y_means == 0, 1], s = 200, c = 'salmon')
    plt.scatter(x1[y_means == 1, 0], x1[y_means == 1, 1], s = 200, c = 'yellowgreen') 
    plt.scatter(x1[y_means == 2, 0], x1[y_means == 2, 1], s = 200, c = 'cornflowerblue')
    plt.scatter(x1[y_means == 3, 0], x1[y_means == 3, 1], s = 200, c = 'magenta')
    plt.scatter(km.cluster_centers_[:,0], km.cluster_centers_[:, 1], s = 100, c = 'black' , label = 'centeroid')
    
    plt.ylabel('Spending Score (1-100)') , plt.xlabel('Age')
    plt.legend()
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    在这里插入图片描述
    映射到三维空间上的分布如下:
    在这里插入图片描述

    4 最后

  • 相关阅读:
    MasaFramework的MinimalAPI设计
    iconfont 中图标以及字体库在页面中的引用
    友盟+|如何通过阿里云Flink+Paimon实现流式湖仓落地方案
    Web中的相对路径和绝对路径、斜杠在Web中的不同意义
    判断input标签的type类型为checkbox是否被选中
    数据结构与算法_AVL平衡二叉树_四种旋转,插入和删除
    Avalonia 实现聊天消息渲染、图文混排(支持Windows、Linux、信创国产OS)
    SQL Server 2019 安装
    92倒计时自律习惯养成计划打卡-day8
    Spring AOP注解开发详解
  • 原文地址:https://blog.csdn.net/caxiou/article/details/127862550
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号