码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • python 数据挖掘库orange3 介绍


    orange3 是一个非常适合初学者的data mining library. 它让使用者通过拖拽内置的组件来形成工作流。让你不需要写任何代码就可以体验到数据挖掘和可视化的魅力。

    它的桌面如下,这里我创建了 3 个节点,分别是数据集、小提琴图,散点图
    在这里插入图片描述

    其中 Datasets 是从 左边的 Data 组件库中拖拽过来的,Datasets 是 orange3 内置的数据集,比如非常常用的iris(鸢尾花) 数据集。双击桌面上的 Datasets 就能选择不同的数据集来作为下一步的数据来源。
    数据集
    点击左下角的预览按钮,可以像 excel 一样预览这个数据集

    可视化

    先看一下散点图, x 轴选择了 sepal(花萼长度), y轴是 花的类别,可以看出,相关性并不是很强,有很大一段x 轴的区域,三种类别都有可能。

    在这里插入图片描述
    我们换一个 x 轴,选择 petal length (花瓣长度),发现相关性很大,基本上很容易区分开
    在这里插入图片描述

    小提琴图

    小提琴图主要表现的是某个特征的分布情况。下图表现了三种花的 petal length 分布,可以看出蓝色的 Iris-setosa 分布的比较集中,而且与其他的类别没有重叠。
    这意味着,当你看看到一株 petal length(花瓣长度) 小于2.5的时候,几乎可以断定它属于setosa属

    有趣的是,至于花萼(sepal)的宽度,setosa属比起其它属看起来却趋向于长尾分布(小提琴更窄),说明它的分布范围随机性更大。
    在这里插入图片描述
    再看一个热力图
    请添加图片描述
    可以看出三种花(x轴的三个颜色) 中,y 轴是四个属性, Iris-setosa 的petal length 这个属性明显和其它两种有区别,可以作为一个直观的区分属性。

  • 相关阅读:
    Java实习生常规技术面试题每日十题Java基础(五)
    LeetCode 2007. 从双倍数组中还原原数组
    反射型XSS实验(1)
    将光耦合进入单模光纤的最佳工作距离
    在项目中,关于前端实现数据可视化的技术选择
    音视频 RED 与 FEC 的 RTP 格式封装
    python工具方法37 voc数据统计分析(box聚类、box散点图、类别频率统计、box面积统计)
    django中orm定义数据库表字段的几种字段类型
    文件传输客户端 SecureFX mac中文版支持多种协议
    Python基础_第4章_Python数据序列(容器)
  • 原文地址:https://blog.csdn.net/richard_m_yang/article/details/134183497
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号