码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。


    在这里插入图片描述

    项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身的硬实力。

    在这里插入图片描述

    1. 专栏订阅:项目大全提升自身的硬实力

    2. [专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域)

    电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。

    1.项目介绍

    1、阿里指数 是了解电子商务平台市场动向的数据分析平台,2012年11月26日,阿里指数正式上线。根据阿里巴巴网站每日运营的基本数据包括每天网站浏览量、每天浏览的人次、每天新增供求产品数、新增公司数和产品数这5项指标统计计算得出。
    2、阿里指数对于收录的商品关键词,在指数方面提供阿里商品指数抓取,包括淘宝采购指数,淘宝供应指数,1688供应指数三个指数,基于三个指数,可以在一定程度上反映出该商品的供需行情,与商品的价格相比,能够得出一些相关性的结论。

    2.项目举例

    以‘连衣裙’这一商品关键词为例,要求获取连衣裙的三个指数数据。由于阿里指数至提供近一年的指数数据,因此,只能采集一年的数据,原始结果如下:

    3.实现流程

     def index_main(self, word):
            print('step1, open page....')
            #使用selenium,打开页面,获取指数数据所在页面
            page_source = self.search_index(word)
            print('step2, get data....')
            #解析原网页,获取purchase_index_1688, supply_index, purchase_index_tb
            purchase_index_1688, supply_index, purchase_index_tb = self.data_parser(page_source)
            #以本地文件的方式保存结果,分别写入到purchase_index_1688, supply_index, purchase_index_tb三个文件中
            self.output_data(word, purchase_index_1688, supply_index, purchase_index_tb)
            print('step3, %s finished....'% word)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    4.执行

     def demo():
             ali = AliIndex()
             search_word = '连衣裙'
             ali.index_main(search_word)
         demo()
         
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    5.效果展示

    将得到的数据文件,进行本地可视化,效果如下:

    7.总结

    1、阿里指数的采集较为简单,1)阿里指数直接将历时数据写在前端页面中,可以直接解析获得。2)无需用户登录。
    2、阿里指数与百度指数不同,其对应的关键词实体需要对应到具体的行业或商品上,而用户查询的关键词具有多样性,这样会导致可能无法正确获取严格的关键词商品指数,如搜索iphone,会得到电子产品的指数。
    3、比较遗憾的是,阿里指数只提供以查询当日为结束如日,往前推一年为开始日期的数据,对于历时数据的构建来说,不是太方便。

    码源链接见文章顶部or文末

    https://download.csdn.net/download/sinat_39620217/88000980

  • 相关阅读:
    嵌入式Linux driver开发实操(二十二):写一个ALSA驱动程序
    Window下安装 Mongodb,并实现单点事务
    设置QCheckbox 样式的注意事项
    数据库实验报告(二)
    【poi 看这一篇就够了!!!】使用poi导出定制excle表格
    Java练手任务总结【20】
    Golang JWT 认证 (三)-添加token自动刷新机制
    网页转长图插件html2canvas【前端】
    Python写猜数游戏
    Qt编译数据库插件通用步骤说明
  • 原文地址:https://blog.csdn.net/sinat_39620217/article/details/131975141
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号