• 天天基金股票数据爬取


    在这里插入图片描述
    爬取的数据有1.67MB,共有10000个股票信息
    在这里插入图片描述
    需要找到自己cookie

    import requests
    import csv
    import re
    with open('天天基金.csv',mode='w',encoding='gbk') as f:
            csv_writer = csv.writer(f)
            #随机应变,表头有一点问题,自己对着网站抄
            csv_writer.writerow(['基金代码', '基金简称', '缩写', 'NUll', '单位净值', '累计净值','日增长率','近一周增长率','近一月增长率','近三月增长率','近6月增长率','近一年增长率','近二年','近三年','今年来','成立来','手续费'])
    headers={
        'Cookie':'',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36',
        'Referer': 'http://fund.eastmoney.com/data/fundranking.html'
    }
    for i in range(1,235):
        url=f'http://fund.eastmoney.com/data/rankhandler.aspx?op=ph&dt=kf&ft=all&rs=&gs=0&sc=1nzf&st=desc&sd=2021-08-22&ed=2022-08-22&qdii=&tabSubtype=,,,,,&pi={i}&pn=50&dx=1&v=0.21684709669373903'
        response=requests.get(url=url,headers=headers)
        text=response.text
        #解析数据
        # print(text)
        datas=re.findall('datas:\[(.*?)\]',text)[0]
        datas=eval(datas)
        #字符串转为数组或者元组
        print(datas)
        for data in datas:
            print(data)
            with open('天天基金.csv',mode='a',encoding='gbk',newline='\n',)as f:
                f.write(data)
                f.write('\n')
    
    
    
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31

    用自己的COOkie我那里是空的

  • 相关阅读:
    java 集合stream流 详解
    Java/Android设计模式学习笔记
    程序员公司合作保密协议
    Java性能优化(详解)
    手把手教你搭建zookeeper和kafka集群(超级详细)
    顺序表练习
    el-tree设置节点默认选中并高亮效果
    要学习使用 calib3D 模块在图像中创建 3D 效果-姿势估计
    MySQL-视图
    Flask安装
  • 原文地址:https://blog.csdn.net/qq_54423921/article/details/126464541