• Python_豆瓣电影&保存excel


     实现效果如图: 


      源码如下:

    1. import requests
    2. import json
    3. # Excel自动化第三方库
    4. import xlwt
    5. # UA-伪装
    6. headers = {
    7. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'
    8. }
    9. def Creat_Excel():
    10. # 创建工作簿
    11. global excel
    12. excel = xlwt.Workbook()
    13. # 添加一个工作表:纪录片
    14. global sheet
    15. sheet = excel.add_sheet('纪录片')
    16. # 在纪录片上的第0行上逐列写排行
    17. sheet.write(0, 0, '评分')
    18. sheet.write(0, 1, '排行')
    19. sheet.write(0, 2, '网址')
    20. sheet.write(0, 3, '类型')
    21. sheet.write(0, 4, '国籍')
    22. sheet.write(0, 5, '电影名')
    23. sheet.write(0, 6, '发布日期')
    24. sheet.write(0, 7, '演员')
    25. def Crawl(page,line):
    26. url = 'https://movie.douban.com/j/chart/top_list?'
    27. # url参数
    28. param = {
    29. 'type': '1',
    30. 'interval_id': '100:90',
    31. 'action': '',
    32. 'start': page,
    33. 'limit': '20',
    34. }
    35. response = requests.get(url=url, params=param, headers=headers)
    36. li_data = json.loads(response.text)
    37. for i in li_data:
    38. # 数据的提取
    39. score = i['score']
    40. rank = str(i['rank'])
    41. url = i['url']
    42. types = ','.join(i['types'])
    43. regions = ','.join(i['regions'])
    44. title = i['title']
    45. release_date = i['release_date']
    46. actors = ','.join(i['actors'])
    47. # 逐列写入Excel表格
    48. sheet.write(line, 0, score)
    49. sheet.write(line, 1, rank)
    50. sheet.write(line, 2, url)
    51. sheet.write(line, 3, types)
    52. sheet.write(line, 4, regions)
    53. sheet.write(line, 5, title)
    54. sheet.write(line, 6, release_date)
    55. sheet.write(line, 7, actors)
    56. line += 1 # 换行
    57. print(score, rank, url, types, regions, title, release_date, actors)
    58. # excel保存
    59. excel.save('D:/pycharm_pro/爬虫/My_Demo/豆瓣排行.xls')
    60. # print('page=%d' % page)
    61. if __name__ == '__main__':
    62. # 创建Excel文件
    63. Creat_Excel()
    64. page = 0 #起始页
    65. line = 1 #起始行
    66. for i in range(5):
    67. Crawl(page,line)
    68. page+=20
    69. line+=20

  • 相关阅读:
    C/C++教程 从入门到精通《第十七章》—— MFC开发多人聊天室
    NGINX重写功能和防盗链
    C# 键盘事件 输入焦点
    动态路由的主流算法
    RTC实验
    如何在Spring Boot应用中进行文件预览?
    图像分类(四) 全面解读复现GoogleNet_InceptionV1-V4
    LangChain实战技巧之五:让模型“自动生成”Prompt(提示词)的两种方式
    win11家庭版docker和milvus
    2021了,真的不要再说 Node.js 是一门编程语言了
  • 原文地址:https://blog.csdn.net/m0_65592409/article/details/126915883