码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • nodejs 爬虫 axios 异步爬虫 教程 【一】


    axios 自定义headers

    1. axios.defaults.headers.common["User-Agent"] =
    2.   "Googlebot/2.1 (+http://www.google.com/bot.html)";

    运行环境:

     node :v18

    1. const axios = require("axios");
    2. axios.defaults.headers.common["User-Agent"] =
    3. "Googlebot/2.1 (+http://www.google.com/bot.html)";
    4. async function crawler() {
    5. try {
    6. let task = [];
    7. console.log(new Date().getTime());
    8. console.time("run");
    9. for (let i = 1; i < 100; i++) {
    10. const url = `https://licai.cofool.com/ask/new-${i}.html`;
    11. const response = await axios.get(url);
    12. task.push(response);
    13. }
    14. const result = await Promise.all(task);
    15. for (let item of result) {
    16. ret_obj = item.data.length;
    17. console.log(ret_obj);
    18. }
    19. console.timeEnd("run");
    20. console.log(new Date().getTime());
    21. } catch (error) {
    22. console.error(error);
    23. }
    24. }
    25. for (let j = 0;; j++) {
    26. crawler();
    27. }

    程序不断遍历翻页url,从第一页到100页。然后是一个死循环。 要控制次数,可以在最后一行修改:

    1. for (let j = 0; j<100; j++) {
    2. crawler();
    3. }

    程序没有做解析html的功能,首先调试通过后,会输出获取的html的文档大小。

    下一节课我们会带大家去解析html的内容。

  • 相关阅读:
    第四章 流程编排
    【ES6】阮一峰ES6学习(四) 对象的扩展
    Python中安装Beautiful Soup库及其相关解析器的方法2-1
    基于STM32单片机的篮球计时记分器proteus仿真原理图PCB
    计算机毕业设计Java足球青训俱乐部管理后台系统(源码+系统+mysql数据库+Lw文档)
    小侃设计模式(六)-适配器模式
    三层架构与web结合图解
    利用pytorch 模型载入部分权重
    音乐播放器VHDL蜂鸣器数码管显示简谱,视频/代码
    emqx broker安装
  • 原文地址:https://blog.csdn.net/yagamil/article/details/132779313
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号