• CSDN21天学习挑战赛 - 第五篇打卡文章


    活动地址:CSDN21天学习挑战赛

    学习日记

    1. 为什么要学习爬虫?
      对于个人:
      在浏宽到一些优秀的让人血脉喷张的图片时.总想保存起来留为日后做桌面上的壁纸。
      在浏宽到一些重要的数据时(各行各业),希望保留下来日后为自己进行各种销售行为增光添彩。
      在浏览到一些奇奇怪怪的劲爆视频时,希望保存在硬盘里供日后慢慢品鉴。
      在浏览到一些十分优秀的歌声曲目时,希望保存下来供我们在烦闷的生活中增添一份精彩。
      对于爬虫工程师:
      公司数据需求
      数据分析
      智能产品练习数据
    2. 爬虫与Python
      爬虫一定要用Python么?非也~用Java也行,C也可以。请各位记住,编程语言只是工具.抓到数据是你的目的用什么工具去达到你的目的都是可以的。和吃饭样,可以用叉子也可以用筷子,最终的结果都是你能吃到饭。那为什么大多数人喜欢用Python呢?答案:因为Python写爬虫简单。不理解?问:为什么吃米饭不用刀叉?用筷子?因为简单好用!
      而Python是众多编程语言中,小白上手最快,语法最简单,更重要的是,这货有非常多的关于爬虫能用到的第三方支持库说直白点儿就是你用筷子吃饭,我还附送你一个佣人帮你吃!这样吃的是不是更卖了。更容易了~
    3. 爬虫合法吗?
      首先,爬虫在法律上是不被禁止的。也就是说法律是允许爬虫存在的但是,爬虫也具有违法风险的就像菜刀一样,法律是允许菜刀的存在的。但是你要是用来砍人,那对不起,没人惯着你就像王欣说过的,技术是无罪的。主要看你用它来干嘛比方说有些人就利用爬虫+一些黑客技术每秒钟对着bb橹上十万八千次那这个肯定是不被允许的。
      爬虫分为善意的爬虫和恶意的爬虫:
      善意的爬虫:不破坏被爬取的网站的资源(正常访问,一般频率不高,不窃取用户隐私)·恶意的爬虫:影响网站的正常运营(抢票,秒杀疯狂solo网站资源造成网站宕机)
      综上,为了避免进橘子我们还是要安分守已时常优化自己的爬虫程序避免干扰到网站的正常运行,井且在使用爬取到的数据时,发现涉及到用户隐私和商业机密等敏感内容时,一定要及时终止爬取和传播。

  • 相关阅读:
    低/无代码开发系统集成能力有多强?一文告诉你
    【计算机毕设案例推荐】高校学术研讨信息管理系统小程序SpringBoot+Vue+小程序
    【C++入门】字符串string类使用
    系列八、四大垃圾算法pk
    安装插件时Vscode XHR Failed 报错ERR_CERT_AUTHORITY_INVALID
    县域电商数字化转型
    基于 Glibc 版本升级的 DolphinDB 数据查询性能优化实践
    若依(ruoyi)之thymeleaf与jsp共存解决方案
    【精通内核】Linux内核自旋锁实现原理与源码解析
    汽车IVI中控开发入门及进阶(三十二):i.MX linux开发之Yocto
  • 原文地址:https://blog.csdn.net/weixin_44120025/article/details/126317980