码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 知乎备份计划


    知乎备份计划

    • date: 2022-08-07
    • lastmod: 2022-08-07

    知乎助手

    基于node&typescript重写知乎助手 YaoZeyuan/zhihuhelp,文章、回答、想法保存测试通过,收藏夹测试失效。

    MaoXian Web Clipper

    一个简洁的浏览器扩展,让你看到想收藏的内容,可以直接裁剪保存下来,以避免网站挂了,网址失效,图片失效等问题。是的,没有烦人的注册,也不收费。

    保存知乎收藏夹需要自己逐个展开内容和评论(评论只能存一页),存为多个文,想合并为一个文件需借助插件Single File,收藏家存下的可能是多个问题,存下来没有书签

    js

    小知识,CSS 中 id 选择器以 “#” 来定义,类选择器以一个点 . 号显示。

    在收藏夹页面,默认文章均不打开,一页是20篇,摘要末尾都是“阅读全文”,点击才可以看到全文,浏览器F12可以查到这个按钮的类属性为“Button ContentItem-more Button–plain“,通过在控制台跑两次$(".ContentItem-more").click()可以知道这句话可以一次展开一篇文章,那么写一个循环就可以展开全部了,当然用定时器也行,写完如下(间隔1000ms)

    // 间隔1s点击一个“阅读全文”按钮
    (function(){setInterval(function(){$(".Button.ContentItem-more.Button--plain").click()},1000)})();
    
    • 1
    • 2

    循环比定时器好在可以控制次数,缺点是控制时间间隔比较烦,目前测试不控制时间间隔也可以展开,这样操作容易被zh封。

    // 一瞬间点击20个   “阅读全文”按钮
    for (i = 0; i < 20; i++) { 
        $(".Button.ContentItem-more.Button--plain").click();
    }
    
    • 1
    • 2
    • 3
    • 4

    而展开评论也可以通过同样办法,$(".Button.ContentItem-action.Button--plain.Button--withIcon.Button--withLabel").click();,然而测试这样只是会反复展开、收起同一页评论。。。于是要找到所有的按钮逐个点击

    // 展开所有篇幅的第一页评论,能用,warning在于getElementsByClassName返回的数量比实际按钮多,说明类筛选还需要改进
    var comments = document.getElementsByClassName('Button ContentItem-action Button--plain Button--withIcon Button--withLabel');
    
    for (i = 0; i < comments.length; i++) { 
        comments[i].click();
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    展开之后用MaoXian Web Clipper进行保存

    参考

    • 如何保存某位知乎用户的所有答案?:

      直接去某个人的首页然后不停的点击更多.点个几十次,右击另存就行,我直接f12在浏览器的控制台放上一段代码,让浏览器自己跑(function(){setInterval(function(){$(“.zg-btn-white.zu-button-more”)[0].click()},3000)})();最后,另存为网页就行。

    • 如何备份/下载知乎中的回答?:cv,截屏OCR,onenote,web scraper,简悦,MaoXian web clipper
    • 知乎个人回答备份,获取html并打印到pdf 2017 MengXiangxi/zhihu_Backup :登录部分报错提示请使用手机验证码
  • 相关阅读:
    哪个视觉语言模型更优?InstructBLIP、MiniGPT-4?全面评估基准LVLM-eHub告诉你
    OneDiff 1.0发布!生产环境稳定加速SD/SVD模型
    基于springboot的社区团购系统设计与实现
    二分查找一个数首次与最后出现的位置
    抛弃for循环遍历list
    字节新鲜面经
    Typescript模块的导入导出与继承
    【语言学习】std::transform函数
    论文写作——ICASSP论文写作及投稿
    【SpringBoot】68、SpringBoot解决HttpServletRequest中输入流不能重复读的问题
  • 原文地址:https://blog.csdn.net/weixin_43031092/article/details/126210559
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号