• 一种有效的基于VPS和RSS的科研小白文献阅读策略


    转自我的个人博客https://blognas.hwb0307.com。欢迎关注!

    前言

    科研工作人员都有很强的文献阅读的需求。及时了解他人的工作对于开拓研究视野、研究思路是很有帮助的。对于刚刚进入科研领域的新人小白,为了快速了解行业的基础和进展,除了阅读本专业的经典书籍、经典论文,追踪领域内的新进展更是必不可少的。对于“如何快速提升个人研究水平”这类问题,绝大多数科研前辈的建议都会囊括“多读文献”这一条;但是具体请教到某位老师的时候,大家的策略和方法都不尽相同,颇有“八仙过海,各显神通”之感。我也不止一次地扪心自问:对于研究者而言,应该如何高效地进行文献阅读呢?由于某些契机,最近我找到了一些相当不错的策略和切实可行的方法。本文的内容与我其它博文会有不少重叠之处,这里主要是重新整理思路,让这个问题的答案更加清晰。

    事情要从2022年4月份说起。当时由于某些诱因,我想搞一个WordPress博客记录生活和学习,所以就买一个VPS捣鼓了一下,在这个过程中积累了一些管理Linux/Docker和网站运营的经验。某天我偶然发现自己的博客有一个feed链接,好奇心驱使之下了解一波,就发现了RSS这个追更神器。一般情况下,小伙伴们会利用RSS追更一些奇奇怪怪的东西(比如动漫、番剧、电影、豆瓣小组评论);不过,我意识到RSS在文献阅读方面有得天独厚的优势。很快啊,我又双叕发现PubMed(生物医学研究的必备数据库)支持通过检索式产生个性化RSS链接,到这里技术路线基本已经明确。我制定了一些方案,测试了两个月左右,感觉帮助很大,所以推荐给大家(主要是科研小白,大佬们估计都知道)!

    原则

    在正式说明方法之前,确立基本原则是很重要的,毕竟每个人的偏好可能都不一样,但应该会有类似的追求。根据经验,一个好的文献阅读方案应该有以下特点:

    • 被动式推送:基于RSS或者类似RSS(比如邮件服务)的推送式阅读。如此则不需要花费许多精力在寻找目标文献上。

    • 方便检索与归档:当文献积累量较大时很重要。比如,如果你要找某一篇自己很久以前看过的文献,只要它曾经被记录,就可以很方便地用搜索引擎(基于Web)找出来。

    • 社区互动:看文献的笔记是可公开性的,可与他人交流。当然也可以选择私密。

    只要你的流程遵守这3个基本原则,那么文献阅读促进你成长的过程就是稳定的、长期的、可拓展性的、螺旋上升式的。下面提到的方法也是基于这3个原则的,主要是起抛砖引玉的作用;你要折腾和尝试一下,才能最终找到最适合自己的方案。

    方法

    如图所示,这个文献阅读的方法框架是我半年来的经验总结。图中的元素互相联系,并不是完全孤立的。咱们一个个地说!

    chrome_W8TPkXmFyF

    Markdown

    如果你是搞计算机科学或者编程,这一小节都可以不用看了,懂的都懂。对于其它专业的人而言还是有必要介绍一下。关于Markdown,我在《Linux基础 学习Linux前要准备什么》、《Typora 地表最强Markdown编辑器之一》这两篇博文均有较详细的介绍。简而言之,Markdown是一个可以在半小时内入门的编程语言,有众多免费/付费的编辑器可供选择。Markdown最重要的特点就是专注内容而不是格式,所以它在程序员群体中被广泛使用(代码块的可视化往往依赖较为复杂的高亮规则),也被Github等网站采用为技术文档的主要文本格式。专注内容而非格式的特点天然地适合于记录笔记,因为维护文献阅读笔记版式的时间性价比很高,作者可以将大部分精力放在内容创作上,所以Markdown的笔记往往结构严谨,可读性强。我博客里所有的文章都是基于Markdown的(详见《WordPress上传或更新Markdown的最佳实践》),排版错落有致,规整简洁。

    文献阅读笔记的具体案例可以在《学习地图》中看我的“前沿快讯/文献精读”系列。比如在《前沿快讯 第1期 睡眠与肿瘤转移等》,我会简单记录某条文献的标题(包含链接)、杂志、中文摘要(在机器翻译的基础上微调),并粗略地进行分类。这样就描述了该文献的基本特征,日后复习、溯源都很方便:

    chrome_YOf4iDQHOe

    看文献时怎么记笔记其实没有什么硬性规定。因为我给自己看的同时也给其它人看的(毕竟是发表在博客上),所以记录得详细些。一般来说,看普通的文献可以简单点,比如写一个描述性标题、一个全文标题、一点评论足矣;对于一些比较重要的文献你可以记多点。看着舒服、方便回顾即可,随便写点什么。对于很重要的文献,你还可以做一些类似于“文献精读”的练习(比如《文献精读 第2期 靶向cGAS-STING-IL6治疗CIN肿瘤》这种),虽然费时费劲,但收获也大。对于那些结构比较复杂的论文,这种笔记也方便反复咀嚼。更重要的是,博客上的笔记其它人可以看到,热心的观众会帮你纠正错误的(前提是有人看,哈哈)。

    复习文献的时候可以快速浏览,效果还是不错的:

    chrome_b2i5fM1Maz

    检索也很方便,在浏览器中直接Ctrl + f调用浏览器的搜索框,检索速度贼快。普通的Markdown编辑器也有类似的功能的:

    chrome_4kF4TbiWqJ

    总之,Markdown是一种很适合记笔记的编程语言,文献阅读笔记也不例外。我目前所有的笔记都是用Markdown记录的。Markdown用得足够久,自然会体会到它的好处!值得一提的是,有很多出名的知识管理系统(比如Notion),写作体验和Markdown是很相似的,或许是部分地借鉴了它的思想。所以,学会Markdown对迁移到其它主流笔记平台也会毫无压力。我认为,Markdown可以作为一个基础工具外在地体现你的知识和经验

    基础知识框架

    基础知识框架是非常重要的。因为我们讨论问题时,都是在某些既定事实和范式内进行讨论。这种既定事实和范式根据你所在的领域不同而不同。不过基本方法是相似的,就是读经典,阅读经典教科书、经典文献或经典项目的代码。每个领域都会有大牛,肯定有写教科书的人。问一下导师、师兄/姐、同事,结合Google知乎百度,整理出一份高质量的书单,将它们的PDF版都搞到手,有空就翻读,甚至是系统性地阅读。时间一久,自然就可以构建出该领域的基础知识框架了。基础知识框架还是很重要的,这样你看到该领域内的一个全新的研究时,就可以大致知道它的研究框架并判断它的重要程度,而不是一脸懵。多读多看。记笔记可以用Markdown。

    VPS

    不接触编程的小伙伴可能都不知道VPS是啥。VPS, 全称virtual private server,虚拟专用服务器。一般来说,VPS是搭载着Linux系统的、可远程控制的电脑,一般通过ssh后台进行管理:

    MobaXterm1_CHS_EsCF3VtI0f

    你可以认为VPS是一种通用工具,可以用来搭建视频平台、笔记平台、画板和其它奇奇怪怪的网络应用(基于Docker)。在文献阅读里,VPS的作用就是搭建一系列文献阅读的辅助工具,比如图床、RSS阅读器、个人博客、资料备份平台等。你可以将VPS看作一部手机,可以装各种功能的APP。一般来说,VPS是一种付费资源(甲骨文大盘鸡按下不表),资费水平可以参考我用的VPS

    3x vCPU Core
    45 GB SSD Cached RAID-10 Storage
    3 GB RAM
    6500GB Monthly Premium Bandwidth
    1Gbps Public Network Port
    Full Root Admin Access
    1 Dedicated IPv4 Address
    KVM / SolusVM Control Panel - Reboot, Reinstall, Manage rDNS, & much more
    LOCATION: Los Angeles
    JUST $24.28/YEAR or $47.06/2 YEARS
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    据我所知,我用的VPS在大品牌里算是性价比很高的了。有了VPS和一个域名,你可以搭建下面这些应用:

    1. 图床:以Chevereto图床为例。用于承载Markdown的图片。

    chrome_6OnArAsLsA

    1. 个人博客:以WordPress个人博客为例。用于公开和管理笔记。
      chrome_3Ui00Emh4i

    2. RSS阅读器:以Tiny Tiny RSS阅读器为例。用于接收RSS订阅。

    chrome_rAp33v0M7g

    1. 资料备份平台:以Duplicati为例。用于备份图床、博客和RSS阅读器。

    chrome_5zmRr67fRK

    上面所提到的应用我都在博客的《学习地图》里介绍过安装和使用之法,可按需食用。值得注意的是,这只是我自己的方案,你应该根据自身的实际情况进行配置。比如,RSS阅读器就有各种软件可选;博客对于某些人而言可能也是不需要的;图床可以白嫖Github;资料备份可能每个人都有自己的方案。我之所以将这些东西都放在VPS里,主要原因是:

    • 不贵。看你买什么VPS吧。能嫖到甲骨文都不用钱,有个域名就能玩。不过稳定的话还是要自己搞一个,比如像我用的这个。硬盘容量最好在20G以上,内存最好在1G以上。而且还能玩别的东西,这只是冰山一角:

    chrome_qIwzNP6lJX

    • 我的数据我作主。只要我还给VPS和域名续费,整个平台就不会停运,近乎终身,自然不存在数据丢失的问题;所用的软件都是开源免费的软件,你完全可以看心情更新迭代,完全不用担心兼容问题。你如果用的是某公司的产品,用的时候挺爽的;如果以后它停运了怎么办(类似新浪博客那种)?迁移海量数据的过程,想想都头皮发麻。
    • 安装过程不难,有点Linux和Docker的基础即可。可能有人听到Linux有点恐慌。我以一个非编程专业出身的过来人的角度告诉你,普通素质完全可以hold信简单的Linux/Docker基础。据我所知,很多初中生、高中生玩编程都玩得很溜。看文献的人一般都是研究生了吧,完全不用担心智商不够用,关键是要用心学,很快就可以入门。精通就是另外一回事了,这个往往是困难的。
    • 拓展性和成长性一入VPS深似海。有很多有趣的东西等着你去发现,这其中的价值远不局限于文献阅读带来的好处。比如,掌握一些解决不熟悉问题的能力。自己体会。

    差不多就是这些。总之你知道VPS是个好东西就足够了!如果你真的想要玩一玩VPS,推荐还是看看我的“Linux基础”教程。虽然不是很专业,但对于一般玩家而言已经是够用了,所有的文章都通俗易懂,可操作性强:

    chrome_797aIyzTII

    easySCI

    easySCI是我最近做的一个小项目,不是谦虚,是真的小!有用就行,哈哈!每年1更,主要是通过一些筛选指标获得目标期刊,然后根据影响因子(你懂的)分层,得到ISSN号。ISSN可生成PubMed使用的检索式;然后结合某个领域的关键词,就可以生成我们关注领域的RSS链接。项目的具体情况可参考Github Repo, 国内小伙伴也可以看这里:Gitee Repo。有类似功能的工具有很多,比如Scholarscop等,大家也可以了解下。在easySCI中,我主要是将期刊的PubMed检索式和期刊-关键词的RSS链接搞定,省得每个人都要走一次重复流程。结合Tiny Tiny RSS阅读器,大致的效果是这样的:

    chrome_rAp33v0M7g

    从GIF图中可以看到,每个链接都是动态更新的;链接背后有新内容,马上会推送过来。RSS的这个特征非常适合定期地、有仪式感地阅读文献。有空就1天1看,没空就每周1看,永远不怕看漏;心情不好不想看文献的话,直接Mask all read!当然不建议经常这样做,哈哈!另外,采用类似的策略,你可以定制任何你想看的某几本期刊(比如CNS和你专业里的顶刊)、或者某几个大牛的文章。总之,RSS用来追踪最新文献就是爽,在我心目中应该是排名第一的方法了!目前暂时只支持生物医学领域。其它领域也是类似的,有需要的同学可以提issue,有空的话我可以帮忙制作一下RSS链接,也不麻烦。至于某些专业主要是投会议或者是投国内核心的,这个我没啥特别的经验,还是请教你们的导师和师兄师姐吧。另外,估计他们对于追踪文献也有一些妙招,不妨向他们请教;再Google知乎百度一下,最后总可以找到一套适合自己的方法。祝你顺利!

    下图展示的是RSS对Nature杂志研究的实时追踪(每15分钟爬1次)

    chrome_XRBx5YznqD

    小结

    这篇文章对新手小白可能有一定的参考价值,对于老司机来说就不一定了。总之多多交流吧,大家有什么建议可以向我反馈,我也学习一下。希望大家都顺顺利利,发大paper!冲这个祝福,求个点赞收藏不过分吧?!

    chrome_oUC8pTaeL2

    (来源:香香软软的小泡芙)

    扩展阅读

    随便看看

  • 相关阅读:
    Python与Java的12点区别介绍
    SAP PI/PO中使用UDF解决按字节拆分字符串的需求
    手搓一个ubuntu自动安装python3.9的sh脚本
    力扣每日一题52:N皇后问题||
    SpringCloud之OpenFeign调用解读
    两个链表的第一个公共结点
    SAP中己经用MBST冲销的凭证,可以再次用MBST冲销吗?
    利用pycharm命令行 上传文件到服务器
    运维行业数字化维修数据屏来袭
    向量数据库库Milvus Cloud2.3 技术选型中性能、成本、扩展性是重点
  • 原文地址:https://blog.csdn.net/huangwb8/article/details/126637867