上了闵老师的论文写作课,做一些总结。贴一个闵老师的 博客链接。
1.第一篇论文不要盲目地追求创新,更应该是找一篇顶刊顶会的文献,尝试复现别人的工作,先对该领域的工作有一定了解再说。在复现之后,做一些算法或模型的优化,有一点点的性能提升也是进步。
2.单篇论文的内容并不是越多越好,也不是创新点越多越好。如果有比较多的创新点,那应该分成几篇论文发表。
3.论文应当是严谨的,不能使用缩写;作为做学术的新人,说话用词不能太绝对,客观陈述工作内容就可以了。不确定某个单词是否适用时,可以在 这里 查看单词或词汇的使用频率,选择大多数人用的。
4.英文句子的语法问题。写论文的时候尽量不要先写中文然后翻译,中英文的语言风格和句子结构的差异是很大的。如果不能直接写出英文,可以先写中文,用翻译工具(谷歌或者百度等)来回翻译直到英文句子不再变化。然后自己对句子再进行润色(专业词汇更正等)。
5.论文的符号系统。一篇论文的符号应当遵从一致性,即表示某一意义的符号在论文的各个位置都应当使用同一形式,不能前面用 X ,后面用 x 。数学公式的编辑应当使用 Latex ,不能使用 Word 的公式编辑器(容易产生格式变化)。当论文的数学符号较多时,可以用一张表来解释各符号的意义。
6.如果在论文中涉及的表达式太长,超过页面的边界,可以将这个式子做一个切分来自动分行。数学式子同时也是句子的一个部分,也有自己对应的逗号、分号、句号。
7.论文的题目应当写出自己提出的新问题或新方法,用词不要太生僻(包括专业词汇)。如果论文的核心是某个算法,题目可以用算法的缩写。题目的长度在 40-60个字母之间,过长的题目会让人抓不住重点。
8.摘要部分是将论文中最重要的部分提取出来,通常包括三个部分:已有工作的评述,本文的工作描述以及实验结果。三个部分是连贯的,首先说明问题所属的领域,解释最重要的概念;然后陈述该问题的流行解决方案,可以结合本文参考的别人的方案;同时说明已有工作的局限性,在尊重别人劳动成果的基础上说明可以改进的地方,进而引出本文做的工作;阐述本文方法的技术点、步骤、优势和贡献等;最后说明实验的设置、结果及优越性。
9.关键词是对摘要的一种充。一篇论文一般是 3-5 个关键词,每个关键词由 1-3 个单词构成。关键词按照首字母的顺序排列。
10.引言需要讲述完整的故事。引言要对整个论文进行详细的描述,要让审稿人读完之后可以把握论文 80% 的内容。节奏上与摘要同步,将每一句摘要扩展为引言中的一段。引言每一段的第一句为主题句,可以由适当修改后的摘要的句子来充当。
11.开局一张图。计算机领域流行在引言部分使用 “开局一张图” 套路。图可以展示核心技术、算法框架、小的运行实例。图应该简洁清晰,特别是“输入”、“输出”和控制变量。
12.作为初学者很难自己开辟新道路,大多数都是在前人的工作基础上更进一步,因此文献综述是必不可少的。文献综述一是表示对前人工作的尊重,二是当读者不清楚某些技术的细节时方便查阅。
13.文献需要分门别类的介绍,这样便于读者知晓本文的工作属于哪个部分。参考文献的引用一般是作为附属品,可以先写完一个完整的句子,再把参考文献的引用加上去。不能将参考文献的引用作为句子的主语、宾语等。
14.一次引用文献不要超过 3 篇,太多了会让人觉得是故意堆砌。引用时,不能全局引用,如果实在要引用,应该在原句加上双引号。
15.论文涉及的理论应该很完备,同时符号要保持着同样的风格。重要结论称为定理theorem,定理前面打辅助的叫作引理lemma,定理后面的尾巴叫推论corollary,附属于算法的叫property。
16.算法的伪代码是论文的核心之一。算法必须要说明输入、输出;关键步骤需要写出注释;长度在 15-30 行;一般需要对时间和空间复杂度进行分析。
17.数据集越多,覆盖领域越广,结果的可信度就越高。在某些领域可能会出现可用数据集稀少的情况,可以使用人造数据集,或者将数据集随机采样成多个。使用的数据集尽量从参考的文献中获得,这样有利于比较。在图像和视觉等领域会有专门的数据集供大家测试。
18.实验的目的主要是回答一些作者和读者关心的问题。因此采用自问自答的方式,在实验之前提出问题,在列出实验结果之后逐个回答这些问题。
19.算法内部比较可以通过展示参数变化导致的性能变化,如果参数比较多,就只讨论最重要的几个。有时会有好几个可选方案,可以对比选择效果最好的那个。
20.算法外部比较可以和已有算法进行对比。比较的对象有经典方案、基准方案和目前最先进的方案。柱状图可以很直观的展示对比结果,如果数据比较多,表格就比图标更适合展示。最重要的比较可以放到最后。要有足够的文字进行说明,不能全让读者自己去分析。本文实验效果不需要在所有的数据集上优于其它方案,在一两个上表现优秀就可以。
21.论文的结尾部分不能太啰嗦,但也不能虎头蛇尾。结论长度在5句左右,避免使用与摘要相同的句子。在摘要里提到的工作可以在结论部分里给出获得的数据或结论。
22.Latex提供了bib文件进行参考文献的管理,这也是Latex相较于Winword的优势,一篇参考文献也只需要写7-8行。
23.名字要有意义,保证不同的参考文献具有不同的名字。作者的名在前,姓在后,作者名不要缩写,Latex能够帮助完成必要的转换。有些作者有自己的一些爱好,比如名中间连词符,有些则喜欢独立,我们在查阅他们的论文时,要了解和尊重对应的习惯。
24.一篇论文中的图一定要多,要专业。图可以让人很清晰地了解论文的工作内容。
25.一幅图胜过千言万语。论文中的图尽量使用矢量图,因为位图在放大的时候会失真而矢量图不会。visio、matlab和python都可以生成矢量图。
26.图注的内容可以尽量丰富。有些期刊要求只看图注就能明白图片的内容,因此图注可以有三行或者更长。图片的说明性文字应该比较长,占据的版面不低于图片所占版面的一半,也可以更多。
27.引用图片时,应保持与图片的编号一致,如Fig.1和Fg,1对应,当作为主语时,应当使用全称。有些期刊要求使用一张图(含图注)把论文的主要思想介绍清楚,这张图是值得投入较多时间的。
28.论文中的表格应该与文字的边距相同,如果表格的内容不多或者太多装不下,可以使用Latex控制表格的宽度。表格中的数据也可以使用Latex控制对齐的方式。数据集应该按照某种方式排序,如对象数、属性数等,所有的表格都应按照同一种方式对数据排序。
29.每种期刊都会提供一个或者多个格式文件,借助工具来完成每种期刊的格式文件会比较方便。Latex是依靠代码来实现排版,同时Latex编辑比较友好,如果要填写一个表格,只需要几行代码就能完成;使用Word可能需要耽误好几分钟的时间,让我们在论文的格式上花费了太多的时间。
30.稿件投到期刊,如果回复让修改,说明 有希望发表。修改论文的同时,需要准备对审稿意见的点对点的回复。思想上应当态度端正,回复问题应当直截了当,不要弯弯绕绕。回复的内容不需要太长,论文的修改才是关键。