《信息安全论文写作》方法论
Last updated
Last updated
基于对肖老师的个人崇拜,笔者本学期全程旁听了他开设的课程——《信息安全论文写作》,受益匪浅。故将课程所学的方法论加以整合,供日后参考。
学士、硕士与博士是高等教育的三个不同阶段,但该体系并非一成不变的。在最初,高等教育体系中只有学士与博士两个阶段,然而人们发现对于博士的要求过于苛刻,以至于许多人都无法毕业(至今仍是如此),于是引入了硕士(苏联还引入了“副博士”)阶段。至此才演化到如今中西方普遍采用的“学士—硕士—博士”这样的高等教育体系。
高等教育体系对不同阶段的学习者提出了不同的能力要求,可简单概括如下:
学士:面对问题,能查阅现成方案并解决;
硕士:成为某个方面的专家,面对问题,能多方法对比并进行应用与评估;
博士:面对新问题,做人类从未做过的事情。
在西方,大学授予的博士学位是 Philosophy Doctor(philosophy 在古希腊中的意思是“爱智慧”)。若能获得 Ph.D 学位,则能被称为“Doctor”,这是一种无上的荣耀。这说明你在接受高等教育的过程中,在某领域认知达到了人类前沿水平,并通过思考,为人类在该领域的发展做出了贡献。论文是证明你为人类做出了贡献的一种方式。
论文(paper,起源于 thesis、dissertation)是科学研究成果的载体,往大了说,它用于记录人类的科技进步;往小了说,它关乎到每个学生是否能够毕业,从而取得相应的学位证书。然而,必须指出的是:发论文是手段,而不是目的,目的是科学研究。
笔者认为,科学研究是带着批判精神,去探究自然界的客观规律。科学研究的出发点是你发现了一个明确而有趣的问题(要求是悬而未决的),明确是指问题能被客观衡量(形如“我好像爱上了 Ta”的问题不在此范畴),有趣是指探索此类问题能满足你的好奇心,使得探索问题不是沉重的负担,而是一场有意思的游戏。遗憾的是,这场游戏并不适合所有人入场。
衣食无忧。如果你每天都在担心下一秒会不会死去,下一顿饭吃什么,那么大概率是没有心情搞科学研究的。可参考中科院曹则贤教授的说法;
天分。牛顿 22岁 发明了微积分(瘟疫在家休假期间创造的),27岁 得到查理二世的特准,获得了卢卡斯数学教授席位;伽罗瓦在短暂的 21年 人生中发明了群论,利用群论彻底解决了根式求解代数方程的问题。天分决定了科学研究工作的上限,学术道德决定了科学研究工作的下限。顺带多提一句,学术道德的底线是❌抄袭,抄袭的定义是对“原创 idea copy” && “对引用不加标识”;
追求。博士阶段的工作是 single track,是绝望之谷,美国 1/3 的博士患有抑郁。如果不是有特殊的癖好,有诸如“Knowledge make you different”这样坚定的信仰,否则换个非科学研究的人生赛道是明智之举。
科学研究存在的先决条件:critical thinking → make a point → improvement。
学会批判,在看别人的工作时,就会主动去分析工作中好 / 不好的地方,养成 overclaim 的习惯。慢慢就能做到同类问题的扩展与问答,能够连续问出有深度的问题,成长为一名成熟的科学研究工作者。因此批判性思维是科学研究不可或缺的组成部分。
但在中国,以笔者了解到的受教育经历来看,中小学教育绝大部分是填鸭式教育 && 灌输式教育。一方面老师往往只注重讲解知识点【是什么】,而很少提及知识点【为什么】是这样;另一方面只有极少部分的学生具有质疑精神,能够有理有据地论证教科书是否存在问题、老师讲解的部分是否存在问题。可以说,在中国的教育模式下,我们在批判性思维方面存在后天不足,这一点在白岩松的《幸福了吗》以及康辉的《平均分》都有提及。
既然存在不足,那么正视不足并加以弥补就是了。以下是一些笔者认为值得学习的资料:
建立了以上基本认知后,可以进一步探讨科学研究。科学研究的一般路径是:调研某领域 → 发现问题 → 解决问题 → 写论文展示成果。因此在学写论文之前,还有一件极其重要的事情——学会读论文。读论文是“调研某领域”的手段,能帮助自己建立对某领域系统、准确的认知,确保自己所做的工作是前人没有做过的,是有意义的。
读论文首先得有论文可读,那么论文获取的方式有哪些呢?论文获取途径:
为了建立对某领域全面的认知,必须阅读大量相关论文,如何组织大量论文的存储,就需要工具加以辅助。秉承“免费、好用”的基本原则,找到了 Zotero 这款论文管理工具。
Zotero 的相关资料非常丰富,这里不再赘述,直接给出相应的参考链接。
以下引用来自该网站:
Zotero 默认的协议是「Bibliographic Ontology」。它是定义信息世界的协议,包括了实体信息的载体,如图书、打印出来的论文;也包括了虚拟信息的载体:软件、聊天记录等等。
在 Zotero 中无论是 Paper、Book、Film 等实体…..都用 Bibliographic Ontology 协议抽象统称为一个最小的基本单位 Item。然后再对这个实体进行调用,创建,修改等操作……
Zotero 把信息处理的过程抽象为对 Item 的四个操作:CRUD。
C - 创造实体(Create)
R - 读取实体(Retrieve)
U - 更新实体(Update)
D - 删除实体(Delete)
这里就不得不提到 Zotero 两个超级伟大的发明:Translators 和 CSL。
「Translators」(https://www.zotero.org/support/translators)是编写好的 js 脚本,用于识别不同类型的网站、文献库中的元数据,并批量添加到 Zotero 中进行管理。
「CSL」全称 Citation Style Language,引文风格语言。在 Zotero 提供的 「Zotero style repository」(https://www.zotero.org/styles)中有 9201 种引文的款式,包含了各种学科。随便点击一个就可以下载。这个网站链接了「CSL 官网」(https://citationstyles.org/),惊讶发现 Zotero 是 CSL 的赞助商之一。并且有很多其他软件也使用了这个 CSL 底层协议。
想要了解更多的技术细节,不妨访问 Zotero 官网。
有了读论文的工具,那么写论文用什么工具呢?
答案是Overleaf。
Overleaf 是一种在线协作科学文档写作和发布工具,它基于 LaTeX,一个广泛使用的文档排版系统,特别适用于复杂的数学公式和科学文档。以下是关于 Overleaf 的详细介绍:
Overleaf 最初是由 John Hammersley 和 John Lees-Miller 于 2012 年创建的,最初名为 WriteLaTeX。两位创始人都是科学背景的学者,他们创立这个平台的目的是为了简化科学写作和协作过程。
基于 LaTeX:Overleaf 使用 LaTeX 作为其核心排版系统。LaTeX 是一种基于 TeX 的排版系统,由 Leslie Lamport 在 80 年代创建,专门用于处理复杂的科学和数学文档排版。它允许用户通过标记语言来编写文档,这使得文档的格式化更加精确和灵活。
在线协作:Overleaf 的一个主要特点是支持多用户实时在线协作。它允许多位作者同时编辑同一文档,并能实时看到彼此的更改,类似于 Google Docs。
云存储和版本控制:Overleaf 将文档存储在云端,用户可以从任何地方访问它们。此外,它还提供版本控制功能,用户可以轻松地回溯到文档的早期版本。
集成编译器:Overleaf 内置 LaTeX 编译器,这意味着用户不需要在本地安装 LaTeX。用户可以直接在网页界面上编写 LaTeX 代码,并实时预览最终的文档输出。
Overleaf 与 TeX 的关系密切。TeX 是由 Donald Knuth 在 1978 年发明的排版系统,主要用于数学、计算机科学和工程等领域的文档排版。LaTeX 是建立在 TeX 之上的一层,提供了更高层次的结构和命令集合,以简化文档的编写和排版。Overleaf 则是一个将 LaTeX 带入云端,提供现代化界面和协作工具的平台。
有了读、写论文的工具后,可以一探论文的庐山真面目,以下从“论文分类”与“论文细分”两部分介绍论文的构成。
对研究者而言,若其选择的科学问题细致而具体,则需要做学术攻关准备;若其选择的科学问题宽广而确定,则需要做综述论文准备。因此论文大体上分为两类:研究型论文 && 综述型论文。
研究型论文的特点:
研究新现象,发明新技术、新工具
创新点决定价值
综述型论文的特点:
作为后人的垫脚石,总结前人的工作
选题、调研、写作决定价值
论文可以理解为是现代的八股文,有其写作规范与要求,一般而言理工科的论文由以下八个部分组成(学术大牛可以随心所欲)。
标题
客观、准确、吸引人
摘要
介绍你对这个领域的认知,做了哪些贡献
引言
扩展摘要,介绍背景、困难、成果、阅读导引
相关工作
证明给读者看,你是这个问题的专家,认知达到人类前沿水平;区分别人的工作与自己的贡献
问题
介绍自己要解决个什么事
理论
应用数学公式、图表、计算等方式说明insight && design
实验评估
证明你的理论与事实相吻合
结论
分享感想与对该工作未来发展的畅想
理解论文的构成只是学会读论文的第一步,读论文的第二步是真正理解论文的内容。那么如何判断是否真的理解论文的内容?撰写总结与学术评论,是一个行之有效的检验方法,而且在校验的过程中,能更加深入地体会作者的写作思路,培养科学 taste。
插一句,我们可以通过以下两个标准来判断某论文是否属于高质量论文。
语句构成:宇宙真理、别人已证明的结论、本文将证明的成果
写作风格:unambiguity, clearance, flow, stylish
那么该如何撰写论文总结与学术评论呢?
论文总结可以想象自己将在组会上分享,强迫自己进行深度思考。阅读论文后,按照以下五个方面对论文进行总结:
发表信息
期刊会议
单位、团队、作者
目标问题
问题是什么
问题价值
前人工作
解决方案
方案框架
方案创新点
论证过程
论文方法框架
论证突出细节
评估结论
作者自我评估
读者评估感受
论文总结的示例可参考如下:
Review ∈ Critique,一般而言由以下两个部分组成:
论文规范性
格式规范性
学术规范性(抄袭?)
表达规范性(语法、遣词造句、规范等)
论文学术价值 - review ≠ detail
学术问题
解决办法
创新点 / 系统性 / 工作量
论文学术评论的示例可参考如下:
《基于超级计算机的医疗数据集并行处理技术研究》针对 MIMIC 数据集提取工作,利用经典算法和超级计算机的并行优化技术,实现了一个可用的 MIMIC 数据集提取程序,克服了之前提取工作中开销大、没有自定义接口导致无法扩展的缺陷。
该论文格式规范,符合基本的论文写作要求。论文整体框架逻辑性强,从写作细节上看,也体现了作者对 MIMIC 提取工作的思考,引用标注得当,无抄袭痕迹。美中不足的是,论文表达方面存在多处欠缺,例如正文 p3 出现错别字、p5 末尾标点符号遗漏、p6 表格跨页影响美观、p8-9 多种缩进混合显得文章排版杂乱。
该论文的工作提升了 MIMIC 数据集提取的程序效率,解决了现实世界中的一个复杂问题,具有一定的学术价值。该论文首先设计了 MIMIC 提取工作的框架,而后通过 MPL + OpenCL 的组合,将程序并行化,总体而言是一个系统性的解决方案。
作者可以尝试在以下三点加以改进:
在 3.1 首段借助表格罗列两种解决方案的优缺点,使脉络更加清晰;
在 5 测试与结果分析 章节开头,交代清楚测试环境的 CPU 型号、内存等细节,便于读者复现;
添加提取前后效果的 demo,使读者对工作价值有更直观的感受。
学会对别人的工作进行鉴赏后,现在可以尝试撰写论文的标题、摘要与引言啦!先来看一下对这三个部分写作的要求:
标题
与文章适配、大小合适、风格鲜明
词汇:基于、技术、研究(不涉及实现)、设计与实现、系统实现、应用(需要体现场景)、方法(数据集);
e.g., 基于机器视觉的铁路轨道扣件病害检测关键技术研究、一种信息网络聚类算法的研究。不断缩小领域、场景、技术
摘要
准确、精炼(体现问题、方法、效果)
展现提出方法的 ituition;第一句话往往斩钉截铁
引言
扩展摘要,介绍背景、困难、成果、阅读导引
动机:阐明问题和问题的价值,解决它有什么好处
方法:踩别人的工作,凸显自己工作的牛逼
创新点:请注意到作者往往有夸大自己贡献的倾向,大部分需要做“减法”
导读:介绍论文章节安排
训练“标题、摘要与引言”这三部分的写作能力,可以将已发表论文的相应部分遮挡,自行阅读论文其他部分后撰写,再与原作者所写进行比对。
学习完“标题、摘要与引言”这三部分的写作,《信息安全论文写作》课程就进入尾声了。课程的最后,肖老师告诉我们:
好的论文都是改出来的,好论文往往是先搭好框架,往里填充,再通过快速的迭代优化写作质量。
这里贴一张结课的大作业(主要是形式,内容都是 gpt 写的🤣)。
论文写作后,需要投稿到相应的期刊 / 会议,由同行专家进行评审,审查论文质量是否合格,并决定论文能否发表。以下分享两张有关投稿与评审的截图。
国内对于论文的评审是等级制,对论文的选题、文献综述、研究成果、论文写作这四个方面进行评定。更加具体的评议项目参考如下:
评议项目
分数
评分
选题意义
20
x
研究方法
10
x
逻辑构建
10
x
专业能力
30
x
学术规范
20
x
创新性及论文价值
10
x
笔者曾搜寻过网上的评审方法论,整理如下:
评审:评是给出自己的评价,判断该论文是否对 filed 有所贡献;审是审核此文是否能自圆其说
评价:
概述 finding
是否提出新的 insight、新的 method?
major points(研究问题、主要贡献、解决方法、实验的完整性?)
minor points(证据是否够多够强,图表与论证过程是否紧密相关?)
站在作者的角度想一想
科学价值:是否对科学进行了改变、改进、修改、提出异议或增加了新内容(至少一点点)?是否有助于促进科学进展?