毕业论文撰写指南

整体说明

一篇毕业论文通常包含封面、原创性声明和关于论文使用授权的声明、中英文摘要、目录、引言、研究现状、相关理论基础、研究框架、具体理论技术说明、实验分析、总结与展望、参考文献、致谢、附录、攻读学位期间发表的学术论文目录这几部分,封面、原创性说明、致谢、学术论文目录(本科生通常没有)这几部分只需要完全使用模板并填写相关信息即可,其余几部分的写作方法将在接下来的内容中逐一详细说明。

在开始写作前,先列出一些不常用但现在需要掌握的Word使用技巧,如果你对此不熟悉,请结合关键词自行搜索学习:

  1. 修订模式的开启、更新、关闭等
  2. 图、表、公式、参考文献等交叉引用的创建及更新
  3. 自动生成目录和章节编号
  4. 自动录入和管理参考文献
  5. 样式管理
  6. 分节和分页的插入及删除
  7. 三线表的制作方法
  8. 算法伪代码等格式化内容的插入

使用Latex的同学请确保PDF文件的样式与学校提供的Word样式完全一致。

推荐的写作顺序

很多同学习惯按照论文的页面顺序从头写到尾,即先写摘要、再写引言、再写正文……这是一个非常低效甚至有害的写法。推荐按照以下顺序写作

  1. 正文理论内容:这是全文的核心,也是你最了解的部分,先把方法写清楚,后面所有章节都要以此为基础。
  2. 正文实验内容:方法写完后趁热打铁写实验,实验数据和结论会直接影响引言和摘要的措辞。
  3. 相关理论基础:根据正文中实际用到的技术,回头补充理论基础章节。
  4. 研究现状:在对自己的工作有了完整认识之后,才能准确地把握现有研究与本文的异同,写出有针对性的现状综述。
  5. 引言/绪论:引言是对全文的概括,必须等全文基本成型后再写,否则写了还要反复修改。
  6. 总结展望:最后写,因为此时才最清楚做了什么、还有什么可以继续做。
  7. 摘要:摘要是全文最后完成的部分,它是对已完成论文的高度凝练,而不是写作计划。

版本管理

毕业论文的写作周期较长,务必养成定期备份的习惯。推荐的做法是:每次写完一个阶段的内容就保存一个带日期的版本(如”毕业论文_20260415.docx”),并将文件同步到云端(如OneDrive、百度网盘、坚果云等),防止因电脑故障或误操作导致内容丢失。不要等到全部写完才开始备份。

学术写作语言规范

这一节专门针对没有学术写作经验的同学,介绍写毕业论文时在语言表达上需要注意的基本规范。很多同学论文结构和内容都不差,但读起来像是在写说明书或者日记,这会大幅降低论文的专业性。可搭配《毕业论文自查清单》查看。

人称与视角

中文毕业论文通常使用“本文”作为主语,而不是“我”或“我们”。使用“本文”的好处是保持了学术写作的客观性,避免论文读起来过于主观。

  • ✗ 不推荐:“我设计了一个XX算法来解决这个问题。”
  • ✓ 推荐:“本文设计了一个XX算法来解决这一问题。”
  • ✓ 也可以用被动语态:“针对上述问题,提出了一种基于XX的算法。”

在指代已有研究中他人的工作时,用作者姓名+文献编号,或者直接用“文献[X]”来称呼,例如“Smith等人[1]提出了…”、“文献[2]中的方法…”。

时态

中文学术写作不像英文那样严格区分时态,但仍有一些约定俗成的用法:

  • 描述本文工作和结论时,使用一般现在时(“本文提出…”、“实验结果表明…”)。
  • 描述已有研究时,使用一般过去时或一般现在时均可,但同一段落内要统一(“Smith等人提出了…”,或“Smith等人提出…”,不要混用)。

避免口语化表达

学术写作要求正式、准确,口语化表达会显著降低论文的专业性。以下是一些常见的口语化表达及其学术化替换:

口语化写法 学术化写法
很多研究都做了这个 已有大量研究对此进行了探讨
效果挺好 性能显著提升 / 实验结果表明方法有效
这个方法有点问题 该方法存在一定局限性
我们发现XX很重要 研究表明,XX对于YY具有重要影响
大家都知道 已有研究普遍认为 / 这一结论在学界已有广泛共识
做了实验 开展了实验验证 / 进行了对比实验
比其他方法好 在XX指标上优于现有方法 / 相比基线方法提升了X%

段落与章节的衔接

论文不是把每个小节独立地写完就行了,各段落和章节之间需要有自然的过渡。常见的衔接方式:

  • 章节开头:简要说明本章的研究背景和要解决的问题,以及本章的组织结构。不要上一章刚结束,下一章直接跳入技术细节。

    示例:“在上一章介绍了整体框架的基础上,本章将重点介绍XX模块的详细设计。本章首先在第X.1节对XX问题进行形式化定义,然后在第X.2节和第X.3节分别介绍方法的两个核心步骤,最后在第X.4节对方法的复杂度进行分析。”

  • 章节结尾:用1-2句话小结本章的主要内容或结论,并引出下一章。

    示例:“本章详细介绍了基于XX的任务分配算法,并从理论上证明了其激励相容性。下一章将通过实验验证该算法在实际场景中的有效性。”

  • 段落内部:同一段落内的句子要围绕同一个中心意思展开,不要在一段话里跳跃多个话题。每段结束时最好有一句小结或过渡到下一段的引导语。

图表的规范引用

论文中所有图和表都必须在正文中被引用,不能出现从未被提及的“孤立图表”。引用的规范写法是:

  • 图:在正文相应位置写“如图X-X所示”或“(见图X-X)”,然后在图的下方写图题(图的标题)。
  • 表:在正文相应位置写“如表X-X所示”,然后在表的上方写表题(表的标题)。
  • 公式:在正文中写“如式(X-X)所示”,公式编号写在公式右侧。

图题和表题的写法要简洁明确,能让读者不看正文就能大致理解图/表的内容:

  • ✗ 不规范:“图3-1 实验结果”(太模糊)
  • ✓ 规范:“图3-1 在MNIST数据集上各方法的分类准确率对比”
  • ✓ 规范:“表4-1 不同参数设置下本文方法的性能变化(%)”

慎用绝对化表述

学术写作要客观、严谨,应避免使用无依据的绝对化表述,也要避免过度夸大自己方法的效果。

  • ✗ 不规范:“本文提出的方法完美解决了XX问题。”(“完美”过于绝对)
  • ✗ 不规范:“本文是首个研究XX问题的工作。”(除非经过充分调研确认,否则不要使用首个、唯一等表述)
  • ✓ 规范:“实验结果表明,本文方法在XX数据集上优于所有对比基线方法。”
  • ✓ 规范:“据作者所知,本文是最早将XX方法应用于YY场景的工作之一。”

使用大模型辅助写作的注意事项

目前有不少同学会使用大模型(如ChatGPT、Claude、豆包等)来辅助写作,这在一定范围内是合理的,但需要注意以下几点:

  1. 大模型可以帮助润色语言、改善表达、纠正语法,但论文的核心内容(研究方法、实验数据、分析结论)必须是你自己的真实研究成果,不能让大模型“代劳”。
  2. 大模型生成的内容可能存在事实错误,尤其是在描述具体技术细节、引用数据或提及他人研究时,一定要逐一核实。
  3. 注意学校的相关规定,部分学校明确要求在论文中声明是否使用了AI辅助工具,使用比例超过一定阈值可能影响论文评审,请事先了解本校的具体规定。

摘要

摘要的作用是简明扼要地概括本论文的研究内容,通常包含以下几部分:

  1. 本文在什么背景下针对什么问题/挑战进行研究、现有研究都怎么做且存在什么问题。
  2. 本文用了什么技术、提出了什么方案、如何解决了上文所说的问题。
  3. 本文的实验现象说明了什么(例如方法的稳定性、优越性、安全性等等),本文得出了什么结论。

对于本科生,中文摘要通常只写一页,对于硕士生和博士生可以酌情增加,但不要写太多,最好两页内。

在摘要结束后通常是一组关键词,关键词一般选取3到8个,选取原则如下:

  • 优先选取能准确描述本文核心方法和研究问题的词汇,而不是宽泛的领域名称。例如,研究大模型水印的论文,关键词应包含”水印”、”大语言模型”等,而不只是”人工智能”。
  • 关键词中应有体现研究对象的词(研究什么)、体现研究方法的词(怎么研究)以及体现研究场景或应用的词(在哪用)。
  • 避免选取过于宽泛的词(如”深度学习”、”机器学习”等),也避免选取过于冷僻的自造词汇,尽量与领域内通行的术语保持一致,方便他人检索到本文。

英文摘要一般是中文直接翻译过来,要确保中英文的内容是同步修改的。英文摘要中要注意以下几点:

  • 时态:描述本文工作时一般用一般现在时(”This paper proposes…”)或一般过去时(”We proposed…”),两者均可,但全文要统一。
  • 人称:英文学术写作通常使用”we”或被动语态(”A method is proposed…”),两者均可,同样要前后统一,不要混用。
  • 语法检查:建议使用专业工具(如Grammarly)对英文摘要进行语法检查,或请英语水平好的同学帮忙审阅。用大模型辅助润色英文摘要也是可以的,但要确认润色后的内容与中文摘要语义一致、没有被篡改。

摘要中要避免:

  1. 不得包含参考文献,可以通过作者、缩写或 RFC 编号来识别某篇论文,但这不常见。(例如,可以写“我们的算法基于史密斯和韦森的工作。”,但不要写“基于已有研究[1],我们设计了XXX算法。”)
  2. 避免出现对众所周知的内容的解释。(例如,“大模型是指那些在训练过程中需要海量数据、超强计算能力和大量参数的人工智能模型”这种几乎是计算机领域都了解的概念就不要在摘要中解释,正文也尽量避免这些通用概念的解释。)
  3. 避免出现数学公式,除非这篇论文最重要的贡献就是提出了这个公式。

引言/绪论

作为正文的第一章,引言需要较为详细地介绍本文是讲什么的,让读者在不看全文的情况下也能对文章有基本了解。引言一定不要重复摘要中的内容。

选题背景和意义

这一部分需要从宏观层面对研究领域进行概述,明确研究目的,为后续研究工作奠定基础。通常结构为大背景+ 小背景。

  • 大背景:介绍整个领域(例如区块链、大语言模型、数据要素)的研究背景,需要结合时代背景、社会热点、国家政策等,一般从XX 很重要、有各种各样的应用等开始,并简要举例说明。

大背景的例子:随着数字经济时代的到来,数据的安全性和透明性变得愈发重要。区块链技术作为一种创新的信息技术,以其去中心化、不可篡改以及透明度高等特点,在金融、供应链管理、版权保护等多个领域展现出了巨大的应用潜力。特别是在当前全球数字化转型的大背景下,各国政府和企业纷纷加大了对区块链技术的研究与投资力度。例如,中国政府在《“十四五”规划》中明确提出要加快推动区块链技术和产业创新发展,促进区块链技术与经济社会各领域的深度融合。此外,社会热点如数字货币的发展(如比特币、以太坊等)进一步推动了公众对于区块链技术的关注度。这些都表明,区块链不仅是一个重要的技术创新点,也是未来数字经济发展的重要基石之一。

  • 小背景:在大背景的基础上,该领域目前有哪个或哪些关键点(与本文相关),针对该问题,小领域已有研究做了哪些方面的努力,但仍然有这样那样的不足之处或仍有XXX 问题没有解决(Research gaps)。因此XXX 亟待研究/是解决XXX 问题的关键所在。

小背景的例子:尽管区块链技术展现了广泛的应用前景,但在实际部署过程中仍面临诸多挑战。尤其是在跨链互操作性方面,不同区块链平台之间难以实现无缝连接,这限制了信息和价值的有效流通。此外,如何在保证安全性的同时提高交易处理速度也是一个亟待解决的问题。已有研究表明,通过引入侧链、闪电网络等解决方案可以在一定程度上缓解上述问题,但这些方法往往需要牺牲一定的去中心化程度或增加系统的复杂性。因此,探索一种既能增强跨链能力又能保持较高安全性能且易于实施的技术方案成为了当前研究的重点。

国内外研究现状

对于本科生或不单独写现状综述的硕士生而言,这一部分参照下一节“研究现状和参考文献”来写。这一节的作用是让读者知道现有研究这个问题的工作都是怎么做的,本研究和他们的区别是什么。

对于单独有一章是现状综述的硕士生或者博士生而言,这一部分要简略地介绍各方面的研究现状,不能太详细以免和后面内容重复。这一节的作用是让读者对该领域内的研究有大致的了解,并知道它们有哪些问题而本研究针对性地解决了。

本文研究内容和创新

这一部分需要讲清楚本文针对什么问题/挑战,采用了什么技术方案,解决问题的效果怎么样,得出了什么结论。通常需要明确介绍研究目标、关键问题和技术路线。技术路线部分要绘制一个全面讲清楚文章逻辑的技术路线图。

技术路线图的画法:技术路线图本质上是一张流程图,用于展示本文的研究思路和逻辑脉络。它不是系统架构图(架构图展示的是系统各模块的关系),也不是实验流程图,而是呈现”从问题出发,经过哪些研究步骤,最终得出结论”的完整研究路径。一张合格的技术路线图应当包含以下要素:

  • 起点:研究动机或问题(例如”现有方法存在XX问题”)
  • 研究步骤:各阶段的工作内容(如文献调研→问题建模→方法设计→实验验证),用箭头连接,体现逻辑递进关系
  • 终点:研究结论或成果(例如”提出XX方法,性能提升XX%”)

技术路线图的绘制工具可以使用Visio、Draw.io(免费)、PowerPoint等,导出为高清图片后插入Word。图的风格要与论文整体风格保持一致,不要过于花哨。

也有一些同学会用AI工具例如nano banana等来生成技术路线图,需要确保图中内容尤其是文字和公式是完全准确的,最好还是在AI生成的基础上自己手动绘制一份,以便后续调整修改。

在讲完技术路线之后,写一句“本文的主要贡献和创新如下”,就可以接着列出本文有哪些贡献和创新点,一般要列出3点。本科生和硕士生在凑不出3条创新点的情况下,可以把贡献和创新混在一起,而博士生最好单独分一节写本文创新点。在创新点凑不出3条的情况下,可以按照下面的格式来写:

  1. 总体框架上的贡献:本文提出了XX 系统/框架等,它有XX、XX 的特点/优势等。
  2. 核心技术上的创新:本文设计了XX 算法等,解决了XX 问题。
  3. 实验结论上的突破:为了XX,本文做了理论分析和实验证明,结果表明XX。

注意创新点的表述一定要斟酌好用词,要能够精准概括本文的核心贡献,不能太夸大或者偏离重点。

本文组织结构

这一部分通常是很固定的套路,简要说每一章做了什么即可,对于博士生,如果总页数略少、章节内容多、结构复杂,可以考虑在这里加个框架图。一个例子如下:

基于上述分析,本文从专家评价系统、空间众包系统和无质量验证系统这三种众包场景入手,分别基于劝说博弈思想、机制设计方法和虚网络结构对质量控制方法进行了理论分析与实验验证,论文的整体组织结构如图3所示。第一章是绪论,阐述了众包质量控制问题的研究背景、研究意义、问题描述以及本文的研究内容与创新点,并介绍了论文的组织结构。第二章是相关研究,分别从任务设计、任务分配和任务验收三个阶段阐述了众包质量控制的研究现状。第三、四、五章是本文主体,分别设计了基于劝说博弈的专家评价系统、基于虚网络结构的空间众包任务分配系统和基于机制设计的无质量验证系统,并通过理论和实验阐述了方法的有效性,分析了不同参数下的系统性能。最后,第六章对本文的主要内容与结论进行了总结,并展望了未来研究方向。

如果不需要凑页数,也可以简短很多:

第二章介绍了背景知识和本文框架,第三章进行了理论模型的详细分析,第四章展示了实验数据,第五章进行总结。

研究现状和参考文献

对于本科生,研究现状通常不会作为单独的一章,而是作为引言的一节。对于硕士生则根据内容量来确定,放到引言或者单独写一章都常见。对于博士生则一般既要在引言中有一节简要说明研究现状,也要有单独的一章内容系统性地介绍现状。

参考文献有数量方面的要求,一般来说,本科生的参考文献需要20到30条,硕士生需要60到70条,博士生需要200条以上。这其中需要有超过50%的英文文献,按照经验最好英文文献比例能到80%以上。

在写这一部分之前,需要在前期进行充分的调研,包括中英文论文、商业化应用成果、网站和自媒体新闻等。在调研的基础上对材料进行梳理,对材料进行简单的分类,并梳理各材料间的逻辑关系。在写作时,最后一段话要按照大类明确每一类研究的不足之处,从而引出本文的研究,写法上可以参考:

  • [分类并列型]:几个分类的方法是按阶段、特征等划分,没有逻辑关系。上述方法各自面临XX 问题,鉴于此,本文提出了XX/研究了XX,用XX 方法解决了XX、XX 等问题。
  • [分类改进型]:A 类方法最先提出,B 类是对A 类的优化改进。A 类的方法有什么优点和缺点,而B 类的方法虽然解决了A的缺点,但也有新的问题。

不一定划分国内外研究,但如果该领域国内外对比很明显,又或者是我国近年来政策重点关注的东西,则可以按国内外分开说明。

去哪里找参考文献

对于英文论文,通常在Google Scholar检索,除此以外也可以使用Aminer等整合了数据的网站,也可以定期关注领域内的会议和期刊。Arxiv上有大量的最新研究论文,但质量不一定有保障,可以适当参考。对于中文论文,通常在知网检索。

什么样的参考文献适合放到论文中

并不是所有根据关键词找到的论文都可以放到毕业论文中引用,我们需要选择其中内容与本研究关联性较强的加以引用。例如本研究关注大模型的水印技术,那么针对大模型水印、指纹等技术的研究可以适当选取放进来,而研究大模型其它方向的论文就不要引用了。

除了前面提到的英文文献比例的要求以外,在选择参考文献时,也要尽量选取质量较高的研究,具体来说:

  • SCI:分为1、2、3、4 区,优先引用1 区的文章。
  • CCF:分为A、B、C 类,既有会议也有期刊,优先引用A 和B 类的文章。
  • IEEE:电气、计算机领域最知名的期刊库,优先引用IEEE trans 的文章。

Aminer检索论文时可以筛选SCI分区和CCF分类。

找到的论文太多了看不过来怎么办

对于大部分参考文献,都只需要略读,阅读摘要、引言和结论,对其有大致了解,只有与论文方法密切相关的参考文献需要花时间阅读全文。

在略读时记录以下内容方便后续撰写论文:

  1. 作者、期刊、发表时间
  2. 关键词
  3. 研究背景和问题
  4. 研究方法
  5. 论文结论
  6. 创新与贡献
  7. 不足之处
  8. 其它备注(例如与另一篇研究之间的关系)

阅读和筛选参考文献的过程中,可以适当借助大模型工具来提升效率,例如让大模型批量阅读搜索到的参考文献并总结其核心内容、让大模型批量判断参考文献与本研究关联性的强弱、让大模型对比参考文献与本研究的异同点等等。在这个过程中要注意审查大模型生成内容的准确性,至少亲自看一眼论文摘要,确认大模型的理解是正确的。

众多参考文献应该如何组织成研究现状

在写研究现状时,不应该直接一条条罗列每个参考文献做了什么事,这会显得割裂,应该将所有参考文献进行分类和组织,将有共同点的文献放到一起介绍。一般有以下几种写法:

  • 针对XX方向,A[1]做了XX研究,得出了XX结论。B[2]则关注XX,做了XXX。与他们不同,C[3]、D[4]、E[5]主张XXX。
  • 从[起始时间]起,学者们开始关注[具体研究点],并逐渐形成了[主要理论/模型/方法]。其中,[代表性观、学者/研究团队]的[研究成果名称]在该领域产生了重要影响,根据A[1]的研究结果显示,[参考文献A 的结论]。同时B[2]的研究表明[参考文献B 的结论,B 是支持A 或在A 的基础上进一步拓展]。然而,在涉及xx 的问题上,C[3,4] 等研究者认为,[参考文献C 的结论,C 反驳A 或者B]。与此同时,D[5]和E[6] 发现[D 和E 的结论,D 和E 是相似并且都反对A 或B,可以支持C,也可以和C 没什么关系]。
  • 当前学术界在[研究方法/技术]方面取得了创新,如[具体技术/方法名称][1,2]的应用,有效解决了[具体问题]。此外,[另一技术/方法][3,4,5]的引入,为[研究主题]提供了新的研究视角。尽管国内研究取得了诸多成果,但仍存在[具体问题/研究空白],如[详细描述问题]。这些问题限制了该领域研究的深入发展,亟需后续研究进行补充和完善。
  • 当前,国内/国际/学术界研究趋势主要集中在[具体研究方向/热点问题],如[详细描述研究方向]。国内/国际/学术界研究中存在多个主要分支,如[分支名称][1,2,3],其理论框架主要包括[简要概述理论框架]。这些学派和理论框架为[研究主题]提供了多元化的解释视角。一些学者在[技术创新/实证研究]方面取得了显著成果,如[具体技术/研究成果名称][4,5,6]的应用,为[研究主题]提供了有力的支持。这些技术创新和研究推动了该领域的深入发展。
  • A[1]指出,xx 年诞生了xx,xx 迎来了新的发展机遇,而到了xx 年已广泛接受。B[2] 指出,xx 是xx 的重要组成部分。对于xx 的影响因素,C 等人[3] 认为,[C 的观点]。D 和E[4] 对于[D 和E 的研究主题]进行研究,研究表明[D 和E 的结论]。对于xx 的问题,F[5]]等人认为[F 的观点],因为[F 的依据]。
  • 将国内外研究进行对比,可以发现两者在[研究方法/理论框架/实证研究]等方面存在异同。国外研究在[具体方面][1,2,3]具有独特优势,而国内研究在[另一方面][4,5,6]则更为深入和全面。
  • 尽管我国在xx 领域的起步相对较晚,但近年来对于xx 问题的研究取得了迅猛发展,特别是在xx 和xx 方向上取得了丰硕的成果。然而,目前的研究主要侧重于对xx 的探索,并且多采用了[研究方法][1,2,3]。相比之下,对于xx 的研究研究的成果相对较少,或者使用xx 方法的研究还不够充分。造成这种情况的原因主要有两个方面,一方面我国在xx 领域的研究历史相对较短,经验和数据积累尚不够充分。另一方面xx 是一个复杂的问题,涉及到多个学科和领域的交叉,需要综合运用不同的研究方法和视角进行深入探讨。
  • 我国相比国外xx 发展较晚,但是近年来关于xx 的研究激增,我国就xxxx 方向展开了研究[1,2,3,4],研究结果丰硕。然而这些研究多集中于xx 方面[1,2,3]/多使用xx 方法而对xx 方面涉猎较少/使用xx 方法较少,原因在于[简要分析国内外差距来源]。

其余部分可以怎么加参考文献

如果参考文献数量上不够,除了研究现状部分以外,还可以在研究背景和理论分析部分适当增加参考文献,例如背景介绍说大模型在XX领域、XX领域、XX领域等广泛应用,就可以在这句话加几个各领域里用大模型解决问题的论文,又或者说本文基于XX方法设计方案,那么提出XX方法的论文也应当引用进来。实验部分涉及数据源、统计方法等内容的说明也可以适当加以引用。需要注意的是,研究背景中与本文关联性较弱的引用尽量不要太多。

相关理论基础

这一章是对本文涉及的理论基础进行说明,通常对应英文论文的Preliminary部分,用于向审稿人和读者介绍一些本文用到了但并非众所周知的技术,比如一些数学理论、硬件基础知识等。但事实上,毕业论文中的这一部分往往被用来凑页数,以使得论文看起来多一些。一般来说博士论文不建议写这一节,硕士论文根据页数决定是否单独写,本科论文可以有这一节。如果你的页数已经很足够且研究内容不涉及小众知识,可以不单独写这一节,而是在后面用到的地方再对用到的技术方案进行简单说明。在写这一节的时候,要注意区分理论基础和研究现状,前者是对用到的技术做科普,后者是对同领域内关注相似问题的其余研究做介绍,不要混淆。

注意这一章的体量不能太多,一般是正文的10%-15%,一定不要超过正文的20%,以免影响论文原创性。

哪些内容应该放在这里

判断某个技术是否需要放在理论基础章节,可以用以下标准来衡量:该技术是本文方法的基础工具,但读者不一定熟悉它,且本文不会对它本身进行改进。符合这个标准的内容才值得放在这里。

以下是一些具体的例子:

  • 研究方向是联邦学习中的隐私保护,那么”联邦学习的基本框架”和”差分隐私的定义和基本性质”可以放进来;但”联邦学习各种变体”属于研究现状,不应放在这里。
  • 研究方向是基于图神经网络的推荐系统,那么”图神经网络的基本原理(消息传递机制)”可以放进来;但”已有的图推荐方法”是研究现状,不属于这里。
  • 研究方向是区块链上的智能合约安全,那么”区块链的共识机制”和”以太坊虚拟机(EVM)的工作原理”可以放进来。

以下内容不应该放在这里:

  • 众所周知的基础知识,如”卷积神经网络(CNN)的工作原理”、”Transformer的注意力机制”等,这些在计算机领域已是常识,不需要介绍。
  • 本文后续章节会对其进行改进或扩展的方法,这类内容应该放在正文理论章节中,在介绍本文方法时先介绍其原型,再说明如何改进。

每个小节的组织结构

理论基础中的每个小节一般按照以下结构组织:

  1. 定义/概念说明:用准确的语言(必要时配合数学符号)定义该技术/概念是什么。如果有正式的数学定义,要给出数学表达式。
  2. 核心原理/关键性质:简要说明该技术的工作原理或重要性质,不需要完整推导,但要让读者明白它为什么有用、有哪些特点。
  3. 与本文的关联:在每个小节的末尾,用1-2句话说明本文的哪个部分用到了这个知识,起到承上启下的作用。这样可以让读者明白为什么要介绍这些背景知识,而不是让读者觉得这些内容与正文无关。

小节结尾的关联说明示例:本文第三章设计的XX算法基于上述差分隐私机制,通过在梯度上添加满足(ε,δ)-差分隐私的噪声来保护用户的训练数据隐私。

正文理论内容

正文理论内容是整篇毕业论文的核心,也是最能体现你研究贡献的部分,需要将自己的研究方法、技术方案和理论推导完整、清晰地呈现给读者。这部分在论文中通常不止一章,博士论文的正文理论内容甚至可以占据三到四章。注意要理清楚逻辑关系,而不要写成流水线说明书。

总体结构:先全局后局部

在开始介绍具体技术细节之前,必须先有一节概述整体框架,让读者在深入阅读之前就能建立起对全文研究思路的整体认识。这一节通常命名为”XX系统/框架/方法概述”或”整体设计”,需要包含:

  1. 问题形式化定义:将本文要解决的问题用精确的语言(必要时用数学符号)描述清楚。例如,给定输入X,目标是得到满足条件Y的输出Z。问题定义要严谨,所有后续章节中出现的符号应在此处统一定义。
  2. 整体架构图:用一张高质量的框架图把系统/方法的各个模块及其关系展示出来,图中要标注数据的流向和各模块的名称。这张图是读者理解全文的”地图”,一定要认真绘制。
  3. 各模块功能简介:对照架构图,用一两句话介绍每个模块的作用,以及各模块之间如何协作,最终如何解决问题。
  4. 章节安排说明(可选):如果正文理论部分分为多章,可以在概述末尾说明各章分别对应架构图的哪些模块,引导读者阅读。

概述一节的写法示例:如图X所示,本文提出的XX框架由数据预处理模块、特征提取模块和决策优化模块三部分组成。数据预处理模块负责对原始输入进行清洗和归一化,消除噪声干扰;特征提取模块基于XXX方法对处理后的数据进行特征学习,得到低维稠密表示;决策优化模块则利用提取的特征,通过求解XX优化问题得到最终输出。三个模块依次串联,数据从左至右流经各模块,最终输出满足XX约束的结果。本章第X节至第X节将依次对三个模块进行详细介绍。

各模块/步骤的详细展开

概述之后,每个核心模块或研究步骤应各占一节(甚至一章),按照”动机→设计→分析”的逻辑依次展开。

(1)动机:为什么这样设计

每个模块在介绍具体方案之前,先要解释清楚为什么需要这个模块、为什么选择这种技术路线,而不是其他已有方案。这部分不需要太长,两三段即可,但一定不能省略。如果缺少动机的说明,读者会不明白你的设计出发点,也无法理解后续方案的合理性。

动机说明的写法示例:现有的XX方法在处理YY场景时存在ZZ问题(此处引用1-2篇相关研究)。这是因为这些方法假设了AA,而在本文的应用场景中,AA假设并不成立。为了解决这一问题,本文设计了BB模块,通过引入CC机制来消除对AA的依赖。

(2)设计:具体是怎么做的

这是每个模块最核心的部分,需要把你的方法介绍清楚到”别人能够复现”的程度。以下几点需要特别注意:

  • 数学公式:凡是涉及算法、模型、优化目标等内容,都应该用规范的数学公式表达,不能只用文字描述。所有公式中的符号要与前文定义保持一致,公式编号要规范(如式(3-1)),在正文中引用时要写”如式(3-1)所示”。
  • 算法伪代码:如果你的方法包含一个完整的算法流程,建议用算法伪代码(Algorithm)的形式展示。伪代码比纯文字描述更清晰,也比真实代码更易于理解。
  • 示意图:对于流程复杂或结构抽象的内容,配上示意图会大幅提升可读性。图的标题要写在图的下方,表的标题要写在表的上方,这是学术规范。
  • 分步骤说明:如果方法包含多个步骤,建议逐步骤编号介绍,不要把所有内容堆在一起,层次清晰才能让读者跟上你的思路。

(3)分析:方法的性质和特点

在介绍完具体设计之后,视内容需要可以加入理论分析,例如:算法的时间复杂度分析、方法的收敛性证明、安全性证明、近似比分析等。这部分内容对于理论性较强的论文(如算法设计、博弈论、优化理论等方向)是必要的,对于工程性较强的论文则可以酌情简化。如果有定理和证明,需要按照正式的数学写作规范,使用“定理X.X”、“证明”等标准格式。

写作中的常见问题

  1. 只堆公式,不解释含义:每个公式出现后,都要用一两句话解释它的物理含义或直观理解,不能只列公式不加说明。读者看公式时需要文字帮助理解,这是良好学术写作的基本要求。
  2. 不区分”已有工作”和”本文贡献”:如果你的方法借鉴了某个已有技术,要在文中明确说明哪部分是已有工作、哪部分是你的改进或贡献。混淆二者不仅容易引起学术不端的嫌疑,也会让读者无法判断你的贡献所在。
  3. 符号前后不一致:论文中所有数学符号必须统一,建议在开始写作前列出一张符号表,写作过程中严格遵守。例如,不能在一节里用n表示样本数量,在另一节里又用n表示层数。
  4. 图表质量差:所有图表都要使用矢量图(如PDF、SVG、EMF格式),不要使用分辨率低的截图。坐标轴要有标签和单位,图例要清晰。图表是论文质量的门面,请认真对待。
  5. 篇幅分配不均:核心创新部分要详细写,非核心的基础性内容不要过度展开。如果某个模块是你的主要贡献,就要相应地分配更多篇幅来介绍它,而不是把所有模块写得一样长。

正文实验内容

这一部分需要介绍实验设置,然后对数据进行分析。

实验设置

(1)软硬件环境

说明运行实验所用的硬件配置(如CPU型号、GPU型号和数量、内存大小)和软件环境(如操作系统版本、编程语言版本、主要依赖库及其版本号)。这些信息看起来琐碎,但对于涉及运行时间、资源消耗等指标的比较至关重要。

实验环境的写法示例:本文实验在配备Intel Core i9-13900K处理器(32GB内存)和NVIDIA GeForce RTX 4090 GPU(24GB显存)的服务器上进行,操作系统为Ubuntu 22.04,Python版本为3.10,主要依赖库包括PyTorch 2.1.0和NumPy 1.24.3。

(2)数据集介绍

说明实验用到的数据集的来源、规模、划分方式(训练集/验证集/测试集比例)以及必要的预处理步骤。如果使用的是公开数据集,要引用对应的文献;如果是自建数据集,要说明数据的采集方式和标注方法。

(3)对比基准(Baselines)

基线方法是与本文方法进行比较的已有方法,选取合适的基线是实验设计的关键。基线的选取原则如下:

  • 要包含该领域具有代表性的经典方法,这些方法通常被后续研究广泛引用。
  • 要包含近年来(一般是近三年内)性能最优或最具竞争力的方法,即所谓的State-of-the-Art(SOTA)方法。
  • 基线方法的数量一般在3到6个之间,太少显得不充分,太多则篇幅冗长。
  • 每个基线方法在首次出现时要附上文献引用,并简要说明其技术思路(一两句话即可)。

对于本科生而言,如果找不到合适的对比方法,或者论文场景不需要做对比,也可以不进行对比。

(4)评价指标(Metrics)

说明用哪些指标来衡量方法的好坏,并给出指标的计算公式(如果指标不是众所周知的标准指标)。例如,分类任务常用准确率(Accuracy)、F1分数;信息检索任务常用精确率(Precision)、召回率(Recall);图像生成任务常用FID、SSIM等。选取评价指标要与研究问题直接相关,不能为了让结果好看而刻意挑选对自己方法有利的指标。

需要注意,这里对评价指标的介绍不要写成统计学方法科普,而是要说明我们为什么选择这个指标、该指标能体现系统的什么特性。例如,“我们用距离的方差来评估算法的效果,方差是指数据的离散程度,计算公式为XXX”这样的写法是错误的,应该改成“我们用距离的方差来评估算法的效果,因为该场景更重视距离的稳定性。”

(5)实现细节(Implementation Details)

对于深度学习相关的论文,需要说明模型训练或方法运行时的超参数设置,例如学习率、批大小(batch size)、训练轮数(epochs)、优化器类型等。超参数的设置方式(手动调参、网格搜索、随机搜索等)也可以简要说明。

对于其它领域的论文,也需要说明类似的配置,例如为了优化实验效率,采取了什么简化措施等。

结果展示与分析(核心)

主实验是将本文方法与所有基线方法在主要评价指标上进行全面比较,通常以表格的形式呈现,这是实验部分最核心的内容。我们可以在实验部分进行以下分析:

对表格数据的分析:实验结果表一般是三线表(顶线、标题线、底线),每列对应一个评价指标,每行对应一个方法。本文方法通常放在最后一行,并用加粗标注每列的最优结果,有时也用下划线标注次优结果。

在表格之后,需要写一段文字对结果进行分析,不能只有表格没有解读。分析的内容要包含:

  1. 本文方法整体上比所有基线方法提升了多少(用百分比或绝对数值说明)。
  2. 本文方法与性能最接近的基线相比有哪些优势,与性能最差的基线相比差距体现在哪里。
  3. 如果某个基线在某些指标上接近甚至超过了本文方法,要给出合理的解释,不能回避。

注意:永远不要在表格中只列出自己方法性能最好的那几个指标,而隐去性能差的指标。完整、诚实地呈现实验结果是学术写作的基本道德。如果本文方法在某些指标上不如基线,要在分析中如实说明并解释原因(例如方法针对A问题优化,因而在B指标上有一定损失)。

对图像数据的分析: 先描述现象,例如“如图4-1所示,本文方法在XX数据集上的准确率达到了95%,比A方法高出3%。”,然后深度分析原因,例如“这主要是因为本文引入了XX机制,能够有效捕捉到数据中的XX特征,从而避免了A方法在XX情况下的失效。”

消融实验(Ablation Study):如果你的方案由多个模块组成,需要通过实验证明每一个模块都是有用的,消融实验的基本逻辑是:依次去掉(或替换)方法中的某个组件,观察性能变化,从而说明该组件对整体方法的贡献。

消融实验的设计方法:

  • 对于每个你声称有贡献的模块,都应该设计一个去掉该模块的对照变体(Variant),例如”去掉注意力机制的变体”、”用全连接层替换图神经网络的变体”等。
  • 变体的命名要简洁清晰,通常用”w/o XX”(without XX)来表示去掉某模块的变体,用”w/ XX”(with XX)来强调某模块的存在。
  • 消融实验的结果同样以表格呈现,并进行文字分析。

消融实验分析的写法示例:为验证各模块的有效性,本文构造了以下变体进行消融实验:(1)去掉动态权重模块的变体(w/o DW),此时各特征使用固定权重;(2)将图卷积网络替换为全连接层的变体(w/ FC)。由表X可知,相比完整模型,w/o DW变体在指标A和B上分别下降了X%和X%,说明动态权重机制能够有效捕捉样本间的差异性;而w/ FC变体的性能下降更为明显,表明图结构信息对本任务至关重要。

并不是所有研究都需要有消融实验,可以根据具体研究内容选择是否要进行消融实验。

参数敏感性分析(Hyperparameter Analysis):如果方法中有重要的超参数,需要通过实验验证方法对这些参数的敏感程度。通常的做法是固定其他参数不变,在一定范围内变化目标超参数的取值,观察性能如何变化,并以折线图或柱状图的形式展示结果。通过参数敏感性分析,一方面说明所选参数值的合理性,另一方面也向读者展示方法的鲁棒性(即在参数合理范围内,性能变化不大)。

其他类型的实验(视情况选做): 根据研究方向的不同,可能还需要以下几类实验:

  • 案例分析(Case Study):从测试集中选取几个典型样本,展示本文方法的具体输出结果,通过直观的例子说明方法的有效性。案例分析对于自然语言处理、图像处理等输出结果可视化效果好的任务尤为重要。
  • 效率分析(Efficiency Analysis):比较本文方法与基线方法在训练时间、推理时间、模型参数量、内存占用等方面的差异,说明本文方法在效率上的优势或代价。
  • 可视化分析:将模型学到的特征、注意力权重、聚类结果等通过可视化(如t-SNE降维图、热力图、注意力权重图)的方式展示出来,帮助读者直观理解模型的工作机制。
  • 鲁棒性实验:在数据带有噪声、缺失或分布偏移的情况下测试方法的性能,验证方法在非理想条件下的稳定性。

实验部分写作的常见问题

  1. 实验部分只有图表,没有文字分析:每张图和每个表后面都必须有相应的文字说明,分析结果说明了什么、验证了什么。图表本身不会说话,读者需要你告诉他们该从哪里看、该关注什么。
  2. 数据来源不清晰:基线方法的实验数据来自哪里(自己复现还是引用原论文)要说明清楚。如果是引用原论文的数据,要注意数据集和评估方式是否与本文一致,不一致时要说明差异。
  3. 随意调参使结果”好看”:超参数的选取要有依据,不能在测试集上反复调参直到自己方法最优。正确的做法是在验证集上调参,然后在测试集上只跑一次得到最终结果。
  4. 图的质量差或配色混乱:折线图和柱状图中,不同方法要用不同颜色和不同线型(实线、虚线等)区分,并在图例中标注清楚。坐标轴的范围要合理,不要为了让自己的方法“显得很高”而截断纵轴,也不要让坐标轴太长而显得数据没有区分度。

    总结展望

    总结与展望通常是毕业论文的最后一章,篇幅不长,本科论文约1-2页,硕士论文约2-3页,博士论文约3-5页。

总结部分的目的是对全文的研究内容和主要结论进行回顾与凝练,让读者在读完整篇论文后能够再次明确本文的核心贡献。总结不是摘要的复制粘贴,而是在读者已经阅读了全文的基础上,对研究成果进行更具体、更深入的概括。

总结部分的写法一般是按照论文的章节结构,依次说明每章/每个模块做了什么、解决了什么问题、得到了什么结论。但与组织结构一节中的简单说明不同,这里的总结要更强调”结论”而不是”内容”,即不只是说”第三章做了XX”,而是说”第三章通过做XX,发现/证明/得出了YY结论”。

总结的写法示例:本文针对众包场景下工人答案质量难以有效评估的问题,从三个典型场景出发,分别提出了相应的质量控制方法,并进行了系统的理论分析和实验验证。具体而言:(1)针对专家评价系统,本文基于劝说博弈思想设计了XX机制,理论证明该机制满足激励相容性,实验表明在样本量有限的条件下比现有方法平均提升了X%;(2)针对空间众包任务分配问题,本文提出了基于虚网络结构的任务分配算法,实验证明该算法在保证质量的前提下可将通信开销降低约X%;(3)针对无质量验证的场景,本文设计了基于机制设计的真相发现方法,在XX数据集上的实验结果表明其优于所有基线方法。上述三项工作共同构成了一个面向多场景众包质量控制的研究体系。

研究局限性可根据篇幅来判断是否要写,一般建议至少有一两句说明局限性,局限性的说明不是自我否定,而是对研究边界的清醒认识。局限性的内容可以包括:

  • 方法的适用范围:本文方法在哪些假设条件下成立,脱离这些条件后性能如何。
  • 实验的局限:数据集规模是否足够大、实验场景是否足够多样、是否覆盖了所有重要的应用场景。
  • 计算资源的限制:是否因为计算资源不足而只使用了较小的模型或数据集,导致结论的普适性受限。

展望部分是对本研究未竟事业的展望,说明该领域还有哪些重要问题有待解决,未来可以从哪些方向继续深入研究。这部分不能泛泛而谈,要与本文研究内容紧密相关,说明基于本文的工作可以进一步做什么,而不是漫无边际地说”未来人工智能有广阔前景”之类的空话。

未来工作展望通常从以下几个角度来写,选2-3个即可:

  1. 本文方法的改进:本文方法存在哪些已知的不足,下一步可以如何针对性地改进,例如降低计算复杂度、提高在特定场景下的鲁棒性等。
  2. 研究场景的拓展:本文方法目前只在某种场景或数据集上验证,未来可以探索其在更多场景或任务上的适用性。
  3. 研究问题的延伸:本文解决了问题A,但在研究过程中发现了与之相关的问题B也很有研究价值,未来可以以本文为基础,继续研究问题B。
  4. 与新技术的结合:领域内出现了某种新技术(如大模型、强化学习等),未来可以探索将其引入本文的研究框架,以进一步提升性能或拓展能力边界。

展望的写法示例:尽管本文在XX问题上取得了一定进展,但仍有若干方向值得在未来进一步探索。首先,本文提出的算法时间复杂度为O(n²),在大规模数据集上运行效率受限,未来可以引入近似算法或并行计算策略对其进行加速。其次,本文目前仅在静态场景下进行了验证,而现实中数据往往具有时序演变的特性,未来可以考虑将动态图建模方法引入框架以处理这类场景。此外,随着大语言模型的快速发展,如何将其强大的语义理解能力与本文的结构化建模方法有机结合,也是一个极具潜力的研究方向。

总结展望的常见问题

  1. 总结与摘要内容高度重复:总结应当比摘要更具体,要体现出读完全文后才能得到的深度理解,而不是把摘要的句子换个顺序重新写一遍。
  2. 展望内容空洞:展望要落地,要说具体的技术方向或问题,而不是说”未来我们将继续深入研究该领域”之类的套话。
  3. 篇幅过短:有些同学把总结展望写成两三百字就结束了,这会给读者留下草草收尾的印象。总结要对每一项主要工作都有所回顾,展望也要有实质性的内容。
  4. 局限性过度回避:有些同学担心写局限性会影响论文评价而刻意回避,其实适度地承认局限性反映了研究者的严谨态度,是加分项而非减分项。
  • Copyrights © 2020-2026 Kun Li

请我喝杯咖啡吧~

支付宝
微信