论文分为实证性论文和论证性论文。大部分论文都是实证性论文。而实证性论文普遍采用 IMRD 结构。比如,SCI(科学引文索引)所收录的期刊,普遍要求作者采用 IMRD 结构撰写论文。本节就是要一种通俗易懂的方式讲清楚 IMRD 结构。
所谓 IMRD 结构,就是要求论文按照「引言(Introduction)」、「方法以及材料(Method and Material)」、「结果(Result)」和「讨论(Discussion)」四个部分来撰写。这几个单词的首字母合并在一起就是 IMRD。
有些论文的结构与它略有不同,只是形式上所有变化,但在底层逻辑上并没有区别。
掌握 IMRD 结构,是写好实证性论文的关键。而要掌握 IMRD 结构,首先需要了解 IMRD 结构的写作要求,其次需要具体实例来巩固认识。IMRD 结构的写作要求,早已是公开的知识,只是不同的教程有不同的理解。
但要找到一个巩固学习的实例却不容易。因为这种巩固学习的实例,一般应该是学习者所熟悉的,否则他还要花时间去学习实例。对于新手,他没有写过论文、甚至没有接触过论文,这就不容易找到合适的案例了。
为此,我苦思冥想了很久,终于找到了一个恰当的、而大家又非常熟悉的案例,来帮助新手理解 IRMD 结构。而且这个案例又不限于某个专业,而是适用于所有专业。
在介绍本节之前,我们还需要首先了解两个知识。一是,实证性论文和论证性论文的区别;二是,方法型实证性论文和材料型实证性论文的区别。
(一)实证性论文和论证性论文的分类
关于论文的类别,有很多不同的分类方法。有人将论文分为毕业论文、期刊论文,等等,有人将它分为社会科学论文、自然科学论文,等等。但从逻辑展开思路看,论文分为实证性论文和论证性论文。
大家都知道,毕业论文属于议论文,而议论文包括三要素,分别是论点、论据和论证。论证性论文将总论点分解成若干了子论点,通过对子论点论证,实现了对总论点的论证,在这中间,它并不怀疑论据的可靠性。
但从文艺复兴时代开始,越来越多的科学家开始对论据的可靠性提出了怀疑。比如,人们开始用更加科学的观察和实验的方法来确定论据的可靠性。
现在我们虚拟一篇论文来说明实证性论文的逻辑。相信大家都听过,比萨斜塔自由落体实验,尽管这是一个人们虚构的故事,并且假托在伽利略身上。但这个故事里的智慧值得借鉴。
首先,亚里士多德说,两个物体同时被抛出,重的先落地,轻的后落地。后来,这个观点被人质疑:如果将轻重两个物体捆在一起,它比重的更重,应该先落地;但同时在它内部,轻的会脱重的后腿,应该比单个重的后落地。请注意,这个讨论是在论点层面的逻辑思考,而没有考虑论据。直到伽利略登上比萨斜塔,做了自由落体实验,才解决了论点的争议。
我们假设自己是文艺复兴时期的伽利略,现在要撰写一篇关于自由落体试验的论文。其逻辑结构如下:
1、研究背景——提出问题:空中扔下两个物体,谁先落地?
2、前人的研究——亚里士多德说,轻的先落地,重的后落地。
3、对前人研究的质疑——如果将轻、重两个物体捆在一起,那么它比重的还重,是不是应该先落地;呢?可是在内部,轻的又会牵扯重的,应该比单个重物后落地。
(以上是论证性论文的思考结果)
4、本文的研究——通过高空中扔下不同的物体,观察落地情况,分析物体落地机理。
5、试验设计
(1)试验地点:比萨斜塔
(2)思路:a),同时扔将一个 10 公斤的铁球、一个 1 公斤铁球,看谁先落地;b)同时仍出去一个 1 公斤铁球和一个 1 公斤帽子,看谁先落地;。
6、试验结果
(1)10 公斤的铁球和 1 公斤的铁球同时落地;
(2)1 公斤的铁球、1 公斤的帽子,铁球先落地。
7、试验讨论
根据实验结果进行讨论,同样的物体,落地先后与轻重无关;同样质量的物体,落地先后与材质有关。
8、结论
自由落地运动状态,与质量无关,与材质有关。
(二)方法型实证性论文和材料型实证性论文的区别
可能有细心的朋友注意到了,IMRD 中的三个字母都表示一个单词,但是 M 却是两个单词,分别是 Method 和 Material。这是因为,实证性论文可以分为两类,分别是方法型实证性论文和材料型实证性论文。有的书籍把它们称为理论型实证性论文和实验型实证性论文。
理解这两类论文的区别,需要首先了解下 IMRD 结构的逻辑。
在材料型实证性论文中,IMRD 结构的逻辑是:
(1)引言;
(2)材料,也就是研究对象。这个研究对象,不仅可能是化学里面的材料,还有可能是工程学里面的设计、计算机科学里面的数据、生物科学里面的基因、医学里面的疾病、心理学里面被测对象,等等;
(3)研究方法,面向问题,研究材料所使用的方法;
(4)结果,研究材料所产生的结果,比如材料某种特性数据、设计的效果数据、计算机科学里面模型,等等。
(5)讨论,基于结果进行推论;
(6)结论,对全文的总结,有时与讨论部分合并在一起。如果独立作为一个部分,那么 IMRD 就演化成 IMRDC。
但在有些论文中,研究方法和材料颠掉过来。先是研究方法,后是研究材料。这就是方法型实证性论文。因为它的研究对象是研究方法,而不是材料。
大家应该都学过「庖丁解牛」的故事。这其实是一篇方法型实证性论文。在这篇论文里面,它的研究对象是解牛之法,牛是研究材料,数千头牛快速正确被解开且刀不坏,这是结果,这个结果证明了解的方法是科学合理的。牛的组成既不是人们关注的问题,事实上也是事先知道的。而假如这是一篇材料型实证性论文中,那么牛是研究材料,牛的组成是研究者关注的问题,解之法是成熟的,是不受怀疑的,是未用于解牛,但曾用来解猪、解羊,而被证实有效的。通过解,发现牛是由牛骨、牛皮、牛筋、牛肉组成,这是研究结果,这个结果是过去未知的,是研究的意义所在。
这就是方法型实证性论文和材料型实证性论文的区别。不过,有些论文同时研究了方法和材料,也就是采用了新方法研究了新对象。
由于材料型实证性论文更便于理解。因此,我们将以材料型实证性论文为例,介绍 IMRD 的结构以及写作要求,方法型实证性论文也可以参考借鉴之。
我们将按照一篇完整的数据实证类论文包括六个部分:(1)引言;(2)方法;(3)数据采集;(4)数据分析结果;(5)讨论;(6)结论等六个部分介绍。有些论文将「方法」和「数据采集」两个部分合并,有些论文将「数据采集」、「数据分析结果」、「讨论」合并在一起,有些论文则将「讨论」和「结论」。但本质上并无区别。使得文章分为四个、五个部分。为便于读者充分了解数据分析类实证性论文,本书仍然按照六个部分逐个进行介绍。
一、引言部分写作
1、引言的写作目的
引言的写作目的,就是要回答好以下三个问题:
(1)「why」——为什么要开这项研究?要从现实意义或者理论意义上,阐明开展这项研究的必要性、重要性;
(2)「what」——研究什么?用简洁的文字告诉读者所要研究的问题;
(3)「how」——如何研究?即用简洁的文字勾勒出整个论文的研究思路。
读者获得这三个问题的答案,就应对论文有一个初步的、完整的印象。
2、引言的结构
为了能够达成以上三个部分,引言部分的逻辑如下:
(1)本文准备研究什么课题?
(2)为什么要研究这个课题?
(3)围绕这个课题,别人都开展了什么研究?
(4)还存在哪些不足、空白等,需要本文去研究的情况?
(5)本文准备怎么去研究?
在结构中,将问题(1)(2)的答案对调一下,然后合并,形成引言的第一个部分,称之为研究背景;将问题(3)(4)的答案合并,称之为研究现状;将(5)作为第三个部分,即研究思路。具体来说:
(1)研究背景——现实或理论中存在一个什么问题,值得研究。
首先从宏观上介绍背景情况,突出形势的严峻性;其次点出所研究课题,体现研究课题是破解严峻形势的关键所在。通过研究背景的介绍,要让读者充分认识到所研究课题的重要性和必要性。
下一小节我们还将详细介绍如何撰写研究背景。
(2)研究现状——这个课题下有哪些研究、哪些不足,给本文什么样的启示。
它也分为两个部分:首先介绍国内外在该课题下的研究文献,其次要指出现有研究未能解决什么问题和给本文什么样的启示。
本书的第六章还会详细介绍如何撰写文献综述(文献综述的内容就是研究现状),在此不做详细介绍。
(3)研究的思路——本文准备采用什么方法来进行研究这个主题。
研究思路通常很短,往往是包括若干个短句的一句话。但也同样包括两个部分:(1)用什么方法;(2)研究什么问题。
曾有的学生认为,论文的「方法」部分详细介绍如何开展研究,因此在引言中不需要介绍如何研究。这是错误的认识。因为,如果引言只告诉读者研究什么、不介绍如何研究,逻辑是不完整的。介绍了研究什么,再介绍如何研究,这是逻辑的自然延伸。
3、研究背景的结构框架
这里我们重点介绍研究背景的写作。前面,我们已经介绍了研究背景分为两个部分:一是背景情况,二是研究课题。
研究背景又有三种结构框架。
第一种是「钩沉索隐」。如果读者对论文课题不太熟悉,作者就需要将课题的来龙去脉交待清楚。
如,「地铁车站内的楼梯和自动扶梯作为连接站台层和站厅层的主要乘降设施,是乘客进出站及换乘的必经场所。通常情况下,乘客多偏向于选择自动扶梯而非楼梯。客流高峰时期,步行楼梯和自动扶梯利用的不均衡性导致了步行楼梯上客流密度相对较小,而自动扶梯前因乘客排队过长而形成客流瓶颈。因此,分析城市轨道交通车站内乘客对上行楼梯和自动扶梯的选择行为特性,对人性化改善乘客的乘降设施,提高换乘设施的通过能力具有重要意义。」(摘自《地铁乘客对步行楼梯和自动扶梯的选择行为分析及建模》一文)
这篇文章的研究背景共计 4 句话。前 3 句话依次介绍了「楼梯和自动扶梯的作用」「乘客有选择偏向」「选择偏向影响通行能力」。最后一句点处论文的研究课题——「分析选择行为特性」,并指出研究意义——「提高设施的通过能力」。这四句话层次分明、衔接有序。
第二种是「开门见山」。如果研究课题比较热门,则可以直接开门见山,但需要介绍研究的意义。
如,「信号交叉口行人闯红灯行为危害显著。一是人车冲突带来交通安全隐患。据统计,2011 年行人死亡占道路交通事故死亡总数的 25.1%。二是机动车避让闯红灯行人,导致路口通行能力下降、加剧交通拥堵.三是造成路口秩序混乱,影响了社会文明形象。因此近年来,特别是 2012 年以来,『中国式过马路』成为网络热门词汇之后,行人闯红灯行为,引起了我国社会、政府和学术界关注。」(摘自《基于 Logistic 回归模型的闯红灯行人的人口特征研究》一文)
行人闯红灯问题比较热门,不需要介绍行人闯红灯这一问题的来龙去脉,但从三个方面介绍行人闯红灯的危害。假如没有这三个方面危害,就使得研究背景过于单薄。
第三种是「边叙边评」。如读者对论文课题比较熟悉,但同时需要强调研究的意义,就可以采用边叙边评的方式。
如,「交叉口的安全运行是确保路网畅通的基础,但同时,交叉口也是交通路网事故的高发地点。美国 2010 年的统计结果表明,交叉口事故约占总事故数的 28%。2010 年车辆碰撞产生的损失总额为 23 060 万美元,交叉口事故损失占到 30% 左右。为了提高交叉口车辆行驶的安全性,各国普遍实施了进口道限速。美国在二战时从节约能源的角度将进口道的限速值设为 56 km/h,之后修正到 88 km/h。1987 年修改到 97.5 km/h,1995 年之后允许各州自己制定限速值。美国统一交通控制设施手册(manual on uniform traffic control devices,MUTCD)提出,限速设置可根据具体的道路情况,推荐取值为交叉口进口道的 85 分位速度值,车辆在行使时允许上下浮动 8 km/h。我国目前对于交叉口进口道限速值设置的研究较少,也缺乏规范性的指导标准。」(摘自《限速值对信号交叉口交通安全的影响分析》一文)
这篇文章的研究背景首先阐明交叉口的交通安全的重要性,接下来指出限速对于保障交叉口安全的重要性,最后指出了研究课题,即交叉口的限速问题。
4、研究背景的写作技巧
在了解研究背景的结构后,下面介绍下如何撰写研究背景。
首先,提取以论文研究主题为核心,找到它的所在研究上级主题;其次建立从上级主题到研究主题之间的关系。但是,这些研究主题之间要用高度凝练的语言对进行概括。其篇幅在 4 到 6 句话。而这 4 到 6 句话之间,不能跳跃、前后不搭,必须环环相扣、引人入胜。
5、研究背景写作中常见问题
(1)距离过远——研究背景的起点与研究课题距离过远,论文迟迟不能进入主题。
通常一篇六千字的论文,研究背景应不超过 200 字,应在 4 到 6 句话之间将研究背景交待清楚。一句话将话题从一个大的研究范围过渡到一个小的研究范围,通过需要 3 至 5 次的过渡,研究范围迅速圈定到本文的研究主题上。
很多论文出现距离过远这一问题,原因作者是对读者定位错误,将读者默认成自己了。有些同学第一次写作毕业论文,内心很兴奋,又因为复习了过去的知识、学习了新的知识,收获了很多,觉得这些都应该和读者分享,都写到引言中,导致引言极为臃肿。实际上写作论文,是创新知识,而不是撰写学习心得体会。
另外,还有一些同学因为平时很少接触论文,但经常接触教材,于是按照教材的风格去写作学术论文。但教材通常以不了解这门知识的学生作为读者,因此讲得比较细致。但论文的读者不是学生,不需要讲得过于细致。
(2)距离过近
我有一名学生在写作毕业论文时,上来直接介绍所研究的问题,并没有背景情况。
我问他:「你为什么不交待下背景情况?」
他说,「我觉得大家(他和我)都知道研究背景,没有必要说那些『废话』。」
我继续问:「所以,你认为你的论文是写给老师看的么?」
他疑惑说:「难道不是?」
我说:「不是!」
(3)读者是谁
很多学生不知道论文读者是谁,这是导致他们写不好研究背景的原因。
论文的读者是谁?是指导老师?不是。是自己?不是。是同学?也不是。
那么,谁是论文的读者?是「小同行」。
什么叫做「小同行」?同行是,与你从事同一个行业(学科)研究的研究者。不过同一个行业内有若干个领域,不是所有同行都对你的论文感兴趣,只不过是那些和你从事同一个领域工作的人对你的论文感兴趣,希望从中得到借鉴。这些人称之为「小同行」。小同行的概念,意味着他和你具有差不多的知识基础,他可能对你的论文感兴趣。
如果「小同行」这个概念过于抽象,还令读者不能很好理解,那么就可以将「小同行」具体为答辩老师。
研究背景的任务就是,让「小同行」对论文的主题感兴趣。为此,研究背景需要将读者(小同行)已知内容和研究主题之间的联系起来。《金字塔原理》一书有一句话特别好「文章的序言(前言、引言、导言)概述读者已知的信息,并将这些信息与文章将要回答的疑问建立联系,然后作者就可以将全部精力放在提供回答疑问的答案上。」
6、小结
引言部分,看似离论文主体最远,似乎并不重要。其实不然,因为它是结论的背景,要想让结论的创新意义、理论意义、实践意义体现出来,就需要将背景交待清楚。没有绿叶衬托的红花,也不再那么红。
其次,引言中的研究背景部分看似很容易写作。对于新手而言,它是论文中唯一能看懂的部分。但要想写好它,并不容易。因为它要用凝练的语言,将论文所处的学术背景或实践背景高度概括起来,这需要作者对学术背景或实践背景有着较为全面、深刻的认识。所以,一个新手与资深研究人员写出的引言,给人感觉是不同的。
二、方法部分写作
1、方法的写作要点
如果将我们的视野限定在数据分析类实证性论文上,即我们只看到数据分析类实证性论文,那么方法部分是「最容易」撰写的。因为,在数据分析类实证性论文中,有时方法就等于技术。如,论文需要采用一种叫做 Logistic 回归的数据分析技术,那么我们可以找一篇使用了 Logistic 回归的论文进行参考,甚至可以将所参考的那篇论文中方法部分搬过来。
但,方法不等同于技术。技术是具体解决问题的手段,而方法则是解决问题的基本思想。如,在《庖丁解牛》中,刀是具体工具,解才是方法,包括如何看牛、如何入刀、如何运刀等等。
回到具体问题上来说,对于一个数据分析类实证性论文,除了数据分析技术,方法还可能包括数据采集流程、数据如何进行抽样获得、数据分析软件是什么等。如果数据是通过调查问卷获得的,那么调查问卷是如何设计的。如果是实验类实证性论文,那么方法还包括试验设备、实验设计等等。
所以,更为周全的讲,方法包括了两个部分,一是宏观设计,二是具体技术。对于一个简单的课题,一个技术可能就足以解决问题。但对于一个复杂问题,则可能需要几个技术才能解决。甚至有些复杂课题,需要将课题进行拆借,分解成若干个子课题,每个课题需要不同方法。所以,方法是一个集合。事实上,在很多英文文献中,「方法」部分的标题常常用复数词形式(methods)。同时,还需要考虑这些方法之间的前后衔接关系,这就需要进行合理设计。这就是技术路线。
2、方法写作的注意事项
论文要求低重复率,但是很少有论文在方法部分有创新,多数论文采用的是通用的方法。这样就产生了矛盾。对此,笔者认为,对于一些常见的方法,可以简略的介绍一下。甚至可以忽略不写。有时,需要将方法与实际情况结合起来,则自然有创新性。
三、数据采集和描述部分写作
广义的数据分析,包括数据采集和数据分析两个环节。数据采集是数据分析的基础和前提。开展数据分析之前,介绍数据采集结果十分必要。假如我们将整个数据分析比成做菜,那么数据的采集如果买菜和备菜的过程。
本部分可以包括四个方面内容,分别是数据来源、数据规模、数据预处理和数据特征描述。
(1)数据来源。这一部分需要交代数据如何获得,包括数据来自哪个机构或者信息系统、数据采用何种调查问卷获得的、数据在什么地点采集获得的、甚至数据采用何种实验器材获得等一个方面或者几个方面的信息。
(2)数据规模。论文需要告诉读者数据采集的范围和规模。数据采集范围主要是指数据采集的时间范围和空间范围;数据规模主要是指记录数和字段数。有时,数据采集之后还需要剔除部分数据,比如调查问卷发放 200 份,但由于种种原因,只回收了 180 份调查问卷;再比如利用信息系统获得 1000 条数据,但因为部分项目缺失,导致只有 980 条数据可以使用,这些情况都需要在论文中加以说明。
(3)数据预处理。原始数据可能并不适合直接用来分析,需要进行一定的加工处理,如,将连续数据处理为离散数据、数据标准化、将分类变量处理成哑变量等等。如,因为数据分析方法要求,将当事人按照某个标准,划分为青年、中年和老年,这就是将连续数据处理成离散数据,需要在论文中说明。
(4)数据特征描述。有时由于数据规模较大(记录数和字段数都比较多),为了让读者能够全面而简要地了解数据基本情况,往往采用数据的基本统计量(平均值、中位数、方差、最大值)等等,或者频数直方图对数据整体情况进行描述。
需要指出的是,数据的描述和数据的描述性分析并不相同。数据的描述是让读者了解数据的基本情况,如规模、平均值等等。而数据的描述性统计则是,通过对比分析、趋势分析、比例分析等描述统计分析方法,让读者了解隐藏在数据背后的规律。
不过,有的研究数据采集内容,则论文中没有数据采集部分,有的研究数据采集工作较少,则论文将数据采集与方法或分析结果合并成为一节。
四、分析结果部分写作
1、分析结果部分的写作要求
本部分是要将数据分析结果报告出来。数据分析结果非常丰富,不可能将所有结果都在论文中进行展示,因此就必须选择部分关键内容在论文中进行报告。
但不同的数据分析方法需要报告不同的分析结果,研究者可以根据自己选用的数据分析方法,参考相关文献,全面、无遗漏地将报告数据分析结果。在此,本书无法一一介绍,仅举几个简单的例子。
如,采用卡方独立性检验这一方法,需要报告的内容有:数据的交叉表分布情况、两个变量之间独立性的卡方统计量、卡方统计量对应的 p 值。
再如,使用方差分析这一方法的论文,需要报告的内容包括:组内方差值、组间方差值、组别数量、数据记录数、F 值和对应的 p 值等等。
又如,使用回归分析分析这一方法的论文,需要报告的内容包括:回归模型的参数估计值、参数的 t 检验结果、模型的拟合值、残差检验结果等等。
图表以其清晰的特点,被广泛地用来描述分析结果。本书的第八章将详细介绍图表的使用。在此不加赘述。
2、注意要点
在分析数据中有一些软件和设备的操作步骤以及分析过程中会产生一些中间结果,这些内容需要记录到实验报告中,而不能撰写到论文中。
如,有的学生采用 excel 进行卡方独立性检验,在分析过程中会得到边缘分布,这属于中间结果,应该记录到实验报告中,但不能写入论文中。再如,有的学生使用 SPSS 分析数据时,需要对多水平的分类变量进行编码,这个编码操作需要写入实验报告,但同样不需要写入论文中。
这是因为,在学术研究中有一个设定,即研究者的实验能力是被信任的,因此其操作过程是正确的;同时论文是给同行阅读的,同行也具有相关方面的基本操作能力,因此,在论文篇幅受限的条件,不需要对操作细节赘述。
但研究者需要将这些操作步骤或中间结果记录到实验报告。这是因为,我们不能笃定我们的分析是正确的。当我们发现分析结果中存在可疑情况,需要重新检查这些分析过程,此时有原始实验记录供我们检查。
五、讨论部分写作
1、结果和结论的区别以及讨论的作用
曾有学生表示,不明白结果和结论的区别。这里首先需要介绍结果与结论的区别。结果是从数据资料分析中获得的信息,而结论则是在结果基础上经过讨论获得的规律。按照议论文的结构,结果是论据,而结论是论点,而讨论则是论证部分。
为了增加读者对结果和结论之间区别的理解,我们以苏轼的《题西林壁为例》一诗为例。这首诗的内容是「横看成岭侧成峰,远近高低各不同;不知庐山真面目,只缘身在此山中。」从学术论文角度看,这是一篇包括了「方法、对象(数据)、结果和讨论」四个部分的学术论文。
采用学术论文的格式分解这首诗。作者的研究问题是「庐山真面目是什么样?」;采用的技术是「看」,然后有「横、侧、远、近」四种「看」,这就是方法;研究对象是庐山;研究结果是「岭、峰、高、低」。进一步概括起来,是「各不同」,但这个认识还是停留在表面。从「各不同」推导得到「不知庐山真面目」然后进一步分析原因,即「只缘身在此山中」。这样就得到更深刻认识,这就是讨论的价值,也是结果和结论之间的区别。
再以实际研究为例。如,我们采用卡方独立性检验这一方法,检验两个因素之间是否独立。分析结果包括了两个因素的交叉表分布、卡方统计量以及 p 值(假如 p 值等于 0.03)。至此分析结果报告完毕,但这仅仅是结果,并非结论。结论是什么?两个因素相互独立。两个因素相互独立这个结论能从数据分析中直接得到么?不能。它还需要推理。
这个推理的逻辑是由大前提、小前提和结论共同组成。大前提是,「从统计显著性来看,如果 P 值小于 0.05,则两个变量相互独立;如果 P 值大于 0.05,则两个变量之间不独立。」小前提是,「p=0.03这个统计显著性还与研究所在学科有关系。如,在医药研究中,为了慎重,一般将统计显著性定义为 p 值小于 0.01。这样,当 p 值为 0.03 时,结果不变,结论却变化了。因为 p=0.03>0.01,结论是,两个变量不独立。
再以马德堡半球实验为例。两个铁质半球合在一起,抽取空气,拉不开,能证明空气中存在气压么?不能。这只是一种现象。从这种现象到结论,需要一系列的分析、推理。
当然,有的分析结果或者实验结果与论点关系较为清晰,这样讨论部分就可以相对简略。而有的关系则相对较为复杂,需要详细分析,则讨论部分篇幅就会大一点。
2、讨论部分写作要点
讨论就是一种论证,是从结果推导出结论的论证。讨论要围绕着论点展开的,这种展开又分为两个基本类别:一是论点的延展;二是论点的解释。
所谓论点的延展是指从本论点开始,然后延伸到其他论点。如:
根据独立性检验,发现 A 和 B 之间存在相关性;
根据此前的研究,操控 C,可以影响 B;
因此,操控 C 可以影响 A。
所谓论点的解释,就是尽管从数据分析结果角度已经证明了论点,但是还是要从专业角度对论点进行解释。如,独立性检验证明了 A 和 B 之间存在相关性,但是仍然需要解释为什么 A 和 B 之间存在相关性。
这种解释可以从以下四个方面展开:一是结合专业的常识性知识进行讨论;二是结合其他数据分析结果进行讨论;三是结合某个参考文献进行讨论;四是结合经验观察等进行讨论。
显然,讨论部分写作与所研究学科有关,在此也不做赘述了。
六、结论部分写作
1、写作目的和内容
结论是对研究问题完整的、最终的回复。它分为成果概括和自我评价两个部分。而自我评价又需要研究者分别从优点(创新性、理论价值、实践价值等)和缺点(不足及未来如何改进)两个方面展开。这样,结论包括三个部分:
(1)主要成果
在结论之前,论文已经形成一些研究成果。但在结论中,还需要对研究成果做一次梳理,并进行概括,然后与引言中的问题呼应起来,形成一个闭环。
如,在研究中,我们分析了 8 个因素对某个现象影响,发现有的存在影响、有的不存在影响。在结论中,我们可以概括为「XXX、XXX、XXX、XXX、XXX 等 5 个因素对现象存在影响,而 XXX、XXX、XXX 等 3 个因素对现象不存在影响。」这一概括的标准是,全面、重点地总结了论文成果。
《题西林壁》一诗没有引言,也没有结论。但是我们可以按照学术论文的标准为这首诗添加一个结论。这首诗的分析结果是「各不同」,讨论部分是「不知庐山真面目,只缘身在此山中」,而结论中的主要成果部分可以写做「因在山中,故不知庐山真面目」。这句话虽然与讨论部分完全相同,但角度不同。即讨论部分是从现象到原因的分析、推理,符合讨论的思维模式;而结论中则是从原因到结果,是在陈述一个道理,符合结论的表达模式。因此,有时候讨论和结论部分虽然意思是重复的,但表达方式和表达目的不同。
另外,我们还可以给这首诗添加一个引言,如「前人对庐山形态做了各种描述,但莫衷一是,轼游山多日,有所悟。」
(2)主要创新点和价值
对论文成果的正面评价,主要是为围绕创新点、理论价值和实践价值进行评价。一个好的评价,应该是对引言部分研究背景、研究现状的回应。研究背景阐述研究的必要性、研究现状介绍当前研究的不足。那么这一部分应该是介绍如何填补了研究不足,以及产生什么样理论价值和现实价值。
需要注意的是,对研究成果的正面评价不可以过高,不能轻易用「填补了空白」、「彻底解决了 XX 问题」这样的评价。
(3)不足和展望
任何研究都存在一定的不足。要在论文的最后认真反思论文,指出自身的不足。这种不足可能存在于研究的逻辑、基本假设、方法、数据、分析、研究条件等等方面。需要注意的是,这种不足不应该是论文的致命问题。如果存在,论文应该重新撰写。
在指出不足之后,作者也可以适度的展望如何开展下一步研究。
再以《题西林壁》为例,阐述如何撰写「不足和展望」部分。不足可以写做「不知庐山真面目,是因为观察不得法,即在局内观察,而非局外观察」,展望可以写做,「异日技术发展,后人能展翅高飞,临空观察,必能得到庐山全貌。」
2、注意事项
可能有些读者会疑惑,如果按照本书的建议,结论部分岂不是对论文内容的重复。更进一步可能会发现,论文的结论、讨论、引论以及摘要等之间都存在着彼此重复的问题。这种重复合理么?
这种重复是合理。一般来说,写作是尽量不能重复的,但有时重复也是必要的。如,我们知道有一句特别著名的重复的话,就是鲁迅先生的「我家后院有两棵树,一棵是枣树、另一棵也是枣树」,这句话用重复充分表达作者的愤懑的情绪。
在学术论文中,重复现象是普遍存在的。以数据分析类实证性论文为例,在摘要中,文章介绍研究方法;在引言中,文章介绍了研究思路;在方法中,文章还是介绍研究方法。这三个部分提供的信息本质上是一样的。同样,在摘要中,文章介绍研究结果或结论;在讨论中,文章介绍了研究结果或结论;在结论中,文章又一次介绍结论;甚至引言的研究思路中,文章介绍研究的预期成果。此时这些部分也是具有一定重复性。
所以,「重复」是学术论文的一大特点。但是为什么会有重复?因为在学术论文中,论文正文分为引论、正论和结论三个部分,其中引论即指引言。这三个部分与摘要彼此之间具有一定独立性。读者在阅读任意一个部分,都应该能知道论文的基本概貌,知道论文的整体逻辑。因此,它们之间的重复,是便于读者能够做到「窥一斑而知全豹」。
当然,我们还需要注意到,这种重复并不是简单的重复,而是在宏观是同一个意思,但在表达细节上还存在着差异,即大同小异。
七、写作顺序和研究开展顺序
1、研究开展顺序
我听过一位教授的讲座。他说,虽然一篇论文是按照「引言(其中有包括研究背景、研究现状和研究思路)—〉研究方法—〉数据描述(获取和预处理)—〉数据分析结果—〉分析结果的讨论—〉结论」这样的顺序进行展示的,但是论文写作过程(也等于是论文的研究过程)并不是遵循这样的顺序。
他建议,撰写论文不妨按照,「数据描述—〉数据分析结果—〉研究现状—〉讨论—〉结论—〉引言其他部分—〉研究方法」的逻辑展开。理由是,在开展研究之前,研究者对研究方法、研究背景,均应该了然在胸,因此置于最后,特别是研究方法没有太多作者创新之处,更应该置于最后。研究过程中首先开展的工作中是数据的收集、预处理和分析的工作,因此撰写论文的首要完成的部分是数据描述(包括获取和预处理)和数据分析结果。在得到数据分析结果之后,再去查阅文献,此时才能做到有的放矢、不至于消失在茫茫文献之中;阅读文献、了解研究现状之后,开展讨论、并得到结论。
这位教授的建议给予笔者很大的启发,大大提高笔者撰写论文的效率。但笔者曾改造这一建议后,用来指导学生毕业论文,却发现并不太成功。原因是,这一建议的前提是,研究者对研究课题的内在逻辑有着深刻理解,对研究现状、相关背景、研究方法都有所了解。因此,对于缺少研究经验的新手,这个方法并不太适合。不过假如指导教师能够给学生提供给研究背景、研究现状、研究方法,倒是可以按照这位教授的建议开展研究工作。
一般来说, 论文完成过程包括三个阶段。
第一个阶段, 研究者初步认识研究背景、研究现状和方法。这时, 研究者会形成围绕上述内容形成一个初稿, 也是「粗」稿,需要后续雕琢。
第二个阶段,研究者完成数据采集和分析的研究工作,形成初步研究结果。
第三个阶段, 研究者将研究现状和研究结果结合起来, 进行细致讨论, 并形成结果。在这一阶段, 研究者还要检索文献, 补充完善研究现状(这几乎是必经程序), 并要对方法进行补充起来。
如果研究者在第一阶段就对研究背景和研究现状进行精雕细琢,那么研究者很容易被桎梏在第一阶段, 而且最后结果与研究背景和研究现状很容易差异较大,需要返工。对于第一阶段的「粗」稿,不妨持这样的标准:能够略写的就略,细节的、都知道的内容就不写。
2、数据分析报告的撰写
上述的第二阶段工作, 也就是撰写数据分析报告。数据分析报告是数据分析类实证性论文的基础,撰写好数据分析报告,就意味着论文完成了一半。从这个意义上讲, 数据分析类实证论文就是数据分析报告+文献综述。
数据分析报告比论文更容易撰写,但也有自身特点。下面是数据分析报告的框架和各部分内容.
一、数据分析目的
1、研究何种类型题目:(1)是什么?(2)为什么?
2、具体研究什么问题:如果是为什么,则有哪几个特征?如果研究为什么,则现象是什么、原因是什么、现象和原因之间存在什么样的因果链关系?
3、如有必要, 根据问题提出研究设计框架?
二、指标或变量的情况及调查方法
1、指标或变量的名称及其性质(分类数据、连续数据等)
2、调查方法——将采用何种方法获得这些指标或变量的数据?
如, 通过已有数据库、调查问卷或者实地采集等。
三、研究方法
根据研究目的和变量的性质, 具体采用何种方法分析数据?如,方差分析、回归分析、人工智能等。
四、数据采集结果及预处理
1、数据采集结果, 数据有多少条?
2、预处理,如, 分类变量转化为哑变量。
五、数据描述
对于分类数据,采用图或者表格对数据特征进行描述;
对于连续数据,采用统计量(平均值、方差、中位数等)对数据特征进行描述。
六、分析结果
将描述性分析或者推断性分析的结果展示出来。
七、讨论
围绕着数据分析结果,进行讨论。
八、总结
对讨论结果进行概括,指出研究的不足之处,
在论文中,我们不必交待软件操作过程等细节, 因为我们默认研究者和读者已经很熟悉这些细节, 但在数据分析报告中,则需要对各部分的操作过程进行详细描述。因为只有这样,才能便于指导教师检查研究者是否存在错误操作。
我们还需要注意一点,在大多数论文、特别是理论性论文中,研究的思路和写作思路是一致,即「想到哪儿, 写到哪儿。」但有时研究思路和写作思路并非完全相同。研究是一个从无到有的过程,研究思路可能是多线程的以及线性的,而写作则是对研究结果的包装,考虑到读者的阅读, 文章思路基本上是单线程的,有可能也是非线性的。
【本篇故事完结】