使用不同论文查重系统,重复率有差异是为何?
无论是毕业论文或者期刊论文,重复率达标都是最基本的要求,而撰写完论文之后都会涉及到论文查重的问题。论文查重本身不算是一个复杂的事情,只需要将自己的论文上传到查重平台等待结果就好了。但是,写作论文查重系统的平台太多,比如:知网、维普、万方、源文鉴、paperpass等....大大小小的论文查重平台。所以其主要问题在于论文在不同平台查重其查重结果往往不一致,而且有时候差异还很大。
很多同学在进行毕业论文自查时,为了 确保重复率能够保持在学校规定的范围内,但是又无法确定哪个论文查重系统结果更准确的时候,往往会将同一篇论文上传到多个论文查重系统进行检测对比。举个例子:一篇一万字论文使用维普查重检测后重复率15%,为了保险起见又使用paperpass再查一次,重复率却高达67%,而且两个查重平台都有详细的重复率报告,相信很多写论文的朋友们都有过类似的经历。那么为什么不同的查重平台都会存在这些不同的重复率数据差异呢?
一、数据对比库差异
论文查重其实就是将要查重的论文提交到论文查重系统,经过系统数据对比库中已有论文进行对比,从而检测论文重复的情况。每个论文查重系统都有自己特有的数据资源库,不可能完全相同。所以,数据库中的论文数量对查重结果起着关键性作用,数据库越全,相应的查重结果也就越可靠。目前国内普遍比较认可的是知网的数据库,源文鉴数据库就比较接近知网的,维普、万方等软件系统的数据对比库相对起来又会有所不同。而论文查重系统是通过对比论文与系统资源库的重合率,因此数据资源库不一样,将直接导致检测结果不一致。
二、数据库更新速度的差异
同样的一篇文章,三年前和三年后的查重率八成都是会有差异的。这是因为各大对比数据库都在不断的更新,有更多的论文数据被录入到数据库中了。因而会影响论文的查重率,所以数据库更新速度也是会影响论文的查重率的,通常来说,数据库更新的越快,查重出来的准确度就越高,假如一篇论文抄袭了的是近两个月的论文数据,那么检测系统是检测不出来的。知网在一众查重软件当中,更新速度是比较快的,一年会更新2次,而其他网站可能两年甚至三年才会更新一次数据库。那么这类软件查重出来的结果就不够准确了。
三、论文检测范围的差异
一篇完整的毕业论文当中包含了很多的部分,例如:封面、声明、中英文摘要、目录、主要符号对照表、正文、致谢、参考文献、附录、原创性声明或者授权声明、个人简历、导师简介、学习期间发表的学术论文等部分组成。但论文里面并不是所有的都需要检测,而每个检测系统可能对于检测范围也会有所不同。不同的范围也可能导致论文重复率的不同。举例说明:知网查重可能已经能够检测到论文中公式、图片的重复率,而维普查重却不对公式及图片进行检测,那么两者之间的重复率肯定也是有所差异的。
四、检测算法的差异
除了对比数据库的差异,查重系统的检测算法也是一个影响重复率的关键因素。就是一段内容和已有数据库的论文内容相似,但又不完全相同时,重复率应该如何计算。举例:A系统的检测标准可能是13个字连续与对比库中的数据重复,那么这段文字就会被判定为抄袭内容;B系统以论文当中某一句话与对比库中内容相似度达到40%的时候,系统就会判定这句话被抄袭了;C系统的算法却是两句话的语义相似度超过50%即被认为是相似,系统便判定这句话被抄袭了。由此可见,不同系统的算法也是导致重复率不同非常重要的因素之一。
综上所述,论文查重系统不同,检测结果不同是很正常的现象,其实每个平台所出的查重报告都是有依据的,没有绝对的好坏之分,主要是看自己最终的检测标准。检测结果越高不一定说明该论文查重系统检测就越准确,很多存在虚高现象,鉴于不同平台的查重存在差异,各位需要检测论文重复率的话,还是尽量选用学校会检测的查重系统作为最终定稿,以避免平台差异导致一些不必要的麻烦。
本网站部分文章转载自互联网以及作者的分享,如本网站所引用的文章涉及著作权问题, 请您及时通知本站,我们将及时妥善处理。
- 5898 次浏览