「论文查重」知网的模糊算法,你清楚吗?
毕业论文是每个毕业生必须要渡过的一劫,如果毕业论文不能通过学校的论文查重,那么甚至可能影响最终的毕业。所以为了通过学校的论文查重,学生们也是费尽了心思。我们上网查询后得知,知网查重一般都是认定13个字以上的重复为抄袭的,所以很多同学就产生了这样的疑问,如果在一句话里穿插一些字,是不是就不能算作重复了呢?就能简单通过学校的论文查重呢?
1、什么是模糊查重?
模糊查重这个词对于绝大数的人来说,都是一个非常陌生的概念。很多同学都对这个词的含义不太了解,其实模糊查重的意思就是指知网在查重的过程中不是一个词一个词的去对比,只要大部分的相似都会被视为重复,而不是在同一个语句里加一个词,这样就不算重复了。
2、模糊查重的原理是什么?
把提交给系统的论文和数据库中的文献进行比较的过程,这也就是所谓的查重。通常来说,知网查重一般都是确定了13个字以上的重复为抄袭,借鉴别人的13个字后,连续13个字相似或抄袭都会被红字标注,如果说在13个连续红色标注的字之间加入了别的字,是不会被判断重复的,但是知网进行了模糊查重,所以会忽略这些添加的无意义的字或者词,仍然判断这13个单词是抄袭的,这就是模糊查重。
总之,如果作者认为在知网查重的时候,在13个连续红色标注的字之间加入了别的字,是不会被判断重复的,那就大错特错了,我们还是要认真更改论文重复的部分,有效的降低文章的重复率。
本网站部分文章转载自互联网以及作者的分享,如本网站所引用的文章涉及著作权问题, 请您及时通知本站,我们将及时妥善处理。
- 6141 次浏览