2024年3月18日发(作者:)
了解知网查重原理,重复率3%以下其实很简单
【题记】对于论文原创度的合格标准,各个学校之间也不尽相同,有些学校定的标准线稍为
宽松一些,重复率在30%或20%以下就算合格;而有些学校则比较严格,规定要在10%甚至
5%以下才算合格。5%的要求真的是极度严格了,因为常用字就这么三千多个,专业领域的词
汇也都是通用的,随便写点什么都可以查找到相似的句段……
国内应用最广泛,最权威的是知网系的检测系统,也是目前高校普遍采用的系统,关于知网
检测的方法和步骤,主页君在3 月24 日的文章“论文定稿后查重,用知网分解”(点击进入)
进行了详细的介绍,今天,白熊以知网检测系统来作为案例来做一些具体的分析。
1.在知网查重报告中,标黄色的文字代表这段话被判断为“引用”,标红色的文字代表这段话
被判断为“涉嫌剽窃”。
2.在知网查重进行中,检测系统只能识别文字部分,论文中的图片、word 域代码、mathtype
编辑的公式、是不检测的,因为检测系统尚无法识别这些复杂的内容格式。你可以通过[全
选]——[复制]——[选择性粘贴]——[只保留文字]这样步骤的操作来查看具体的查重部分。
另外,在编辑公式时,建议使用用mathtype,不要用word 自带的公式编辑器。
3.论文中的表格内容数据是可以识别的。如果表格的内容有很大的重复度,那么可以把表格
截图保存,再放到论文中去。
4.论文中引用的参考文献部分也是会计算相似度的,所以引用的时候,最好的方式就是先理
解内容,再用自己的话写出来。
5.知网检测系统对论文的分节是以“章”作为判断分节的。封面、摘要、绪论、第一章、第二
章、等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再
通过这样每章的相似度来计算出整篇论文的总重复率。
6.有一点可能很多人都已经知道了,就是在知网查重系统中,是以“连续多个个字重复”做为
识别标准。如果你能够通过修改,让你的论文任意一句话都找不到连续多字与别人的文章相
同,这样就检测不到。
7.当知网查重系统识别到你论文中有某句话涉嫌抄袭的时候,它就会对这句话的前面后面部
分都重点进行模糊识别,这个时候判断标准就变得更严格,仅仅加一些副词或虚词(比如“的”、
“然后”、“但是”、“所以”此类词语)是能够识别出来的。但这样子的识别方式有时候会显得不
是很智能,可能会扯上一篇完全不相干的论文说是内容相似,这个就属于比较无奈的情况了。
8.知网的对比文库里不包括书籍,教材等。但有一个问题要注意,当你“参考”这些书籍教材
中的一些经典内容时,很可能别人已经“参考”过了,如果出现这样子的情况,那就会被检测
到相似。有些同学会说,那我用自己的话去重新写一下,这样就不会被检测到啦。这样的方
法,理论上是对的,但实际上是,这些经典的句段,已经有无数的人引用过了,也已经被无
数的人通过各种改写的方式引用到论文中去的,所以,要写出一段跟别人不一样的话,还真
是有点难度,这个也要拼点运气。
9.网络上的某些内容也是在知网的数据库里的。比如:“百度文库”、“道客巴巴”、“豆丁网”、
“互动百科”、“百度百科”。作者查重的时候,甚至还遇到很多奇葩的网站,神马“东方财富网
博客”、“人大经济论坛”。所以,选择网上的内容时要慎重。 大家在网上搜索资料的时候,
也不要直接引用,知网查
重系统在检测文章的时候,也会进行网络搜索的,特别是一些网络学术资料比较多的一些网
站,如百度文库、百度知道、360 文库等这类网站上面,很容易搜索到相似的信息。
10.大家可以多参考一些国外的资料,因为在知网的对比文库中,外文资料相对比较少一些,
而且用自己的理解翻译成中文的话,几乎不会检测到重复。
11.各位在论文提交到学校之前,一定要自己先到网站查一下,如果有检测出来相似度较高
的片段,自己先改一改。 论文修改一次以后,不要以为就肯定能过了,因为知网系统会根
据论文内容的不同自动调整着重检测的段落,所以有时候第一次查重的时候是正常的,一模
一样的句子,第二次检测的时候会判断为“抄袭”。这也是没有办法的,只能多查多改。
12.知网官方检测系统不对个人开放,学生自己是无法自行到知网去检测论文的,只能通过
第三方检测平台进行,除了知网之外,国内应用比较广泛的论文查重系统还有“万方数据”、
“checkpass”、“paperpass 检测”,“paperrater 检测”这几个。总的来说,万方是最松的,
paperrater 这两个最严。checkpass 检测算法最先进,价格适中,从费用方面来说,知网的
价格是最高的,其它的相对便宜一些,但是检测结果会与知网有区别。 所以一般建议先用
便宜的系统查一下,把能改的都改掉,再用知网系统去查,这样子比较划算。 在这里,还
是推荐大家使用checkpas 检测系统,检测算法先进,结果准确,最为接近知网,非常适合
论文初期、中期以及定稿后初次检测。
论文查重快速通过的技巧与方法
近期,大伙的毕业论文正在敲锣打鼓进行中……小编也知道各位童学肯定很担心论文的终稿
查重问题。今天就给各位同学讲讲论文查重原理与检测,论文查重通过的技巧与方法,论
文查重网站与说明。要破敌,必先知敌;要过学术检测这一关,当然必先了解这一关的玄
机。
一、查重原理
1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式
提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。对于3 万字符以上文
字较多的论文是可以忽略的。对比数据库为:中国学术期刊网络出版总库,中国博士学位
论文全文数据库/中国优秀硕士学位论文全文数据库,国重要会议论文全文数据库,中国重
要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。部分书籍不在知网
库,检测不到。
2、上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系
统会将论文按章节分段检测,否则会自动分段检测。
3、有部分同学反映说自己在段落中明明引用或者抄袭了其他文献的段落或句子,为什么没
有检测出来,这是正常的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为
5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或
者小概念。举个例子:假如检测段落1 有10000字,那么引用单篇文献500 字以下,是不
会被检测出来的。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选
一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。
4、一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13 个字相似或抄袭
都会被红字标注,但是必须满足3 里面的前提条件:即你所引用或抄袭的A 文献文字总和
在你的各个检测段落中要达到5%。
二、论文抄袭检测算法
1.论文的段落与格式
论文检测基本都是整篇文章上传,上传后,论文检测软件首先进行部分划分,上交的最终
稿件格式对抄袭率有很大影响。不同段落的划分可能造成几十个字的小段落检测不出来。
因此,我们可以通过划分多的小段落来降低抄袭率。
2.数据库
论文检测,多半是针对已发表的毕业论文,期刊文章,还有会议论文进行匹配的,有的数
据库也包含了网络的一些文章。这里给大家透露下,很多书籍是没有包含在检测数据库中
的。之前朋友从一本研究性的著作中摘抄了大量文字,也没被查出来。就能看出,这个方
法还是有效果的。
3.章节变换
很多同学改变了章节的顺序,或者从不同的文章中抽取不同的章节拼接而成的文章,对抄
袭检测的结果影响几乎为零。所以论文抄袭检测大师建议大家不要以为抄袭了几篇文章,
或者几十篇文章就能过关。
4.标注参考文献
参考别人的文章和抄袭别人的文章在检测软件中是如何界定的。其实很简单,我们的论文
中加了参考文献的引用符号,但是在抄袭检测软件中。都是统一看待,软件的阀值一般设
定为1%,例如一篇文章有5000 字,文章的1%就是50 字,如果抄袭了多于50,即使加了参考
文献,也会被判定为抄袭。
5.字数匹配
论文抄袭检测系统相对比较严格,只要多于20 单位的字数匹配一致,就被认定为抄袭,
但是前提是满足第4 点,参考文献的标注。
三、快速通过论文查重的七大方法
方法一:外文文献翻译法
查阅研究领域外文文献,特别是高水平期刊的文献,比如Science,Nature,WaterRes
等,将其中的理论讲解翻译成中文,放在自己的论文中。
优点:1、每个人语言习惯不同,翻译成的汉语必然不同。因此即使是同一段文字,不同
人翻译了之后,也不会出现抄袭的情况。2、外文文献的阅读,可以提升自身英语水平,
拓展专业领域视野。
缺点:英文不好特别是专业英文不好的同学实施起来比较费劲。
方法二:变化措辞法
将别人论文里的文字,或按照意思重写,或变换句式结构,更改主被动语态,或更换关键
词,或通过增减。当然如果却属于经典名句,还是按照经典的方法加以
引用。
优点:1、将文字修改之后,按照知网程序和算法,只要不出现连续13 个字重复,以及关
键词的重复,就不会被标红。2、对论文的每字每句都了如指掌,烂熟于心,答辩时亦会如
鱼得水。
缺点:逐字逐句的改,费时费力。
方法三:google 等翻译工具翻译法
将别人论文里的文字,用google 翻译成英文,再翻译回来,句式和结构就会发生改变,再
自行修改下语病后,即可顺利躲过查重。
优点:方便快捷,可以一大段一大段的修改。
缺点:有时候需要多翻译几遍,必须先由中文翻译成英文,再翻译成阿尔及利亚语,再翻
译成中文。
方法四:转换图片法
将别人论文里的文字,截成图片,放在自己的论文里。因为知网查重系统目前只能查文
字,而不能查图片和表格,因此可以躲过查重。
优点:比google 翻译法更加方便快捷。
缺点:用顺手了容易出现整页都是图片的情况,会影响整个论文的字数统计。
方法五:插入文档法
将某些参考引用来的文字通过word 文档的形式插入到论文中。
优点:此法比方法四更甚一筹,因为该方法日后还可以在所插入的文档里进行重新编辑,
而图片转换法以后就不便于再修改了。
缺点:还没发现。
方法六:插入空格法
将文章中所有的字间插入空格,然后将空格字间距调到最小。因为查重的根据是以词为基
础的,空格切断了词语,自然略过了查重系统。
优点:从查重系统的原理出发,可靠性高。
缺点:工作量极大,可以考虑通过宏完成,但宏的编制需要研究。
方法七:自己原创法
自己动手写论文,在写作时,要么不原文复制粘贴;要么正确的加上引用。
优点:基本上绝对不会担心查重不通过,哪怕这个查重系统的阈值调的再低。
缺点:如果说优缺点的话,就是写完一篇毕业论文,可能会死掉更多的脑细胞。呵
呵。。。
四、论文查重网站与使用
网上现在常用的中文查重有万方、知网、PaperPass。英文查重有:PaperRater。
1.中文:万方、知网、PaperPass
(1)查重时,黄色的文字是“引用”,红色的文章是“涉嫌剽窃”。
(2)查重时,只查文字部分,“图”、“mathtype 编辑的公式”、“word 域代码”是不查的。
建议公式用mathtype 编辑,不要用word 自带的公式编辑器。
(3)word、excel 编辑的“表”是可以查出来的。在某些被逼无奈的情况下,可以选择把表
截图放到论文里边去!作者亲眼见过有同学自己编的系数,查出来居然跟人家重了,数据
决定了系数还不能变,欲哭无泪……
(4)参考文献的引用也是要算重复率的!所以引用人家文献的时候最好用自己
的话改写一下。
(5)查重是以“章”为基本单元的。比如“封面”、“摘要”、“绪论”都会作为单独的一章,每一
章出一个检测结果,标明重复率。每一章有单独的重复率,全文还有一个总的重复率。有
些学校在规定论文是否通过查重时,不仅要求全文重复率不能超过多少,还对每章重复率
也有要求。
(6)查重的确是以“连续13 个字与别的文章重复”做为判断依据的,跟之前网上一些作者
说的情况一致。如果你能够把论文改到任何一句与别的文章保证任意连续13 个字都不一
样,是查不出来的。
(7)书、教材在数据库里是没有的。但是,copy 书的同学需要注意,你copy的那部分可
能已经被别的文章抄过了,检测的时候就重复了。这样的情况经常出现,尤其是某些经典
理论,用了上百年了,肯定有人写过了!
(8)网络上的某些内容也是在知网的数据库里的。比如:“百度文库”、“道客巴巴”、“豆丁
网”、“互动百科”、“百度百科”。查重的时候,甚至还遇到很多奇葩的网站,神马“东方财富
网博客”、“ 人大经济论坛”。所以,选择网上的内容时要慎重。
(9)外文文献,中文数据库里存储较少。鼓励大家多看外文文献,多学习国外的先进科学
知识、工程技术,翻译过来,把它们应用到我国的社会主义现代化论文中来!
(10)建议各位学校查重前,在网上先自费查一遍。检测报告会对重复的地方”标红“,先
修改一遍。
发布者:admin,转转请注明出处:http://www.yc00.com/web/1710741009a1807409.html
评论列表(0条)