2024年4月30日发(作者:)
cochrane文献质量评价分级
医学文献的定义及类别
“文献”一词出现在中国已有2000多年的历史,从春秋战国时期就有关于文
献的记载,最早见于《论语八佾》。随着人类文明的发展,“文献”的概念也发生
了巨大的变化,人们对文献的研究一直持续至今。文献的具体定义尚缺乏统一的定
论,《现代汉语词典》对文献的定义是“有历史价值或参考价值的资料”[1];
《中华人民共和国国家标准—文献著录总则》将文献定义为“记载有知识的一切
载体”[2]。有学者将文献定义为“文献就是将知识、信息用文字、符号、图像、
音频等记录在一定物质载体上的结合体”[3]。有历史价值和研究价值的知识、
一定的载体、一定的方法和手段、一定的意义表达和记录体系这4个方面构成文
献的基本要素。医学文献(medicalliterature)就是与医学有关的有参考价值的资料。
按照文献的研究类型分为:系统评价、随机对照临床试验、队列研究、病例对照研
究、病例系列研究、病例报告和专家经验总结等。决定文献质量的关键部分:研究
有首创性或提供了新证据、研究对象的选择合理、科研设计合理、偏倚得到有效控
制、研究样本量足够大和研究的时间足够长。然而医学文献是如何发挥作用的,前
提就是该文献必须有一定的价值,而且有可靠的等级评价体系。医学文献的价值就
是根据其文献内在及外在真实性及临床意义的重要性去评判,是根据医学研究的方
向不同确定评价的原则和方法[4],其中内在真实性是文献评价的重点。
2西医文献评价体系
2.1证据分级
20世纪60年代,首次提出证据分级概念,将随机对照研究的质量定为最高,
并引入内部真实性和外部真实性的概念。证据分级为西医识别文献可靠性的准则。
最初3级标准:1级:设计良好的随机对照试验(RCT);2级:1级和3级中间的类型;3
级:专家经验。老5级标准:1级:收集所有质量可靠的RCT后做出的系统评价或
Meta分析结果,大样本多中心随机对照试验;2级:单个大样本的RCT结果;3级:设
有对照但未用随机方法分组的研究病例对照研究和队列研究;4级:无对照的系列病
例观察;5级:专家意见、描述性研究和病例报告。新5级标准:1级:治疗/预防,病
因学/危害;1a:随机对照的系统评价;1b:随机对照;1c:全或无病案研究;2级:对例或随
机;2a:队列研究的系统评价;2b:队列研究或较差随机对照研究;2c:“结果”研究;生
态学研究;3级:病例对照;3a:病例对照研究的系统评价;3b:病例对照研究;4级:单个病
例系列研究;5级:未经明确讨论或基于生理学、实验室研究或“第一原则”的专家
意见。新9级标准:1级:系统评价/Meta-分析;2级:随机对照双盲研究;3级:队列研
究;4级:病例对照研究;5级:病例系列研究;6级:病例报告;7级:概念、述评、意见;8
级:动物研究;9级:体外(试管)研究。文献的证据分级是评价文献最可靠的标准,上
述几个历程是文献评价证据分级的历史演变,随着时间的推移及科技的进步,评价
的方法进一步细化,由最初的3级标准逐步演变成新9级标准,每一次的改变都
意味着评价系统的进一步完善,对文献的要求更加严格,更有利于临床的实用性。
2.2文献评价的流程及常用工具
对于文献内容的评价首先要区分是随机对照试验(RCT)还是非RCT,两种不同
的文献所用的评价指标及方法各有不同,评价文献时应根据不同类型的研究选取合
适的评价指标和工具。RCT文献评价的指标:1)研究对象(样本量、纳入标准、基线
情况);2)随机过程;3)盲法;4)分配隐藏;5)干预;6)统计方法;7)随访。涉及RCT的评价
工具有很多,但常用的且公信性较高的有CONSORT声明、Jadad量表、
Chalmers量表和Delphi清单。非RCT文献评价的指标:1)研究对象;2)对照的选
择;3)偏倚;4)暴露;5)混杂因素;6)统计方法。应用较多的评价工具有纽卡斯尔-渥太
华量表、质量指数(qualityindex)、Reisch评价工具、DownsandBlack清单、
Anders评价工具和Baker工具等。文献的评价无论是采用哪种方法都应该根据研
究的方向和本学科的特色,合理运用评价的工具,并对其进行相应的补充和修改。
CONSOTR声明推出后,被全世界500余家医学杂志引入稿约(包括167家高影
响因子杂志)[5],可以根据这个声明指导研究者、评审专家和编辑等人员对
RCT研究的质量进行评价和鉴别。目前,国内外很多著名医学期刊都采用
CONSORT声明的要求规范RCT的报告,例如TheLancet(《柳叶刀》)、
JournaloftheAmericanMedicalAssociation(《美国医学会杂志》)和
BritishMedicalJournal(《英国医学杂志》)等[6]。在美国申请NIH资助、英国
申请NHS资助和在中国申请国家自然科学基金资助的课题均必须提供系统评价的
研究结果。
3中医文献评价体系
中医是中国传统医学,有其本身的理论体系,目前中医文献尚缺乏自身的评价
方法,仍然是借鉴西医文献的评价体系,但尚需进一步规范和验证。
3.1证据分级
中医学是中国的一门传统医学,古代医家经验传承是中医学自身的特点,由于
其研究方法的独特性,决定了其源于临床研究的临床证据比较少,所以中医文献的
证据分级难以建立。有研究者[7]提出了一些建立中医特色证据分级体系的思路:
古代医家经验质量评价体系,古代医家经验数据库,证据体的证据分级体系等,但
由于中医学的特殊性,及古代医家经验传承的独特性,使得这3种方法的建立都
有困难,难以推广;最终又提出了应建立符合中医特色证据分级体系,要从古代医
家的经验入手,选择经典方剂及治疗方法,结合中医专家意见,制定相应的证据分
级,大概分为5个等级。Ⅰ级:大样本,随机研究;Ⅱ级:小样本,随机研究,结果不
确定;Ⅲ级:非随机,同期对照研究和基于古今文献的中医专家共识;Ⅳ级:非随机,历
史对照和当代中医专家共识;Ⅴ级:病例报道,非对照研究和专家意见。
3.2文献评价
中医是以辨证论治为基础,根据不同的症状确定治疗的方案,方药的配伍原则
是其自身的特点。从而就可以从辨证论治为切入点对文献进行评价,分为辨证论治
的研究,非严格辨证论治的研究,非辨证论治的研究。从这三个大的方面入手再根
据文献研究的内容进行综合评价。中医文献评价体系起步晚,依据不完善,证据等
级和评价的方法还处于研究阶段,亟待补充,以便进一步发挥我国传统医学的优势,
更好服务于临床。
4文献评价的其他方法
除了上述的对医学内容的评价方法外,专家或同行评议方法、综合评价方法、
被国内外权威数据库收录和文献计量学方法等也都广泛应用于文献的评价之中,这
些方法是对医学文献内容质量评价方法的补充,有一定的参考价值。文献计量学方
法有很多指标其中常用的有:影响因子、他引次数、总被引次数、作者群分析、参
考文献、基金论文文献寿命、半衰期、H指数、ESI指标和F1000等。
5评价体系的优缺点
5.1优点
证据分级概念的引入提高了临床研究的质量,从研究设计的开始就规范化,评
价标准更加精细化。什么样的研究类型及研究方法就决定了是哪一个级别的文献,
对文章的内容价值进行了很好的评判,是一个十分专业化的评判体系。是一种国际
公认的评判文献的方法,对于文献的交流可以无障碍,用一个标准评价,对于文献
可用性和实用性有了良好的界定,从源头上杜绝了“垃圾文章”的产出。具体的各
种量表和清单则让读者了解试验的操作过程,评价其真实性,可以利用其对文章的
关键环节进行评判。文献计量等学方法是根据文献发表当时及发表后产生的效果,
根据数据对文献进行分析,从文献的外在贡献入手,避免主观因素的影响而进行的
评价,对医学研究的现状和发展趋势做出评价和预测[8]。
5.2缺点
证据等级抛开了医学基本原理的探讨,淡化医学本身的学科归属,适用临床研
究类文章,而对于基础理论研究类的文章评判就稍显不足。尤其是中医类文献,基
于辨证治疗的个体化诊疗方式更加难以用证据等级划分,目前现有的也是一些尝试
和探索,至于能否恰当的应用还有待于实践去验证和考量。量表和清单涉及的条目
较多,过于繁琐,评阅难度较大,花费时间较长,每一种工具的侧重点不同,适用
范围不同导致评价结果的一致性较差。而且其中有一些问题会受到评判者主观因素
的影响,从而降低了其可靠性。文献计量学的评价方法虽然简单,但不能完全衡量
文献的质量,只是对其外部特征进行分析。总之,不管哪种评价方法都有其各自的
优缺点,只有在评价过程中根据具体研究类型选择,扬长避短,使文献的价值得到
充分地发挥。
6总结
医学文献是人们获取医学知识的重要媒介,是医学研究结果的最终表现形式,
只有对文献进行客观公正的评价,使得文献的临床重要性得到广泛的推广,才能从
真正意义上起到服务人民,促进医学事业发展的作用。文献的评价体系确定了文献
的质量等级,其严谨的筛选过程也可以鉴定出剽窃和重复发表等学术不端行为,对
医学研究工作的真实性起到一定的监督作用,最终使得研究证据与临床医生的诊疗
水平和患者的期望三者达到共识。目前的系统评价仍然存在一些不足,尤其是对中
医文献的评价缺乏自身的评价体系,限制了中医的发展,今后应就中医自身特点深
入研究,注重同行评价系统的开展,最终解决文献评价与文献质量完全对等的问题。
发布者:admin,转转请注明出处:http://www.yc00.com/web/1714489607a2456448.html
评论列表(0条)