文献评估标准

文献评估程可以通过**AI 工具** 来进行辅助，可大幅缩短文献分析的时间，并能够提高数据提取的准确性。工具的设置完全按照下述分级方法进行。对于其他文献分级方法，如：GRADE，SORT，OCEBM Levels of Evidence 等，无法使用 ReguVerse 的 AI 工具。

通用方法

在进行文献全文的阅读和分析时，为了确定临床评价和分析中包含的临床数据的评价标准和价值，依据《医疗器械临床评价技术指导原则》附件5. “建立数据评价标准的考虑因素”建立证据水平的评价标准，该标准将对证据水平按照以下顺序由高到低排列，该评价标准同时将用于数据贡献评估标准中“数据来源类型”的评分。注意：此方法等同于IMDRF临床评价指南文件（IMDRF MDCE WG/N56FINAL:2019 ）中所述的方法。

1）随机对照临床试验/荟萃分析/文献综述

2）队列研究

3）病例对照研究

4）病例系列研究

为了确定临床数据与申报产品的相关性和对证明产品安全性、临床性能和/或有效性的贡献度，依据《医疗器械临床评价技术指导原则》附件6. “参考评估方法”建立了证据适宜性和贡献度评估标准。相关性的评估标准在下表数据适宜性评估标准 中“适当的产品”的描述，纳入分析的数据均为“申报产品”和/或“同品种医疗器械（等同器械、可比器械）”，因此在文献筛选阶段“其他产品”的文献数据将被排除。为保证评价数据的科学性，适宜性评估分级系统中的各评估项选项由高到低分别进行量化评分，适宜性标准的四项评分之和大于等于8的文献将纳入分析。同时，如果四项中的任何一项评分为1时，则该文献将会被排除。

数据适宜性评估标准

相关性标准****	描述****	分级(评分)系统****
适当的产品	数据是否来源于申报产品？	D1 申报产品：3
D2同品种医疗器械（等同器械、可比器械）：2
D3 其他产品：1
适当的适用范围	适用范围是否相同？	A1 相同：3
A2轻微偏离：2
A3重大偏离：1
适当的患者人群	数据来源的患者人群是否可代表预期使用人群（如年龄、性别等）和临床状况（包含疾病状态和严重度）？	P1适用：3
P2有限：2
P3 不同人群：1
可接受的报告/数据汇总	数据是否包含实施合理的、客观的评估所需要的足够信息？	R1 高质量：3
R2 微小缺陷：2
R3 信息不充分：1

贡献度的评估使用分配权重的方法来评估数据集对证明产品安全性、临床性能和/或有效性的贡献。数据贡献评估标准见下表，当某一数据集拥有的一级分级（回答为“是”）越多时，其提供的证据的权重就越大。

数据贡献评估标准

数据类型****	研究设计是否适当？****	分级系统****
数据来源类型（SD）	试验设计是否适当？	T1 是
T2 否
结局指标（OM）	报告的结果指标是否反映了医疗器械的预期性能？	O1 是
O2 否
随访（FU）	随访期限是否足以评价治疗效果并识别并发症？	F1 是
F2 否
统计学显著性（SS）	是否提供了数据的统计分析以及其是否适当？	S1 是
S2 否
临床显著性 (CS)	观察到的使用效果是否具有临床意义？	C1 是
C2 否

EU MDR的特殊要求

State-of-the-Art 文献检索和分析要求

研究问题

State-Of-The-Art 研究

SOTA评估讨论始于CEP，并在CER中进行更详细的补充。相关研究问题应该能够获取以下信息：

对特定诊断或治疗方法的背景，以及安全性和性能评估
针对适应症的替代治疗方案研究

特定设备研究问题

研究问题基于设备声称的性能，主要包括：

评估目标设备与市场上类似产品或替代方案的安全性和性能比较
确定是否需要新的临床试验来支持临床安全有效性要求

State-Of-The-Art 文献评分标准

SOTA相关文献将按照以下标准进行评分：

基础评分(1分)：疾病诊疗和相关患者人群的一般性讨论
追加评分项：
- 至少两种诊疗方法的风险收益比较(+2分)
- 研究是关于欧盟或其他西方国家的使用情况(+3分)
- 研究讨论了评价产品本身或类似产品的风险/并发症(+4分)
评分达到6分及以上的文献将被纳入现状评估讨论。CER中需要提供纳入或排除文献的合理性说明。

证据质量评估

MDCG 2020-6 排名

以下是 MDCG 2020-6 证据等级的详细划分，从最强到最弱依次排列：

涵盖所有器械变体、适应症、患者群体、治疗效果持续时间等的高质量临床研究结果。
存在部分空白但仍属高质量的临床研究结果。
来自高质量临床数据收集系统（如临床试验注册）的结果。
研究可能存在方法学缺陷，但数据仍可量化且可接受性可被证明的结果。
等效性数据（可靠/可量化）。
现有技术水平（SOTA）评估，包括来自类似器械的临床数据评估。
投诉和警戒数据；经整理的数据。
主动上市后监测（PMS）数据，例如源自调查的数据。
关于目标器械的病例报告。
符合与器械安全性和性能相关的通用规范的非临床数据。
涉及医疗专业人员或其他最终用户的模拟使用/动物/尸体测试。
临床前和台架测试/标准符合性测试。

文章质量评估：科学贡献评估

高质量的强制性标准:
- 研究设计 (SD): 必须为“是”
- 统计学显著性 (SS): 必须为“是”
额外质量指标:
- 随访 (FU)
- 结局指标 (OM)
- 临床显著性 (CS)
更细化的分级:
- A级: 所有额外指标均为“是”(FU+OM+CS = 3) 且为高质量研究设计。
- B级: 至少两个额外指标为“是”(FU+OM+CS = 2 或 3)。
- C级: 一个额外指标为“是”(FU+OM+CS = 1)。

研究设计评估

高质量研究设计包括：

随机对照试验 (RCT)
系统评价
Meta分析
高质量队列研究 (前瞻性，有对照组)

质量分类

高质量:
- MDCG 2020-6 排名 1-5
- 符合高质量研究设计标准
- 研究设计 (SD) = 是且统计学显著性 (SS) = 是
低质量:
- 不符合高质量标准但仍可用于分析
- MDCG 2020-6 排名 1-5

文献数据在“现有技术水平 (SOTA)”和“安全性与性能终点”考量中的应用

为了确定用于建立可量化的现有技术水平 (SOTA) 安全性和性能终点的文献数据，将优先选择符合上述“高质量”分类标准，并且其“文章质量评估”中至少有两项额外质量指标（即随访 (FU)、结局指标 (OM) 和临床显著性 (CS)）为“是”的文献。

具体而言，这些优先选用的文献来源必须首先满足“高质量”分类的所有标准：

MDCG 2020-6 排名为 1-5。
被归类为“高质量研究设计”（例如，随机对照试验、系统评价、Meta分析、高质量队列研究）。
在“文章质量评估”中：
- 研究设计 (SD): 是
- 统计学显著性 (SS): 是

在此基础上，为了用于可量化的SOTA基准，这些“高质量”研究还必须同时满足以下至少两项额外质量指标要求：

随访 (FU): 是
结局指标 (OM): 是
临床显著性 (CS): 是

（注：符合这些额外条件的“高质量”研究也表现出细化分级中“A级”或“B级”的特征。）

同时符合“高质量”分类标准且FU、OM和CS中至少两项为“是”的文献数据，被认为是最高级别的证据。它们提供的临床数据（例如，疗效、并发症发生率、特定性能参数）将优先用于建立和支持待评估器械需要达到或超越的可量化SOTA。

其他“高质量”文献（即符合“高质量”分类标准但在细化分级中具有“C级”特征），或根据标准被分类为“低质量”的文献，如果其相关性高（根据数据适宜性评估标准得分≥8）且科学贡献可接受，仍可纳入临床评估。然而，它们主要用于：

SOTA的总体描述和背景信息。
支持技术类别的总体安全概况。
提供历史视角或补充信息。
讨论安全性与性能的定性方面。

文献评估标准 ​

通用方法 ​

EU MDR的特殊要求 ​

State-of-the-Art 文献检索和分析要求 ​

研究问题 ​

State-Of-The-Art 研究 ​

特定设备研究问题 ​

State-Of-The-Art 文献评分标准 ​

证据质量评估 ​

文献数据在“现有技术水平 (SOTA)”和“安全性与性能终点”考量中的应用 ​