文献评估标准
文献评估程可以通过**AI 工具** 来进行辅助,可大幅缩短文献分析的时间,并能够提高数据提取的准确性。工具的设置完全按照下述分级方法进行。对于其他文献分级方法,如:GRADE,SORT,OCEBM Levels of Evidence 等,无法使用 ReguVerse 的 AI 工具。
通用方法
在进行文献全文的阅读和分析时,为了确定临床评价和分析中包含的临床数据的评价标准和价值,依据《医疗器械临床评价技术指导原则》附件5. “建立数据评价标准的考虑因素”建立证据水平的评价标准,该标准将对证据水平按照以下顺序由高到低排列,该评价标准同时将用于数据贡献评估标准中“数据来源类型”的评分。注意:此方法等同于IMDRF临床评价指南文件(IMDRF MDCE WG/N56FINAL:2019 )中所述的方法。
1)随机对照临床试验/荟萃分析/文献综述
2)队列研究
3)病例对照研究
4)病例系列研究
为了确定临床数据与申报产品的相关性和对证明产品安全性、临床性能和/或有效性的贡献度,依据《医疗器械临床评价技术指导原则》附件6. “参考评估方法”建立了证据适宜性和贡献度评估标准。相关性的评估标准在下表数据适宜性评估标准 中“适当的产品”的描述,纳入分析的数据均为“申报产品”和/或“同品种医疗器械(等同器械、可比器械)”,因此在文献筛选阶段“其他产品”的文献数据将被排除。为保证评价数据的科学性,适宜性评估分级系统中的各评估项选项由高到低分别进行量化评分,适宜性标准的四项评分之和大于等于8的文献将纳入分析。同时,如果四项中的任何一项评分为1时,则该文献将会被排除。
数据适宜性评估标准
| 相关性标准**** | 描述**** | 分级(评分)系统**** |
|---|---|---|
| 适当的产品 | 数据是否来源于申报产品? | D1 申报产品:3 |
| D2同品种医疗器械(等同器械、可比器械):2 | ||
| D3 其他产品:1 | ||
| 适当的适用范围 | 适用范围是否相同? | A1 相同:3 |
| A2轻微偏离:2 | ||
| A3重大偏离:1 | ||
| 适当的患者人群 | 数据来源的患者人群是否可代表预期使用人群(如年龄、性别等)和临床状况(包含疾病状态和严重度)? | P1适用:3 |
| P2有限:2 | ||
| P3 不同人群:1 | ||
| 可接受的报告/数据汇总 | 数据是否包含实施合理的、客观的评估所需要的足够信息? | R1 高质量:3 |
| R2 微小缺陷:2 | ||
| R3 信息不充分:1 |
贡献度的评估使用分配权重的方法来评估数据集对证明产品安全性、临床性能和/或有效性的贡献。数据贡献评估标准见下表,当某一数据集拥有的一级分级(回答为“是”)越多时,其提供的证据的权重就越大。
数据贡献评估标准
| 数据类型**** | 研究设计是否适当?**** | 分级系统**** |
|---|---|---|
| 数据来源类型(SD) | 试验设计是否适当? | T1 是 |
| T2 否 | ||
| 结局指标(OM) | 报告的结果指标是否反映了医疗器械的预期性能? | O1 是 |
| O2 否 | ||
| 随访(FU) | 随访期限是否足以评价治疗效果并识别并发症? | F1 是 |
| F2 否 | ||
| 统计学显著性(SS) | 是否提供了数据的统计分析以及其是否适当? | S1 是 |
| S2 否 | ||
| 临床显著性 (CS) | 观察到的使用效果是否具有临床意义? | C1 是 |
| C2 否 |
EU MDR的特殊要求
State-of-the-Art 文献检索和分析要求
研究问题
State-Of-The-Art 研究
SOTA评估讨论始于CEP,并在CER中进行更详细的补充。相关研究问题应该能够获取以下信息:
- 对特定诊断或治疗方法的背景,以及安全性和性能评估
- 针对适应症的替代治疗方案研究
特定设备研究问题
研究问题基于设备声称的性能,主要包括:
- 评估目标设备与市场上类似产品或替代方案的安全性和性能比较
- 确定是否需要新的临床试验来支持临床安全有效性要求
State-Of-The-Art 文献评分标准
SOTA相关文献将按照以下标准进行评分:
- 基础评分(1分):疾病诊疗和相关患者人群的一般性讨论
- 追加评分项:
- 至少两种诊疗方法的风险收益比较(+2分)
- 研究是关于欧盟或其他西方国家的使用情况(+3分)
- 研究讨论了评价产品本身或类似产品的风险/并发症(+4分)
- 评分达到6分及以上的文献将被纳入现状评估讨论。CER中需要提供纳入或排除文献的合理性说明。
证据质量评估
MDCG 2020-6 排名
以下是 MDCG 2020-6 证据等级的详细划分,从最强到最弱依次排列:
- 涵盖所有器械变体、适应症、患者群体、治疗效果持续时间等的高质量临床研究结果。
- 存在部分空白但仍属高质量的临床研究结果。
- 来自高质量临床数据收集系统(如临床试验注册)的结果。
- 研究可能存在方法学缺陷,但数据仍可量化且可接受性可被证明的结果。
- 等效性数据(可靠/可量化)。
- 现有技术水平(SOTA)评估,包括来自类似器械的临床数据评估。
- 投诉和警戒数据;经整理的数据。
- 主动上市后监测(PMS)数据,例如源自调查的数据。
- 关于目标器械的病例报告。
- 符合与器械安全性和性能相关的通用规范的非临床数据。
- 涉及医疗专业人员或其他最终用户的模拟使用/动物/尸体测试。
- 临床前和台架测试/标准符合性测试。
文章质量评估:科学贡献评估
高质量的强制性标准:
- 研究设计 (SD): 必须为“是”
- 统计学显著性 (SS): 必须为“是”
额外质量指标:
- 随访 (FU)
- 结局指标 (OM)
- 临床显著性 (CS)
更细化的分级:
- A级: 所有额外指标均为“是”(FU+OM+CS = 3) 且为高质量研究设计。
- B级: 至少两个额外指标为“是”(FU+OM+CS = 2 或 3)。
- C级: 一个额外指标为“是”(FU+OM+CS = 1)。
研究设计评估
高质量研究设计包括:
- 随机对照试验 (RCT)
- 系统评价
- Meta分析
- 高质量队列研究 (前瞻性,有对照组)
质量分类
高质量:
- MDCG 2020-6 排名 1-5
- 符合高质量研究设计标准
- 研究设计 (SD) = 是 且 统计学显著性 (SS) = 是
低质量:
- 不符合高质量标准但仍可用于分析
- MDCG 2020-6 排名 1-5
文献数据在“现有技术水平 (SOTA)”和“安全性与性能终点”考量中的应用
为了确定用于建立可量化的现有技术水平 (SOTA) 安全性和性能终点的文献数据,将优先选择符合上述“高质量”分类标准,并且其“文章质量评估”中至少有两项额外质量指标(即随访 (FU)、结局指标 (OM) 和临床显著性 (CS))为“是”的文献。
具体而言,这些优先选用的文献来源必须首先满足“高质量”分类的所有标准:
- MDCG 2020-6 排名为 1-5。
- 被归类为“高质量研究设计”(例如,随机对照试验、系统评价、Meta分析、高质量队列研究)。
- 在“文章质量评估”中:
- 研究设计 (SD): 是
- 统计学显著性 (SS): 是
在此基础上,为了用于可量化的SOTA基准,这些“高质量”研究还必须同时满足以下至少两项额外质量指标要求:
- 随访 (FU): 是
- 结局指标 (OM): 是
- 临床显著性 (CS): 是
(注:符合这些额外条件的“高质量”研究也表现出细化分级中“A级”或“B级”的特征。)
同时符合“高质量”分类标准且FU、OM和CS中至少两项为“是”的文献数据,被认为是最高级别的证据。它们提供的临床数据(例如,疗效、并发症发生率、特定性能参数)将优先用于建立和支持待评估器械需要达到或超越的可量化SOTA。
其他“高质量”文献(即符合“高质量”分类标准但在细化分级中具有“C级”特征),或根据标准被分类为“低质量”的文献,如果其相关性高(根据数据适宜性评估标准得分≥8)且科学贡献可接受,仍可纳入临床评估。然而,它们主要用于:
- SOTA的总体描述和背景信息。
- 支持技术类别的总体安全概况。
- 提供历史视角或补充信息。
- 讨论安全性与性能的定性方面。

