scientific-critical-thinking
评估科学主张及证据质量。适用于检验实验设计的有效性、识别偏倚与混杂因素、应用证据分级框架(如GRADE、Cochrane偏倚风险评估),或开展批判性分析教学。最适用于理解证据质量、发现研究缺陷。若需正式同行评审写作,请使用专业同行评审流程。
分类
其他工具安装
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
科学批判性思维
技能概述
系统评估科学研究质量的专业工具,用于评审实验设计、识别偏倚、评估证据等级,并运用 GRADE 和 Cochrane 框架判断结论的可靠性。
适用场景
核心功能
常见问题
科学批判性思维和正式同行评审有什么区别?
科学批判性思维主要用于个人研究评估、证据质量判断或同行评审前的内部质量检查。它不生成正式的评审意见书或给作者的反馈。如果需要撰写正式的同行评审报告,应该使用 peer-review 技能。
如何判断相关性研究能否支持因果结论?
相关性研究本身不能直接证明因果关系。需要评估:时间顺序(原因是否先于结果)、是否存在剂量-反应关系、混杂因素是否得到控制、生物学机制是否合理、不同研究是否一致。如果论文用相关性语言("相关"、"关联")来表述因果结论,这是一个红旗信号。
GRADE 评估中的"降级"标准是什么?
GRADE 系统从研究设计类型出发(RCT 初始为高质量,观察性研究初始为低质量),然后考虑五个降级因素:偏倚风险(随机化、盲法、随访是否充分)、不一致性(不同研究结果是否矛盾)、间接性(人群、干预、结局是否与目标一致)、不精确性(置信区间宽、样本小)、发表偏倚。每遇到一个严重问题就降一级。
怎样识别研究中的 P-hacking 和选择性报告?
检查:是否报告了所有预设结局(可对比研究注册方案与发表内容)、是否进行了多次分析但只报告显著结果、是否在看到结果后修改假设(HARKing)、是否过度进行亚组分析而无多重比较校正、P 值是否可疑地集中在 0.05 附近。
小样本研究的结果能信吗?
小样本研究即使统计显著也应谨慎对待:效应量可能被夸大、置信区间通常很宽、研究可能严重功效不足。需要关注:是否进行了先验功效分析、效应量是否有实际意义、是否有其他研究重复、是否过度解读结果。单个小样本研究通常只能提供低质量证据。