关键词:
样本量夸大
甄别
逻辑自洽
Monte-Carlo模拟
摘要:
大样本量数据兼具重要学术价值和不易获取2种特性,使得一些科技论文中出现了样本量夸大这种学术不端行为,且具有高度隐蔽性,难以被侦测。科技论文中常常需要展示数据多方面的特征,这些特征相互之间会呈现关联性和协调性。如果论文中存在样本量夸大行为,各特征之间的关联性和协调性将会被打破而无法形成逻辑自洽。本研究旨在通过Monte-Carlo模拟等技术手段,侦测论文中是否存在无法形成数理逻辑自洽的统计特征,借以判断文中是否存在样本量夸大行为。以几篇待审稿件和已发表论文为例进行分析,结果表明这些技术手段不仅能甄别出样本量夸大行为,还能测算出夸大幅度。故建议对于含有数据分析模块的论文,需要有精通数理逻辑的专家作为联合审稿人。