在临床研究领域,数据的质量直接影响到研究结果的准确性和科学性。
医咖会 视频 课程《在开始统计分析前,如何对数据进行清洗或转换?》包含四部分内容:(1)引言;(2)数据探索;(3)数据清洗;(4)数据转换。
本课程深入讲解了如何运用多种方法对数据进行有效的清洗和转换,包括如何科学地填补缺失值、合理地转换数据类型,并利用哑变量转换增强回归模型的解释性等,以提高数据质量并满足统计分析的前提条件。
本课程适合所有需要进行临床研究数据分析的专业人士,包括研究人员、临床医生、数据分析师和医学生。
这里分享其中一课《异常值及其处理方法》。 点击左下方“阅读原文”,即可查看完整视频!
异常值是指样本中的个别值明显偏离所属样本的其余观测值。异常值存在的原因有三点:(1)数据录入错误;(2)测量误差;(3)真实的异常值。如何在保留数据信息的基础上,识别异常值,并对异常值进行有效处理,是数据清洗步骤中一个非常重要的环节。
异常值可分为3类:强影响点、离群值和高杠杆点。
异常值的处理包括四个方面:(1)核查数据是否存在收集或录入错误,如果是录入错误,则用正确的数值进行替换,及时更正数据;(2)保留异常值,但需符合变化趋势;(3)删除异常值(注:当需要删除异常值时,应报告异常值的大小,及其对结果的影响);(4)将异常值纳入分析。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.