SDTMIG学习总结

CDISCSDTMIG学习笔记学习心得：SDTM数据集与一般数据集的区别：1.数据集个数不同按照数据变量的不同来源分为不同的域，而一般的临床试验只有一个或少量几个数据集。也就是数据不是按照在CRF表中的位置来收集的，而是按不同topic。2.个人记录与事件记录一般数据集每个人一条记录，SDTM数据集每个人的每个事件、每次用药或每次不良反应一条记录。变量的数量减少，记录的条数增多。也就意味着每个受试者每次访视每个时间点可能有许多条观测记录。3.由于变量之间存在关联，所以SDTM有关联数据集4.CDISC的重点是如何确定记录的唯一性，比如多阶段多时间多剂量的试验，就需要有三个变量来区别。5.元数据：关于数据的数据，按照一定的标准，从信息资源中抽取出相应的特征，组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库质量，使诗句加工达到规范化、标准化，促进科学数据标准化，加强数据交流。6.作用：变量名标准化，变量取值标准化7.并不是所有的域和变量都要使用，根据研究内容来选择ThismodeldescribesthecontentsandstructureofdatacollectedduringaclinicaltrialThepurposeistoprovideregulatoryauthorityreviewers(FDA)acleardescriptionofthestructure,attributesandcontentsofeachdatasetandvariablessubmittedaspartofaproductapplication1.域1.1定义：一组具有共同主题并在逻辑上相关的观测结果集合。Adomainisdefinedasacollectionofobservationsthatshareacommontopic.每个域采用唯一的两字符（英文缩写）代码加以区别，如不良时间域（AE，AdverseEvent）域是SDTM的核心，所有变量按不同的来源被分类到相关的域。比如下图中展示提交的SAS数据集。CM（concomitantandpriormedication）伴随用药域、DA（DrugAccountability）药物发放回收记录域和DM（DEMOGRAPHICS）人口学资料域等。域名和变量名是固定不能变的。在所有域中使用SDTM规定的变量标签研究中只需提交实际采集的域，具体采集哪些数据由研究内容决定，而不是基于SDTM。扩展内容：如果现有的域不能满足要求，可以创建自定义域（相关内容未包括）1.2域模型1.2.1域可以分为五类Special-PurposeDomainsGeneralObservationClass(3种Interventions,Events,Findings),Findingabout,TrialDesignRelationshipDatasets。下图是SDTMvesion3.2中包括的所有域。1.2.2域模型假设变量名最长为8个字符变量筛选：每个域中有各种变量，研究者应按需要选择合适的变量。域中的变量按照需求的不同可分为必需变量（域中必须有且值不能为空）、预期变量（域中必须有但可以为空值）和许可变量（有数据才提交）变量顺序：对于GeneralObservationClass中的变量顺序，应先按标识变量、主题变量、修饰语变量到时间变量依次排列，每种变量类型内按照SDTM表中变量描述排序。扩展内容：域可以被分割，如将调查量表QS域分为临床整体印象（QSCG）、痴呆易于康奈尔量表（QSCS）和细微精神状况检查（QSMM），操作方法不详述。受试者：在标签或注释中将“病人”或“志愿者”统称为“受试者”。在所有的域数据集中都应该包含唯一的标示符（USUBJID）。一般可用：研究编号、临床中心编号和受试者编号联接起来作为USUBJID。文本数据大小写：建议大写文字形式递交文本数据（如果是英文的话），长文本或标签文本及已经是大小写的受控术语除外。缺失值：单个数据项缺失以空来表示，如果有—STAT变量和—REASND变量则还需在—STAT中录入NOTDONE，在—REASND中录入原因。分类变量：——CAT、——SCAT、——GRPID、——SPID、——REFID——CAT与——SCAT在采集之前就已知，是固有属性，用于受试者之间分组——GRPID通常在数据采集之后由申办者指定，受试者之内分组数据对各受试者之间具有相同值的数据用——CAT与——SCAT，而对受试者之间具有不同值时用——GRPID自由文本：其他，请说明。P36页一个变量的多个取值受控术语：一个星号*或两个星号**代表相应的变量应该被填入意义明确的一组数值（受控术语）。一个星号表示受控术语来自申办者自定义的值，两个星号表示来自外部已出版的数据源。建议受控术语应大写，除了本来就是小写的或计量单位放入define.xml不能用数字代码每个通用观察域必须要有一个主题变量，一个时间变量主题变量：事件类——TERM，干预类——TRT，发现类——TEST；必须有受控术语时间变量：国际标准日期时间格式ISO8601YYYY—MM—DDThh:mm:ss年—月—日T小时：分钟：秒0不能省略，不能有空格。时间变量的片段名为——DTC。时间成分缺失：恰当右缺失中间缺失补充单个连字符。不确定时间的表示时间间隔变量——DURYYYY—MM—DDThh:mm:ss/YYYY—MM—DDThh:mm:ss或者PnYnMnDTnHnMnS或PnW确定开始时间和间隔YYYY—MM—DDThh:mm:ss/PnYnMnDTnHnMnS确定结束时间和间隔PnYnMnDTnHnMnS/YYYY—MM—DDThh:mm:ss研究日变量——DY——DY=（——DTC的日期部分）-（RFSTDTC的日期部分）+1，如果——DTC和RFSTDTC相同或在其后——DY=（——DTC的日期部分）-（RFSTDTC的日期部分）+1，如果——DTC在RFSTDTC之前访视对于非计划中的访视：VISITNUM值相关时间变量——STRF和——ENRF是分别与RFSTDTC和RFENDTC比较，可能的值是BEFORE，DURING，DURING/AFTER，AFTER，ONGOING，U（Unknown）等——STTPT参考的开始时间点，——STRTPT表示与——STTPT相比较任何域的日期都应该记录在——DTC数据标准化——ORRES记录原始结果，但——STAT为“未检测”或来源为衍生（——DRVFL=“是”）时，它可以为空。——ORRES有值时，字符型变量——STRESC必须有值，——STRESC可以由——ORRES转换而来，也可以是根据——ORRES值指定的相应值然后将——STRESC中的值转入数值型变量——STRESN如果原始数据中含有字符，如，等，则字符应该复制到——STRESC中，而——STRESN则为空。未测项目CRF表中数据缺失，且没有对选项是/否或已测/未测作出明确选择时如果一组检测项目未作，则相应的变量值为：——TESTCD为——ALL；——TEST应为《模块名称》——CAT应为测试组的名称——ORRES为空——STAT为未测——REASND如果采集了，可能是标本遗失心电图的总体解释作为一条新纪录显示——TEST不能超过40字符，如果超过了，可以提供其在电子CRF的链接；如果CRF表中没有，则创建一个pdf文档来储存全部文本描述。超过200字符的文本，前200字符存储在标准域变量里，剩下的每200字符应该在SUPP——中存储为一条记录。变量名是在原始的标准域变量名称后面添加一个从1开始一位的整数，如果变量名已经到了8个字符，则最后一个字符用该数字替代。1.人口学数据域DemographicsDM每个受试者一条记录，DM域includesessentialstandardvariablesofeachsubject必需变量：STUDYID,DOMAIN,USUBJID,SUBJID,SITEID,SEX,ARMCD,ARM,COUNTRY预期变量：RFSTDTC,RFENDTC,AGE,AGEU许可变量：INVID,INVNAM,BIRTHDTC,RACE,ETHNIC,DMDTC,DMDY变量说明STUDYID：研究唯一标示符DOMAIN：域名DMUSUBJID：受试者唯一标示符，可以是STUDYID-SITEID-SUBJID组成SUBJID：受试者编号SITEID：研究中心编号SEX：性别受控术语F(Female),M(Male),U(Unknown),UNDIFFERENTATEDARMCD：最长20字符，计划分组代码ARM：计划分组描述COUNTRY：国家受控术语C66785各国英文缩写，如中国CHNRFSTDTC：受试者第一次暴露于研究治疗的日期/时间RFENDTC：受试者结束试验的日期/时间，常等于最后一次暴露于研究治疗的日期/时间AGE：年龄AGEU：年龄单位受控术语DAYSHOURSMONTHSWEEKSYEARSINVID：研究者标识符，如果SITEID等于INVID（一个中心一个研究者）则不需要INVNAM：研究者姓名BIRTHDTC：出生日期/时间RACE：人种受控术语AMERICANINDIANORALASKANATIVE/ASIAN/BLACKORAFRICANAMERICAN/NATIVEHAWAIIANOROTHERPACIFICISLANDER/WHITEETHNIC：族裔受控术语HISPANICORLATINO/NOTHISPANICORLATINO/NOTREPORTED/UNKNOWDMDTC：采集日期DMDY：采集数据研究日如果DMDTC≥RFSTDTC，则DMDY=DMDTC-RFSTDTC+1如果DMDTCRFSTDTC，则DMDY=DMDTC-RFSTDTC每个受试者只提交一条DM记录ARM/ARMCD的值必须与实验分组的数据集（TA）的一致如果需要递交筛选失败的受试者数据，应把他们放入DM域中，ARMCD=SCRNFALL；ARM=筛选失败。还可在Disposition实施情况域（DS）中放入一条记录标明筛选失败发生的时间。如果没有筛选失败，但也没有分配到任何分组，则ARMCD=NOTASSGN；ARM=未分配。受试者水平的受试人群标志（如COMPLT,SAFETY,ITT和PPROT等）可放入补充修饰数据集SPPDM。如果是混血人种，则RACE为MULTIPLE，具体人种情况放入SUPPDM。或者也可指定一个主要人种，其余信息放入SUPPDM。或者采用“其他，请说明”采集自由文本信息，则RACE值为其他，而把具体内容放入SUPPDM。Safetypopulationflag/randomizednumber/randomizedflag???2.注释域CommentsCOTheCommentsspecial-purposedomainprovidesasolutionforsubmittingfree-textcommentsrelatedtodatainoneormoreSDTMdomainsorcollectedonaseparateCRFpagededicatedtocomments.Commentsaregenerallynotresponsestospecificquestions;instead,commentsusuallyconsistofvoluntary,free-textorunsolicitedobservations.CO域是为了提交与域数据相关的自由文本型注释，以及CRF表中专门的注释。必需变量：STUDYID,DOMAIN,USUBJID,COSEQ,COVAL许可变量：RDOMAIN,IDVAR,IDVARVAL,COREF,COEAL,CODTCCOSEQ：同

SDTMIG学习总结

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

基于proteus的虚拟实验室在实践性教学中的应用

房地产经典广告语100句(6)(1)

轮机及渔捞机械设备

建筑业营改增政策宣讲

第二章饭店设施规划与设备采购管理

劳动安全卫生专项集体合同

公司治理--日本公司治理结构浅析（DOC 51页）(1)

北京万通发展战略项目内部评估报告(PPT60)

两化融合管理体系贯标实施手册

HR绩效改进计划表

相关文档

相关搜索