您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > GB∕T 38643-2020 信息技术 大数据 分析系统功能测试要求
书书书犐犆犛35.240犔67中华人民共和国国家标准犌犅/犜38643—2020信息技术 大数据分析系统功能测试要求犐狀犳狅狉犿犪狋犻狅狀狋犲犮犺狀狅犾狅犵狔—犅犻犵犱犪狋犪—犉狌狀犮狋犻狅狀犪犾狋犲狊狋犻狀犵狉犲狇狌犻狉犲犿犲狀狋狊犳狅狉犪狀犪犾狔狋犻犮狊狔狊狋犲犿20200428发布20201101实施国家市场监督管理总局国家标准化管理委员会发布目 次前言Ⅰ…………………………………………………………………………………………………………1 范围1………………………………………………………………………………………………………2 规范性引用文件1…………………………………………………………………………………………3 术语和定义1………………………………………………………………………………………………4 缩略语1……………………………………………………………………………………………………5 概述2………………………………………………………………………………………………………6 数据准备模块功能测试2………………………………………………………………………………… 6.1 数据抽取功能测试2………………………………………………………………………………… 6.2 数据清洗功能测试2………………………………………………………………………………… 6.3 数据转换功能测试2………………………………………………………………………………… 6.4 数据加载功能测试3…………………………………………………………………………………7 分析支撑模块功能测试3………………………………………………………………………………… 7.1 查询功能测试3……………………………………………………………………………………… 7.2 机器学习功能测试3………………………………………………………………………………… 7.3 统计分析功能测试4………………………………………………………………………………… 7.4 可视化功能测试4……………………………………………………………………………………8 数据分析模块功能测试4………………………………………………………………………………… 8.1 分析模式测试4……………………………………………………………………………………… 8.2 分析类型测试5………………………………………………………………………………………9 流程编排模块功能测试6………………………………………………………………………………… 9.1 工作流管理测试6…………………………………………………………………………………… 9.2 告警和日志测试6……………………………………………………………………………………附录A(资料性附录) 测试示例7…………………………………………………………………………犌犅/犜38643—2020前 言 本标准按照GB/T1.1—2009给出的规则起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。本标准起草单位:浪潮电子信息产业股份有限公司、中国电子技术标准化研究院、中国人民大学、上海计算机软件技术开发中心、浪潮软件集团有限公司、勤智数码科技股份有限公司、深圳迅策科技有限公司、成都四方伟业软件股份有限公司、陕西省信息化工程研究院、中国铁道科学研究院集团有限公司、平安科技(深圳)有限公司、内蒙古大学、江苏中数据技术有限公司、重庆大数据研究院有限公司。本标准主要起草人:赵江、苏志远、卫凤林、张群、杜小勇、陈敏刚、黄先芝、公维锋、陈文捷、蔡立志、王建华、李正、耿大为、赵志强、颜怀柏、顾美营、张勇、朱志祥、马小宁、吴艳华、赵正阳、韩梅、李华、魏清、张海静、王东强。Ⅰ犌犅/犜38643—2020信息技术 大数据分析系统功能测试要求1 范围本标准规定了大数据分析系统的数据准备模块、分析支撑模块、数据分析模块、流程编排模块的功能测试要求。本标准适用于指导大数据分析系统的设计、开发和交付。2 规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T37721—2019 信息技术 大数据分析系统功能要求3 术语和定义GB/T37721—2019界定的以及下列术语和定义适用于本文件。3.1大数据分析系统 犫犻犵犱犪狋犪犪狀犪犾狔狊犻狊狊狔狊狋犲犿在大数据存储和处理系统提供的原始数据和计算框架的基础上,集成了一系列数据分析生命周期过程中所用工具的系统。4 缩略语下列缩略语适用于本文件。API:应用程序接口(ApplicationProgrammingInterface)AUC:ROC曲线下方的面积(AreaundertheROCCurve)CPU:中央处理器(CentralProcessingUnit)GPU:图形处理器(GraphicsProcessingUnit)HDFS:分布式文件系统(HadoopDistributedFileSystem)JSON:JS对象标记(JavaScriptObjectNotation)OLAP:联机分析处理(OnLineAnalyticalProcessing)PCA:主成分分析(PrincipalComponentsAnalysis)REST:表述性状态转移(RepresentationalStateTransfer)ROC:接受者操作特性(ReceiverOperatingCharacteristic)SQL:结构化查询语言(StructuredQueryLanguage)SSD:固态硬盘(SolidStateDrives)XML:可扩展置标语言(ExtensibleMarkupLanguage)1犌犅/犜38643—20205 概述本标准根据GB/T37721—2019规定的大数据分析系统的功能要求,给出了相应的测试要求。测试示例参见附录A。6 数据准备模块功能测试6.1 数据抽取功能测试数据抽取功能测试要求如下:a) 应测试大数据分析系统数据准备模块是否支持按照需求抽取存放在存储系统中的数据;b) 应测试大数据分析系统数据准备模块是否对结构化数据、非结构化数据提供不同抽取方法;c) 应测试大数据分析系统数据准备模块是否提供全量抽取及增量抽取模式;d) 应测试大数据分析系统数据准备模块是否支持主动抽取和被动追加;e) 应测试大数据分析系统数据准备模块是否支持定时批量抽取;f) 应测试大数据分析系统数据准备模块是否支持分布式数据抽取,并测试在数据抽取过程是否实现负载均衡。6.2 数据清洗功能测试数据清洗功能测试要求如下:a) 应测试大数据分析系统数据准备模块是否支持数据一致性;b) 应通过进行无效数据值删除、修正等操作测试大数据分析系统数据准备模块是否支持处理无效值;c) 应通过填充缺失值或删除缺失值对应数据条目等操作测试大数据分析系统数据准备模块是否支持处理缺失值;d) 应通过合并重复数据或者删除重复数据等操作测试大数据分析系统数据准备模块是否支持处理重复数据;e) 应测试大数据分析系统数据准备模块是否提供清洗前后的数据比对功能;f) 应测试大数据分析系统数据准备模块是否支持逻辑矛盾、关联性验证、不合理数据的清洗。6.3 数据转换功能测试数据转换功能测试要求如下:a) 应通过对结构化数据进行列转换操作测试大数据分析系统数据准备模块是否支持结构化数据列转换;b) 应通过对结构化数据进行行转换操作测试大数据分析系统数据准备模块是否支持结构化数据行转换;c) 应通过对结构化数据进行表转换操作测试大数据分析系统数据准备模块是否支持结构化数据表转换;d) 应测试大数据分析系统数据准备模块是否支持非结构化数据的结构化处理;e) 应测试大数据分析系统数据准备模块是否支持对文本、网页类数据的规范化处理,是否支持将文档类数据转化成单一规范形式;f) 应通过进行语音和音频输入,检测输入识别结果准确性,测试大数据分析系统数据准备模块是否支持对语音/音频数据的识别处理;2犌犅/犜38643—2020g) 应通过进行图像输入,检测输入识别结果准确性,测试大数据分析系统数据准备模块是否支持提取图像信息。6.4 数据加载功能测试数据加载功能测试要求如下:a) 应测试大数据分析系统数据准备模块是否支持把经过清洗和转换之后的数据加载到大数据分析系统;b) 应按照加载的目标结构将转换过的数据输入到目标结构中去,测试大数据分析系统数据准备模块是否支持全量加载;c) 在目标结构中已经存在数据时,应通过在保存已有数据的基础上增加新的数据,测试大数据分析系统数据准备模块是否支持增量加载;d) 应测试大数据分析系统数据准备模块是否支持实时加载或批量加载。7 分析支撑模块功能测试7.1 查询功能测试7.1.1 查询接口测试查询接口测试要求如下:a) 应测试大数据分析系统分析支撑模块是否支持通过标准的数据库连接接口进行查询;b) 应测试大数据分析系统分析支撑模块是否支持RESTAPI查询接口进行查询。7.1.2 查询优化测试查询优化测试要求如下:a) 应通过建立数据索引测试大数据分析系统分析支撑模块是否达到查询加速的效果;b) 应测试大数据分析系统分析支撑模块是否支持精确查询和模糊查询;c) 应测试大数据分析系统分析支撑模块是否支持基于规则或者基于成本的查询优化;d) 应测试大数据分析系统分析支撑模块是否支持数据分片和多副本技术;e) 应测试大数据分析系统分析支撑模块是否支持通过SQL进行复杂条件高并发查询;f) 应测试大数据分析系统分析支撑模块是否支持二级索引。7.2 机器学习功能测试7.2.1 数据集管理功能测试数据集管理功能测试要求如下:a) 应测试大数据分析系统分析支撑模块是否能够将输入数据划分为训练集、验证集和测试集;b) 应通过将训练、验证过的模型导入到大数据分析系统中,以及将大数据系统中训练所得的模型导出的操作,测试大数据分析系统分析支撑模块是否提供机器学习模型的导入和导出的功能。7.2.2 支持算法测试支持算法测试要求如下:a) 应测试大数据分析系统分析支撑模块是否支持回归与分类算法;b) 应测试大数据分析系统分析支撑模块是否支持聚类算法;c) 应测试大数据分析系统分析支撑模块是否支持协同过滤算法;3犌犅/犜38643—2020d) 应测试大数据分析系统分析支撑模块是否支持降维算法;e) 应测试大数据分析系统分析支撑模块是否支持频繁模式挖掘算法;f) 应测试大数据分析系统分析支撑模块是否支持神经网络算法;g) 应通过检查是否具有特征提取、特征转换、特征选择、模型选择、交叉验证、模型调优组件测试大数据分析系统分析支撑模块是否提供机器学习流程的其他组件;h) 应测试大数据分析系统分析支撑模块是否支持Java、Scala、Python、R等一种或多种语言,并且是否支持二次开发增加新的算子。7.2.3 模型评估功能测试应通过检查机器学习模块中包含交叉验证、模型选择等核心评估组件测试大数据分析系统分析支撑模块是否能够支持算法模型的评估模块。7.3 统计分析功能测试统计分析功能测试要求如下:a) 应通过计算最大值、最小值、求和、总数等统计量测试大数据分析系统分析支撑模块是否支持基本的数值统计;b) 应通过计算平均数、中位数、众数等统计量测试大数据分析系统分析支撑模块是否支持分析数据集中趋势的统计;c) 应通过计算极差、方差、标准差等统计量测试大数据分析系统分析支撑模块是否支持分析数据离散程度的统计;d) 应通过计算协方差、相关系数等统计量测试大数据分析系统分析支撑模块是否支持分析多个随机变量的关系;e) 应通过保存常用的统计分析方案测试大数据分析系统分析支撑模块是否支持统计分析的自定义模板能力。7.4 可视化功能测试可视化功能测试要求如下:a) 应通过以Excel、关系型数据库、JSON、XML格式输入测
本文标题:GB∕T 38643-2020 信息技术 大数据 分析系统功能测试要求
链接地址:https://www.777doc.com/doc-9515054 .html