您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > TCESA 1150-2021 人工智能芯片应用 面向汉盲翻译系统的技术要求
ICS团体标准人工智能芯片应用面向汉盲翻译系统的技术要求Applicationofartificialintelligencechip—TechnicalrequirementstosystemofChinese-Brailletranslation2021-04-26发布2021-05-26实施中国电子工业标准化技术协会发布35.240CCSL70团体标准中国电子工业标准化技术协会发布中国电子工业标准化技术协会发布T/CESA1150—2021T/CESA1150—2021I版权保护文件版权所有归属于该标准的发布机构,除非有其他规定,否则未经许可,此发行物及其章节不得以其他形式或任何手段进行复制、再版或使用,包括电子版,影印件,或发布在互联网及内部网络等。使用许可可于发布机构获取。T/CESA1150—2021II目 次前言.....................................................................................................................................................................III1范围...................................................................................................................................................................12规范性引用文件...............................................................................................................................................13术语和定义.......................................................................................................................................................14总体功能...........................................................................................................................................................25输入和输出.......................................................................................................................................................26服务接口...........................................................................................................................................................37功能模块...........................................................................................................................................................58性能指标...........................................................................................................................................................5参考文献.............................................................................................................................................................7T/CESA1150—2021III前 言本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件由中国科学院计算技术研究所提出。本文件由中国电子工业标准化技术协会归口。本文件起草单位:中国科学院计算技术研究所、中国盲文出版社、中科寒武纪科技股份有限公司、浙江大学。本文件主要起草人:王向东、刘宏、王艳萍、李威、卜佳俊、钱跃良、周玮琪、胡晨希、恽超、刘俊英、王炜、周晟。T/CESA1150—20211人工智能芯片应用面向汉盲翻译系统的技术要求1范围本文件规定了在人工智能芯片应用方面,面向汉盲翻译系统的技术要求,包括输入/输出、服务接口、功能模块设置、性能指标等方面的要求。本文件适用于在智能芯片上进行汉盲翻译系统的部署、检验及应用。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T15720-2008中国盲文GB/T38640-2020盲用数字出版格式GF0019-2018国家通用盲文方案3术语和定义下列术语和定义适用于本文件。3.1机器学习machinelearning功能单元通过获取新知识或技能,或通过整理已有的知识或技能来改进其性能的过程。[来源:GB/T5271.31-2006,术语和定义31.01.02]3.2汉盲翻译Chinese-Brailletranslation将汉字文本转换为对应的汉语盲文文本。3.3电子盲文electronicBraille以数字形式存储的盲文内容。T/CESA1150—20212[GB/T38640-2020,术语和定义3.2]4总体功能4.1核心功能汉盲翻译系统应至少具备将输入的汉字文本翻译为对应的汉语盲文文本的核心功能。基于智能芯片的汉盲翻译系统宜充分利用智能芯片运行人工智能和机器学习模型,以实现高效的汉盲翻译。4.2汉语盲文方案汉盲翻译系统所处理的汉语盲文应符合GB/T15720-2008、GF0019-2018。4.3输入输出形式以输入和输出的形式来划分,基于智能芯片的汉盲翻译系统可以两种方式提供汉盲翻译服务:文件翻译和字符串翻译。文件翻译是指输入一个汉字文本文件,返回一个与之相应的盲文文本文件。字符串翻译是指输入一个汉字字符串,返回一个与之相应的盲文字符串。4.4服务方式及接口以提供服务的方式和接口来划分,基于智能芯片的汉盲翻译系统可以两种方式提供汉盲翻译服务:网络服务和本地服务。网络服务是指基于网络通信接口提供服务。本地服务是指基于本机的进程/线程/模块间的通信接口提供服务。5输入和输出5.1文件翻译5.1.1输入文件输入的文件应支持常用的文本文件格式,包括txt格式、word格式(doc或docx)、pdf格式。对于包含格式和非文本内容的文件格式,如word格式和pdf格式,应至少可提取其中的所有标题和正文文本作为翻译的输入。根据需要,输入文件中的文本应包含所需的非汉字字符,如标点符号、英文字母、阿拉伯数字符号及其它可能用到的符号,而非只由汉字字符构成。5.1.2输出文件T/CESA1150—20213输出的文件应符合GB/T38640-2020中电子盲文的格式要求。可采用标准中定义的XML格式,DBO格式或其它符合标准的格式。5.2字符串翻译5.2.1输入字符串输入字符串应采用UTF-8编码。一般为一个汉语句子。字符数不超过128。根据需要,输入字符串应包含所需的非汉字字符,如标点符号、英文字母、阿拉伯数字符号及其它可能用到的符号,而非只由汉字字符构成。5.2.2输出字符串输出字符串应遵循常用的盲文编码规范,包括Unicode编码和ASCII编码。6服务接口6.1网络服务网络服务采用网络服务接口,可基于socket接口或http服务。6.2本地服务本地服务除可采用运行于本地的网络接口外,也可采用本地接口。如作为SDK,以函数形式提供接口服务。6.3具体服务接口6.3.1应具备的服务接口一个用于向上层应用提供服务的汉盲翻译系统至少应具备如下的服务接口:任务创建接口、任务状态查询接口、翻译结果获取接口、翻译任务取消接口。6.3.2文件翻译任务创建接口调用此接口创建文件翻译任务,并在汉盲翻译服务器或本地进行翻译。接口的输入、输出参数见表1。T/CESA1150—20214表1文件翻译任务创建接口参数定义参数名描述类型输入/输出input_file要翻译的文件名字符串输入参数braille_type要翻译的盲文类型,1为现行盲文,2为通用盲文,3为双拼盲文整数输入参数task_id翻译任务标识符(ID)整数输出参数6.3.3字符串翻译任务创建接口调用此接口创建字符串翻译任务,并在汉盲翻译服务器或本地进行翻译。接口的输入、输出参数见表2。表2字符串翻译任务创建接口参数定义参数名描述类型输入/输出input_string要翻译的字符串字符串输入参数braille_type要翻译的盲文类型,1为现行盲文,2为通用盲文,3为双拼盲文整数输入参数task_id翻译任务标识符(ID)整数输出参数6.3.4任务状态查询接口调用此接口查询翻译任务状态。此接口适用于文件翻译和字符串翻译。接口输入、输出参数见表3。表3任务查询接口参数定义参数名描述类型输入/输出task_id要查询的任务标识符(ID)整数输入参数task_status任务状态,Y表示转换完成,W表示正在执行,N表示任务尚未开始字符串输出参数6.3.5文件翻译结果获取接口调用此接口获取文件翻译结果。输入、输出参数见表4。表4文件翻译结果获取接口参数定义参数名描述类型输入/输出task_id要获取结果的翻译任务标识符(ID)整数输入参数result_url翻译结果文件的URL字符串输出参数6.3.6字符串翻译结果获取接口T/CESA1150—20215调用此接口获取字符串翻译结果。输入、输出参数见表5。表5字符串翻译结果获取接口参数定义参数名描述类型输入/输出task_id要获取结果的翻译任务标识符(ID)整数输入参数result_string翻译结果字符串字符串输出参数6.3.7翻译任务取消接口调用此任务取消翻译任务。此接口适用于文件翻译和字符串翻译。输入、输出参数见表6。表6翻译任务取消接口参数定义参数名描述类型输入/输出task_id要取消的翻译任务标识(ID)整数输入参数state是否成功取消,true为成功,false为失败布尔型(boolean)输出参数7功能模块7.1模块划分基于智能芯片的汉盲翻译系统,应将机器学习模型与程序独立。基于智能芯片的汉盲翻译系统,应至少划分为接口响应模块、机器学习模型加载模块、翻译模块。接口响应模块负责响应各种接口请求,接收相应的输入,调用内部功能实现,并在需要时返回相应输出。机器学习模型加载模块负责一次性将外部存储(硬盘)中的机器学习模型文件加载至内存;翻译模块负责使用加载的机器学习模型执行翻译任务。在模型加载后,执行每次翻译任务时无需再次加载模型。7.2翻译模块采用智能芯片时,翻译模块应尽可能采用智能芯片运算。机器学
本文标题:TCESA 1150-2021 人工智能芯片应用 面向汉盲翻译系统的技术要求
链接地址:https://www.777doc.com/doc-10853108 .html