您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 正确解决PYTHON编码问题
正确解决python编码问题Python2.x默认编码格式是ASCIIPython3.x默认编码格式是unicode针对Python2.x:原理:字符串在python内部表示的是Unicode编码在编码转换时,需要以Unicode作为中间编码:先将其他编码的字符串解码(decode)成Unicode编码,然后再编码(encode)成想要的编码关于Unicode:Unicode是一种字符集,它为每一种现代或古代使用的文字系统中出现的每一个字符都提供了统一的序列号,规定了符号的二进制代码,但没有规定这个二进制代码应该如何存储。也就是说:Unicode的编码方式是固定的,但是实现方式根据不同的需要有跟多种,常见的有UTF-8、UTF-16和UTF-32等。为了能够处理Unicode数据,同时兼容Python某些内部模块,Python2.x中提供了Unicode这种数据类型,通过decode和encode方法可以将其它编码和Unicode编码相互转化,但同时也引入了UnicodeDecodeError和UnicodeEncodeError异常。针对Python3.x:在Python3.0之后的版本中,所有的字符串都是使用Unicode编码的字符串序列,同时还有以下几个改进:1、默认编码格式改为unicode2、所有的Python内置模块都支持unicode3、不再支持u'中文'的语法格式所以,对于Python3.x来说,编码问题已经不再是个大的问题,基本上很少遇到上述的几个异常。
本文标题:正确解决PYTHON编码问题
链接地址:https://www.777doc.com/doc-4022490 .html