您好,欢迎访问三七文档
信息技术导论第1章数据存储目标1.位、位的运算和位的存储2.主存储器的结构和容量3.各种常见海量存储器4.不同形式信息的表示5.整数的存储6.小数的存储7.数据压缩8.通信差错1.1位和位存储信息以0和1的模式编码,这些数字称为位(Bit,BinaryDigits)0和1是符号,可表示任意东西1.1.1布尔运算(BooleanOperation)0表示假值;1表示真值。位的运算转换成真/假值的操作,即布尔运算。3个布尔运算:AND(与)、OR(或)、XOR(异或)ANDxANDy当且仅当x和y都为1时,结果为1,其他情况为0ORxORy当且仅当x和y都为0时,结果为0,其他情况为1XORxXORy当且仅当x和相异时,结果为1,其他情况为01.1位和位存储(续)1.1.2门和触发器门(Gate)是一种进行布尔运算的设备,可以多种技术制造,如微电子电路、齿轮等微电子电路实现:0和1的电压电平表示与门、或门、非门、异或门【形状及运算】门是构建计算机的基本构件触发器(Flip-flop)例子:数字电路设计、计算机工程领域、抽象工具(基本构件);位存储方法1.1.3十六进制计数法(HexadecimalNotation)长的位串称为流(Stream)用十六进制计数法简化长位串的写法,易读1.1位和位存储(续)十六进制编码系统位模式十六进制表示位模式十六进制表示0000010019000111010A001021011B001131100C010041101D010151110E011061111F01117100081.2主存储器主存储器(MainMemory)包含大量电路(如触发器),每一个电路能够存储单独的一个位。1.2.1存储器结构以存储单元(Cell)为基本单位,每Cell容量8位,一个字节(Byte)Cell的左端为高位端(High-orderEnd),右端为低位端(Low-orderEnd)最右位为最低有效位(LeastSignificantBit,LSB),最左位为最高有效位(MostSignificantBit,MSB)Cell的标识为地址(Address),从0开始编址,顺序整个存储器里的位可以看做是一个很长的位串存放二进制位的电路+读写电路Cell可以独立存取,按照任意顺序存取主存储器称为随机存储器RAM(RandomAccessMemory)1.2主存储器(续)动态存储器DRAM(DynamicRAM):存储快速消散的微小电子,刷新电路反复补充电子,不稳定。同步动态RAM:SDRAM1.2.2存储器容量Cell总数是2的幂2的10次方1024,Kilo,K,KB(Kilobyte)MB(Megabyte),2的20次方GB(Gigabyte),2的30次方千米km?若千(Kibi,kilobinary,Ki),2的10次方若兆(Mebi,megabinary,Mi),2的20次方Gi,Gibi,gigabinary,2的30次方1.3海量存储器海量存储器(MassStorage),辅助存储器:CD、磁盘、DVD、磁带、闪存海量存储器稳定、容量大、价格低联机(Online)和脱机(Offline)描述设备从计算上的移除联机:设备或信息已和计算机连接,不需要人工干预就可以使用脱机:必须先有人工干预,设备和信息才可以被计算机使用海量存储器一般需要机械运动,RAM通过电子器件实现磁学系统、光学系统和闪存系统1.3海量存储器(续)1.3.1磁学系统磁盘:盘片表面的磁介质涂层存储数据,读写头存取数据磁道(Track)、磁头、柱面(Cylinder)、扇区(Sector)简单磁盘系统:每道相同扇区数区位记录技术(ZonedBitRecording,ZBR):边缘磁道的扇区数多于中心磁道,相邻道组成区,一个区内磁道有相同数目的扇区道和扇区的位置通过格式化(Format)或初始化的过程磁化形成软盘(FloppyDisk):塑料盘片,灵活性,脱机;3.5英寸1.44MB硬盘:多个刚硬的盘片,磁头不接触盘片磁盘系统性能参数寻道时间(SeekTime):磁头从一个道移到另一个道所需时间等待时间(LatencyTime)或旋转延迟(RotationDelay):盘片旋转一周所需时间的一半1.3海量存储器(续)存取时间(AccessTime):寻道时间+等待时间传输速率(TransferRate):读出或写入数据的速率软盘300RPM(每秒几KB),硬盘7200RPM(每秒几M)磁盘容量:盘片数、每片磁道数、每道扇区数、每扇区字节数磁盘系统需要机械运动(千分之一秒,毫秒),和电子电路的速度(十亿份之一秒,纳秒)不匹配磁带(MagneticTape):薄的塑料带的磁涂层上磁带和磁盘的比较:容量、可靠性、脱机联机、读写方式1.3海量存储器(续)1.3.2光学系统光盘(CompactDisk):由涂着光洁保护层的反射材料制成;通过反射层上创建偏差的方法记录信息;激光束通过监视CD快速旋转时反射层的不规则反射偏差读取信息最初用于音频录制,数字音频光盘(CD-DA)信息存储在一条道上,该道螺旋形缠绕在CD上道划分位扇区,每扇区存储容量为2KB,相对于1/75秒的音乐一致线性密度(存储能力达到最大),外缘存储信息多一致传输速率,调整盘面旋转速度;通过CD驱动器适应数据传输速率的变化不适宜于随机存取;适合处理长且连续的数据CD容量几百MBDVD(DigitalVersatileDisk):由多个半透明的层面构成1.3海量存储器(续)1.3.3闪存驱动器磁学和光学系统共同特性:通过物理运动(旋转磁盘/带、移动磁头、扫描激光束)存取信息闪存(FlashMemory):用电子信号将二进制位存储在介质中,电子信号使得二氧化硅的微小晶格截获电子,从而转换电子电路的性质晶格可以保持截获的电子多年,脱机反复擦写或损坏晶格,不适宜于主存储器,不如光盘可靠适用于消费电子设备1.3海量存储器(续)1.3.4文件存储及检索将信息组织成文件(File),有各种类型的文件物理记录(PhysicalRecord):符合存储设备特性的数据(磁盘按扇区存取)逻辑记录(LogicalRecord):文件自然划分(一条记录,一个段落等)逻辑记录有字段(Field)组成,标识字段称为键字段(KeyField),键字段的值称为键(Key)物理记录和逻辑记录大小不一致解决:RAM中缓冲区(Buffer)缓冲区:RAM中临时缓存数据区域;打印缓冲区1.4用位模式表示信息信息(文本、数字、图像、声音、视频等)如何编码为位模式1.4.1文本的表示文本中每个符号赋予其相应的唯一位模式,文本转换成长的位串20世纪40-50年代,ANSI的ASCII(AmericanStandardCodeforInformationInterchange),7位模式表示大小写字母、标点符号、数字和控制字符。8位扩展模式软硬件厂商指定的16位模式的Unicode文本编码,支持中日韩、希伯来等语言中符号ISO制定的32位模式文本文件(TextFile):由ASCII或Unicode编码符号组成的文件文本编辑器或简单编辑器(TextEditor)字处理程序(WordProcessor):文本特征码、使用特有的文本特征码1.4用位模式表示信息(续)1.4.2数值的表示字符编码形式存储数值效率低,如数值365,需要3个字节,共24位二进制计数法(BinaryNotation):使用0和1的位模式表示数值,位置和数二进制补码(Two’sComplement)表示整数;浮点(FloatPoint)计数法表示实数1.4.3图像的表示位图(Bitmap)技术和矢量(Vector)技术表示图像位图技术:图像表示为一组点,每一个点称为像素(Pixel,PictureElement)1.4用位模式表示信息(续)黑白2色图像编码为表示图像各行像素的长位串,每一位取值1或0对应像素的黑白位图技术泛指以像素的方式为图像编码黑白照片每个像素用一组位(通常8个)表示,显示不同的灰色阴影或灰度彩色图像每个像素用一组位表示,显示该像素的外观或颜色RGB编码:每个像素表示为3种颜色成分,一个字节表示每一个颜色成分的亮度,3字节表示一个像素亮度(像素中白光的数量)+2颜色(蓝色度和红色度)成分:来至彩色电视机位图技术缺点:伸缩不易(使用变大像素的方法增大图像,数码相机的数字变焦技术;光学变焦技术调整相机镜头)1.4用位模式表示信息(续)矢量技术:将图像表示为一组直线和曲线(描述图像),线的绘制由产生图像的设备处理字处理系统中的矢量字体(可伸缩字体):TrueType(MSandApple)、PostScript(Adobe)CAD(ComputerAidedDesign)系统中矢量技术1.4.4声音的表示幅度采样:语音通信中每秒8000次采样CD:每秒44100次采样,每次采样得到的数据用16位的形式表示;立体声32位乐器数字化接口MIDI:用于电子键盘的音乐合成器,用来制作视频游戏声音;在合成器上编码产生音乐的指令;存储容量小;对什么乐器演奏什么音符以及多长时间编码;不同合成器上演奏可能不同1.5整数存储二进制补码计数法1.5整数存储(续)最左边的位为符号位(SignBit),符号位1表示负,符号位0表示非负加法运算符号位和数值位一起参加运算:一致电路处理减法运算转换成加法运算加法电路和取负电路实现加减法运算溢出(Overflow)问题(计算得出的数值超出了可以表示的数值范围):4位补码表示,5+4=9?两正数和两负数加可能产生溢出通过检查符号位判断是否溢出:两正数加符号位为负;两负数加符号位为正表示更大数值:更多位;度量单位1.5整数存储(续)二进制余码计数法1.6小数存储1.6.1浮点(FloatPoint)计数法1字节表示1位符号位+3位指数域(ExponentField)+4位尾数域(MantissaField)指数域使用余码表示法01101011符号:0,正数指数:110,2尾数:.101110.112+1/2+1/4=2.753/8的表示.0110尾数1100001111001.6小数存储(续)规范化形式(NormalizedForm):从最左边二进制表示的1开始填充尾数域数值0:全为0的位模式1.6.2截断误差(TruncationError)舍入误差(Round-offError):尾数域空间不够大2+5/8=10.10101101010=2+1/2无穷展开式问题:1/3,1/10数值分析领域研究大规模和高精度数值计算2.5+1/8+1/8=?商用软件先计算相差小的两数之和1.7数据压缩1.7.1通用的数据压缩(DataCompression)技术两种压缩方案:无损的(Lossless)和有损的(Lossy)行程长度编码(Run-lengthEncoding):无损;将一组相同的数据成成分替换成一个编码,指出重复的成分以及其在序列中出现的次数;100个1,然后200个0,接着300个1频率相关编码(Frequency-dependentEncoding):无损;表示数据项目的位模式的长度与这个项目使用频率相反;赫夫曼编码(HuffmanCode);英文中字母频率不同相对编码(RelativeEncoding)或差分编码(DifferentialEncoding):无损或有损;记录连续数据单元之间的区别,每个数据单元相对于前一个数据但与编码字典编码(DictionaryEncoding):无损;根据构造块(字典)对信息编码;字处理系统1.7数据压缩(续)自适应字典编码(AdaptiveDictionaryEncoding):动态字典编码;字典可以改变;LZW压缩,xyxxyxxyxxyx1.7
本文标题:信息技术导论1
链接地址:https://www.777doc.com/doc-3684197 .html