您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 会议纪要 > 基于以太网的数字音频网络
基于以太网的数字音频网络目前比较成熟的以太网音频传输技术主要是CobraNet和EtherSound。前者已经开发和使用多年,用户较多,交互性好,缺点是网络延时长;后者解决了延时的问题,但是开发和使用普及程度稍差。本文之目的通过客观地分析数字音频网络的机理,对比各种传输技术,以求证哪一种传输网络更适合大家。二.音频网络的内部结构OSI参考模型是数据网络工作的基础,它为每一层之间的通信规定了公共的方式,以OSI模型作为基础使音频网络简单化。相对于构成OSI模型的七个层,音频网络可以简单分解为两大主要部分:控制和传输。配置、监控以及实时设备控制都可以归入控制类别,并且用了几个标准的通信协议。传输顾名思义,就是把数字音频搬来搬去。控制申请可以在应用层的标准协议中找到。音频中的应用层协议有Telnet、HTTP以及简单网络管理协议(SNMP)。Telnet是网络电传的缩写,是最早的英特网协议之一。它规定了机器通信的命令行格式。百威媒体矩阵,使用了这种技术,称为RATC,作为遥控媒体矩阵中设备的一种方法。SNMP是网络上用于监控的一个协议,在网络运行中心(NOC)的监控中是一个关键技术。它是应用层协议,通过UDP/IP协议与网络上的设备进行通信,可以沟通多重数据传输技术。在大多数情况下,当音频信号传输时,基于TCP/IP协议的控制可以在同一网络上运行,如CobraNet和Dante设计为允许数据通信与音频通信共存。组织并管理音频比特是音频传输的工作,通常是由音频协议完成的。Aviom、CobraNet以及EtherSound等都是为在网络上传输而组织比特的协议。传输可以分为两种:物理传输和逻辑传输。纯粹的物理层技术,像Aviom,使用硬件来组织和移动数字比特。通常会用一块专利芯片用来组织并控制它们。基于以太网的技术把音频分包,然后发送到数据链接层和物理层,就可以在以太网设备上传输。以太网既是逻辑技术也是物理技术,在数据链接层把音频进行分包或者“分帧”,然后发送到物理层以便于移动到网络上的另一台设备上去。三.以太网结构的数字音频网络数字音频网络由音频输入模块、以太网Switch、计算机、音频传输设备组成。音频输入模块把模拟信号转换为数字信号,或者用于接收AES信号源信号,计算机运行并配置系统软件。网络中专门有一台音频传输设备起着传导器的作用,让其他所有设备同步、有序、及时地传输组包信息,信号流的传输方式可以是点到点的单播形式,也可以是点到多点的多播方式。国际标准化组织ISO制订的网络互联模型OSI中,以太网帧结构归属于数据层。在以太网构建的局域网中,MAC帧则是最大的一个数据包了,其它所有的同步或非同步信息都是包含在这个数据包中进行传输的,表1是标准以太网(即DIX格式)MAC帧的格式。需要注意的是MAC帧只是完成了数据层(OSI第二层)协议的工作,当数据传输到目的地以后,MAC帧就已经被打开,而只将上图中“数据”这个部分传输到上层协议中,上层协议(或处理单元)还要继续分析这个数据包。如CobraNet数据包样被“封装”在MAC帧中,但由于MAC帧中标注的协议类型号是X’88-19,只限于数据链路层,所以这个数据包不会再向网络层或更高层传送而直接被送到了CobraNet的同步解码器。在每个MAC帧的最后还有4个字节的帧校验序列FCS(FrameCheckSequence),负责检查整个MAC帧的数据的准确性。这个检查是非常必要的,对于整个数据帧,1bit的错误信息就有99.9%的概率被检测出来。而对于这些错误,更高级的协议(如TCP)甚至可以要求源服务器重发这个帧。四.几种基于太网架构传输技术的比较尽管以太网是决定音频网络效率高低和协作性能好坏的基础,模拟音频信号还是不能很容易地被转换成数据并在标准的以太网络中传输,这是因为音频信号时效性极强。在音频网络中,数据包的延迟发送将导致音频信号的流失和不连贯。以太网是一种异步技术,不具备实时概念,传送管理也是“非确定性的”,这意味着以太网不能百分之百地保证某一数据包的及时送达。因此为了音频数据实时、稳定的传输,网络必须要有某种确定性的时效传输技术。Avoim、EtherSound、CobraNet以及Dante技术就可以提供这样的技术。先用OSI模型作为框架了解这四种传输技术。1.Aviom公司独自研制的A-NetTM数字音频传输技术是建立在物理层技术,使用标准的Cat-5e线缆和RJ-45端子。一条五类线可以传输多通道(64*64)、无压缩、超短延时(整个系统0.8毫秒)、远距离(点对点设备间150米)的数字音频,适用于音频信号源较多(8路话筒&线路以上),信号源和控制室、监听室、录音室、演播室的距离较远,追求高品质信号传输及个人调音监听的场所。可以采用环型、星型以及两者相结合的系统架构。2.CobraNet是一个完全的以太网技术,数据链路层的两个子层都得到了使用。CobraNet是美国PeakAudio公司开发的一种在以太网上传输专业非压缩音频信号的技术,它可以在100M以太网下单向可以传输64个48kHz、20bit的音频信号通道(48kHz、24bit信号为56路);除音频信号外,还可以传输RS485串口通信数据及其它非同步IP数据;开放的MIB文件,支持SNMP。CobraNet必须使用星型(或连星型)网络结构,所有的CobraNet设备都必须通过以太网交换机互相连接在一起。CobraNet传输协议的构建依靠3种基本数据包来完成:一是同步数据包(BeatPacket),它是由网络中的Master设备发出的同步指令数据,作为每个同步周期的起始数据包与网络中的全部设备保持精准同步,也就是系统中需要用户设置一个“Master”。一个数据包大约100个字节,每秒钟发送750次,总共占用大约1M的带宽;二是同步音频数据包(IsochronousDataPacket),也是CobraNet需要传送的真正数据内容,可以单播(Unicast)也可以多播(Broadcast)出去。音频数据包数据在整个CobraNet数据中占据了绝大多数,一个包大约包含了1280个字节的数据,加之其它报头和报尾数据,一个Bundle(在48kHz、20bit采样率下,每个Bundle包含8个PCM音频数据通道)大约要消耗8M的带宽;三是预约请求数据包(ReservationPacket),它是由除了Conductor以外的所有CM-1发出的广播数据包,包含了发送请求数据和优先级等重要信息。每个包含100字节的数据量,总共约占用10k左右的带宽。在此系统中无论音频信息量多大,其占用带宽固定,音频的采样频率固定,延时也是固定的。3.EtherSound是并非完全的以太网技术,但它没有在数据链路层的子层中使用逻辑链接协议。EtherSound是由法国Digigram公司开发的一种基于以太网传输音频信号的技术。传输能力为单方向64个24bit、48kHz(或44.1kHz)采样频率的音频通道。EtherSound系统可以采用菊花链结构或以太网星型结构或者这两种结构的混合形式。当数据流通过以太网交换机进行传输时,只能是沿着一个方向(Downstream)传递音频数据,也就是说无论这台交换机上连接了多少个EtherSound设备,同时只能有一台经过配置的设备可以向网络中发送音频数据,其它节点只能用来接收。这种数据包是广播类型的。对于数据量比较小的非同步控制信号,则可以进行双向传输的。EtherSound数据包中包含同步和音频数据。EtherSound同步方式借鉴了总线式同步数据传送方式,如火线IEEE1394接口协议,数据包发送的频率就是同步频率。同步发送的数据是从第一个设备中产生。这个第一就是由用户在搭建系统的时候根据系统的配置自己设定的,并将其命名为“PrimaryMaster”,一个完整的EtherSound系统只能有一个“PrimaryMaster”。如果系统同步时钟定义在44.1kHz的话,那么“PrimaryMaster”就按照44.1kHz的速度向外发送固定长度为236字节的以太网结构数据包,之后的所有音频必须使用相通的采样频率。从而总数据流量可以计算出=44100×236×8=83.3Mbit/s;同理48kHz采样下的数据流量为90.6Mbit/s。虽然它不能传递串口信号以及其它IP数据,但是它的技术最大的亮点就是极低的延时。4.Dante基于IP/以太网,被认为是OSI第四层传输技术。它是以IP数据结构在以太网中传递实时音频信号的技术。如图音频信号通过专用转换器转换成TCP/IP网络信号并传送到网络中,音频信号以数据包的形式在网上路由到任意的输出转换器,并转换成模拟信号提供给扬声器或者记录设备。可以兼容采样率不同的数字设备。对于一些处理设备,如数字处理器和数字调音台等,无需数字、模拟转换,而是直接在网络环境中处理数据包。在这个过程中,每个设备不需要关心自己的信号要路由到哪里去,也无需关心这些信号是从哪里来,这大大减轻了断点设备的配置复杂性。全部的路由可以由一个专用的软件,使用一一对应的通道名称就可以完成这个路由过程。Dante采用了很简单的zoroconf(无需人为去配置网络结构的协议,所有的配置都是自动完成的)协议,简化了网络的运行模式,为整个音频系统提供了一个简单的路由方法。利用自动配置服务器自动查找接口设备、标识标签以及区分IP地址等工作,而无需启动高层级别的DNS或者DHCP服务,同时也省略了复杂的手工网络配置。Dante系统采用了IEEE1588精密时钟协议进行时钟同步,网络中的每个音频设备都紧密跟踪这个基准时钟,基准时钟采用绝对时间标识。音频信号的采样频率跟随高解析度的时间拍,并将同步信息一起打包以UDP/IP形式传送,这些数据包跟随绝对时间戳在网络中传递,确保网络中的任何位置的节点都可以以同一基准时间输出相同采样频率的源信号。由于每个网络音频接口的都是将本地时钟频率同步到了基准绝对时间,所以它们的数据包在打包和解包的过程中产生的数据量是完全相同的,这就不会因为缓存数据过载(或太少的数据引起的缓存旁路)引起同步损失而丢失音频数据。音频通道的传输模式可以是单播,也可以是多播,最大限度地利用已有的网络带宽。对于多播的数据包,采用了树形的分发方式传递数据,并且只将数据传送到那些希望接收到的接收器中,而不会到处广播。这样做可以大大减轻网络的带宽压力。通过以上对各传输技术的分析,我们可以通过表3对几种不同网络传输技术的主要参数进行对比。五.总结网络音频看起来很混乱,但增进对OSI模型的了解能帮助我们在混乱中理出顺序。它不止提供了对各种技术的理解,还为专业数据提供了交流的共同语言。使用OSI模型作为基础保持音频网络的简单化,把它分解为两个功能部分(控制和传输),这将帮助我们在各自的应用中决定哪一种网络技术是最适合的。
本文标题:基于以太网的数字音频网络
链接地址:https://www.777doc.com/doc-2573283 .html