您现在的位置是:首页 > IT基础架构 > 网络与安全 >

视频会议系统的主流解决方案与技术趋势

2008-09-15 23:27:00作者:晓袁来源:

摘要视频会议系统传输的是多媒体数据,声音和动态图像的源信号的数据量较大,无法在一般条件的数字线路上传输。同时,基于对实际使用效果的要求,要求传输的声音、图像信号连续平滑,其他辅助功能易于使用。...

  视频会议系统传输的是多媒体数据,声音和动态图像的源信号的数据量较大,无法在一般条件的数字线路上传输。同时,基于对实际使用效果的要求,要求传输的声音、图像信号连续平滑,其他辅助功能易于使用。因此,对系统在声音/图像压缩、通讯线路条件、数据/应用程序共享等方面都有很高的技术要求。本文将从目前视频会议的主要技术、解决方案及未来技术趋势、网络技术标准等方面进行探讨,希望为该领域的研发人员提供参考。

  视频会议系统的关键技术

  1)多媒体信息处理技术

  多媒体信息处理技术主要是针对各种媒体信息进行压缩和处理。视频会议的发展过程也反映出信息处理技术特别是视频压缩技术的发展历程。目前新的理论、算法不断推进多媒体信息处理技术的发展,进而推动着视频会议技术的发展。特别是在网络带宽不富裕的条件下,多媒体信息压缩技术已成为视频会议最关键的问题之一。

  与基于PC机的CPU技术、基于专用芯片组技术相比较,媒体处理器因为具有特有的数字视音频输入输出接口、多媒体协处理器等使应用变得更加简单,而且设备厂家可以根据市场变化随时进行软件应用的调整,及时适应市场需求,而不会受制于专用芯片组本身的技术限制。媒体处理器支持的嵌入式操作系统以及软件优化,使视频会议系统更加高效、稳定、可靠。媒体处理器技术事实上已经成为视频会议的核心芯片技术,将来还将服务于3G可视手机等终端产品。

  在视频会议系统中,目前的媒体处理器主要有:Philip公司的TriMedia系列及新品PNX1500、美国ESS公司的LVP、 ADI公司的ADSP2106X器件及Blackfin处理器、TI公司的C6X、C8X以及新推出的DM642多媒体DSP芯片,这些媒体处理器高速的运算能力可以实现适合不同协议的视频会议通信终端。采用这些芯片可以很方便地实现MPEG视频和音频处理、H.263视频处理,还可以实现其它的多媒体应用如DVD、数字机顶盒、数字电视等。

  2)宽带网络技术正在迅速发展的IP网络,由于它是面向非连接的网络,因而对传输实时的多媒体信息而言是不适合的,但TCP/IP协议对多媒体数据的传输并没有根本性的限制。目前世界主要的标准化组织、产业联盟、各大公司都在对IP网络上的传输协议进行改进,并已取得初步成效,如 RTP/RTCP、RSVP、IPv6等协议。为在IP网络上大力发展诸如视频会议之类的多媒体业务打下了良好的基础。据预测,IP网上的视频会议业务将会大大超过电路交换网上的视频会议业务。

  Internet的网络规模和用户数量迅猛发展,如何进一步扩展网上运行的业务种类并提高网络的服务质量是目前人们最关心的问题。由于 IP协议是无连接协议,Internet网络中没有服务质量的概念,不能保证有足够的吞吐量和符合要求的传送时延,只是尽最大努力(Best- effort)来满足用户的需要,所以如果不采取新的方法改善目前的网络环境,就无法大规模发展新业务。

  在现有的网络技术中,从支持QoS的角度来看,ATM作为继IP之后迅速发展起来的一种快速分组交换技术具有得天独厚的技术优势。因此 ATM曾一度被认为是一种处处适用的技术,人们最终将建立通过网络核心便可到达另一个桌面终端的纯ATM网络。但是,实践证明这种想法是错误的。首先,纯 ATM网络的实现过于复杂,导致应用价格高,难被大众所接受。其次,在网络发展的同时,相应的业务开发没有跟上,导致目前ATM的发展举步维艰。第三,虽然ATM交换机作为网络的骨干节点已经被广泛使用,但ATM信元到桌面的业务发展却十分缓慢。

  由于IP技术和ATM技术在各自的发展领域中都遇到了实际困难,彼此都需要借助对方以求得进一步发展,所以这两种技术的结合存在必然性。多协议标签交换(MPLS)技术就是为了综合利用网络核心的交换技术和网络边缘的IP路由技术各自的优点而产生的。其特点如下:

  (1) 基于单一的转发机制,可在同一网内同时支持多种业务类型的转发;(2)通过短小固定的标签,采用精确匹配寻径方式取代传统路由器的最长匹配寻径方式; (3)通过集成链路层(ATM、帧中继)与网络层路由技术,解决了Internet扩展、保证IP QoS传输的问题;(4)利用显式路由功能同时通过带有QoS参数的信令协议建立受限标签交换路径(CR-LSP),因而能够有效地实施面向全国的流量工程。目前MPLS技术在QoS标签分配信令、解决VC合并、传输分类业务等许多方面还存在很多难点,需要进一步完善。

  3)分布式处理技术视频会议实现点对点、一点对多点、多点之间的实时同步交互通信。视频会议系统要求不同媒体、不同位置的终端的收发同步协调,多点控制单元(MCU)有效地统一控制,使与会终端数据共享,有效协调各种媒体的同步传输,使系统更具有人性化的信息交流和处理方式。通信、合作、协调正是分布式处理的要求,也是交互式多媒体协同工作系统(CSCW)的基本内涵。因此从这个意义上说,视频会议系统是CSCW主要的群件系统之一。

  随着多媒体技术的广泛应用,采用DSP芯片设计多媒体设备,成为人们关注的方向。但是,对于可编程的媒体处理器的需求也很高。因为多媒体信号处理技术处于一个高速发展的阶段,各种国际标准共存,新标准不断涌现。例如,仅视频压缩编码,就有多种国际标准:H.261、H.263、MPEG1、 MPEG2、MPEG4和新的H.264等。在一个网络上传输的可能是多种不同标准的码流,而且对于一个设备而言,也要不断更新视频编码技术。

  例如一个早期的视频会议设备采用H.261编码视频,在H.263出现后,最好是改用H.263标准,而且也许很快就会采用H.264 作为视频会议的编码标准。这就存在两个要求,一是设备的更新换代,二是多种标准的转换。对于用固定的专用芯片实现的设备,这两条都难以达到。但如果采用 DSP作为核心处理器,只需更新软件就可以达到第一个要求,增加部分功能软件,可以适度满足第二个要求。

 

  正是考虑这种需要,一种新型的DSP芯片-媒体处理器(Media ProCESsor)应运而生,并很快得到业界的广泛关注。飞利浦、ADI、TI等半导体供应商都十分看好媒体处理器市场,并推出了具有竞争力的产品。高处理能力芯片的出现给视频会议带来更小的延迟和更高的帧频。例如TI公司的TMS320 DM642、飞利浦的Trimedia和Equator的MAPCA,它们集成了丰富的多媒体信号接口,针对多媒体信号的特点优化了处理器结构,甚至内嵌了特殊协处理器用于进行专门操作,缓解通用处理器的压力,例如视频编码中的变长编解码(LC/VLD)。

  媒体处理器提供了完全可编程的多媒体设备的实现工具。媒体处理器继承了通用DSP芯片的特点,针对多媒体应用扩充了各种接口功能,优化了中央处理器结构。尽管媒体处理器出现的时间不长,但已得到广泛关注,可以预见媒体处理器将会快速应用到多媒体设备制造业中。

  中星微电子公司的多媒体芯片SoC平衡了集成度、灵活性、成本和功耗等多方面要求。目前其应用于视频会议系统中的多媒体芯片产品有 VC0301P、VC0302和VC0321。该公司的副总裁俞青介绍说,中星微电子的多媒体芯片可以支持目前主流的各种音频和视频算法, 并支持从无线多媒体到高端视频会议等一系列应用。在PC平台上,中星微电子与微软合作,最近推出基于USB2.0的视频即时通讯系统,使视频质量和系统稳定性上了一个新台阶。

  针对视频会议等多媒体应用,飞利浦推出数字媒体处理器PNX1500,这是一款系统级芯片(SoC)。据飞利浦半导体公司高级媒体处理组市场总监Jan Koene介绍,“最新产品Nexperia PNX1500在运行控制任务以及数字信号处理任务方面具有出色的能力,而这两方面都是视频会议系统所要求的。可以在单片PNX1500上运行这两个任务,而在效率相同的情况下,这对竞争方案而言是难以实现的。通过在PNX1500上合并硬件模块,例如视频I/O、音频I/O和通用接口,可以降低BOM 成本。因为所有的音视频编解码功能都是用软件实现的,所以飞利浦的产品很容易适应新的标准,例如H.264。”

  TI 的新型数字媒体处理器TMS320DM642带有三个视频口,均可输入或输出,支持BT656、百兆以太网口、多路音频串口、66MHz PCI等等,可支持四路D1图像,30帧/秒的MPEG-2的实时压缩。TI 的数字媒体处理器不仅能够以 Microsoft WMV9 格式提供高清晰视频流,而且还能够提供 MPEG-4、MPEG-2 以及 MPEG-1。此外,该器件还支持H.264。

  TI公司半导体事业部高级业务代表郑小龙表示,除了提供 720 MHz DM642 的样片之外,目前 TI 还为 DM640 与 DM641 以及 600 MHz DM642 提供批量生产的器件。这些代码兼容的数字媒体处理器可扩展各种时钟速率及存储器容量,能够支持广泛的应用,例如从基于视频的便携式消费类电子产品到视频基础设施设备等。

  微软公司 Windows Media 技术部副总裁 Amir Majidimehr 说:“对于 Windows Media 9 编码器与解码器而言,TI 的 DM642 是第一款成功通过 D1 清晰度条件下一致性测试的可编程 DSP。TI 的新型 720MHz DM642 有助于将 HD WM9 集成到各种具有代码兼容与可编程性能的嵌入式消费类应用中。”

  ADI的Blackfin是一种高性能、双乘加器(MAC) DSP,具有微处理器性能,诸如监督和用户模式、存储保护、8-/16-/32位算术及多媒体处理扩展。Blackfin处理器既能作为主要的音视频处理器,又能用作图形用户界面(GUI)和网络处理的主处理器。Blackfin是完全可编程的。因此可以很容易地支持新标准,而无需改变硬件平台。例如 ADI可视电话平台中的Blackfin处理器能够支持H.264,这是通过软件升级来实现的。

  据ADI公司软件和系统技术部产品行销经理Dan Ivanciw介绍,Blackfin处理器架构经过优化,能很好地执行控制和数字算法,可以作为主处理器和音视频处理器。“设计人员无须采用多个不同的处理器、不同的开发环境及不同的工具包,无论是正在开发典型主功能代码还是高级音视频编解码,采用Blackfin,开发团队只需要掌握一种编程方法、指令系统、开发工具环境。用户也会得到益处:缩短产品面市时间,削减开发成本,降低开发风险,提高IP复用性。”

  在多媒体信号处理领域,特别是在视频处理方面,通常要求数字信号处理器具有针对多媒体应用的、优化的内核结构和丰富的媒体接口,而通用信号处理器在这方面性能得不到充分发挥。鉴于此,美国Equator公司推出了BSP系列高速宽带数字信号处理器。BSP-15是该系列中的一款,可与 MAP-CA反向兼容。

  BSP-15是专门以视频应用为中心而设计的高效DSP,以高度集成的单芯片满足了宽带产品的需要。在400MHz的时钟频率下, BSP-15处理能力为40 GOPS(每秒400亿次整数运算),处理速度相当于奔腾III的8.5倍,是同系列MAP-CA芯片的1.33倍,是其它解决方案的10倍以上。BSP -15的核心功能是采用软件专为高性能、大视频流的宽带应用而设计,结合iMMediaTools软件开发环境及其提供的视音频库,BSP-15可以为数字视频图像应用提供高效的解决方案。

  据某视频会议产品研发工程师介绍,选用BSP-15芯片进行视音频的系统设计具有3方面优势:其一,BSP-15 是专为视频图像处理而设计的,能够提供高质量的视频效果;其二,BSP-15具有丰富的片上I/O接口,不必添加过多的外围设备,因而可以降低整个系统的成本和设计的复杂度;其三,完全采用C语言编程,没有汇编语言要求,升级方便,灵活性高。与同系列的TI DSP及Philip的Trimedia 系列DSP相比,BSP-15不足之处是软件开发难度较大,稳定性也被怀疑。但由于其出色的处理性能,BSP-15处理器在消费电子产品、视频会议、数字图像处理等方面仍将占有较大的市场。

  以色列VCON通信有限公司去年推出基于新一代Equator BSP-15多媒体处理器的高性能的视频会议编解码器-HD100视频会议引擎。VCON公司首席市场官Gordon Daugherty认为:“视频会议的质量越来越接近广播电视的质量,视频会议市场已经进入了一个新的阶段。VCON集成商可以利用HD100视频会议引擎小巧的体积、极高的音频视频质量,以极具竞争力的成本构建各种先进多媒体会议应用。”

 

  随着时延问题被IETF技术和标准(如组播技术、带宽预留协议和实时控制协议)逐步解决,基于IP的视频会议方案把终端互操作性和高传输性能结合了起来。就标准而言,资源预留协议(RSVP)有助于避免网络拥塞,保证了视频会议的传输质量;实时传送协议(RTP)虽然不能保证数据传输的完整性,但能利用时间戳方法处理好定时关系,使传输过程中的数据顺序不被打乱。视频通信将会变得更容易,费用会更低,传统的会议模式已经远远不能适应网络时代的需求。而视频会议系统作为支持人们远距离进行实时信息交流、开展协同工作的应用系统,使协作成员可以远距离进行直观、真实的视/音频交流。

  ADI公司软件和系统技术部产品行销经理Dan Ivanciw认为,视频会议的技术趋势之一是需要更高压缩率的视频编解码技术;还有在服务质量和安全方面有所改进的网络;今天功能固定的、不灵活的视频会议产品需要加以替换,或者采取昂贵的硬件升级去兼容,或者在将来利用这些变化和改良。另一趋势是基于IP的视频服务与VoIP产品融合。第三种普遍趋势是:服务供应商给更广泛的住户和商业客户提供IP视频增值服务。这种情况也存在于大多数产品领域,用户总是希望增加更多功能,例如三方或多方音视频会议。附加的功能需要终端设备具有更强大的处理能力,但是通过把一些性能融进终端设备中可以减少基础架构方面的需求。

  TI 的新型数字媒体处理器TMS320DM642带有三个视频口,均可输入或输出,支持BT656、百兆以太网口、多路音频串口、66MHz PCI等等,可支持四路D1图像,30帧/秒的MPEG-2的实时压缩。TI 的数字媒体处理器不仅能够以 Microsoft WMV9 格式提供高清晰视频流,而且还能够提供 MPEG-4、MPEG-2 以及 MPEG-1。此外,该器件还支持H.264。

  TI公司半导体事业部高级业务代表郑小龙表示,除了提供 720 MHz DM642 的样片之外,目前 TI 还为 DM640 与 DM641 以及 600 MHz DM642 提供批量生产的器件。这些代码兼容的数字媒体处理器可扩展各种时钟速率及存储器容量,能够支持广泛的应用,例如从基于视频的便携式消费类电子产品到视频基础设施设备等。

  微软公司 Windows Media 技术部副总裁 Amir Majidimehr 说:“对于 Windows Media 9 编码器与解码器而言,TI 的 DM642 是第一款成功通过 D1 清晰度条件下一致性测试的可编程 DSP。TI 的新型 720MHz DM642 有助于将 HD WM9 集成到各种具有代码兼容与可编程性能的嵌入式消费类应用中。”

  ADI的Blackfin是一种高性能、双乘加器(MAC) DSP,具有微处理器性能,诸如监督和用户模式、存储保护、8-/16-/32位算术及多媒体处理扩展。Blackfin处理器既能作为主要的音视频处理器,又能用作图形用户界面(GUI)和网络处理的主处理器。Blackfin是完全可编程的。因此可以很容易地支持新标准,而无需改变硬件平台。例如 ADI可视电话平台中的Blackfin处理器能够支持H.264,这是通过软件升级来实现的。

  据ADI公司软件和系统技术部产品行销经理Dan Ivanciw介绍,Blackfin处理器架构经过优化,能很好地执行控制和数字算法,可以作为主处理器和音视频处理器。“设计人员无须采用多个不同的处理器、不同的开发环境及不同的工具包,无论是正在开发典型主功能代码还是高级音视频编解码,采用Blackfin,开发团队只需要掌握一种编程方法、指令系统、开发工具环境。用户也会得到益处:缩短产品面市时间,削减开发成本,降低开发风险,提高IP复用性。”

  在多媒体信号处理领域,特别是在视频处理方面,通常要求数字信号处理器具有针对多媒体应用的、优化的内核结构和丰富的媒体接口,而通用信号处理器在这方面性能得不到充分发挥。鉴于此,美国Equator公司推出了BSP系列高速宽带数字信号处理器。BSP-15是该系列中的一款,可与 MAP-CA反向兼容。

  BSP-15是专门以视频应用为中心而设计的高效DSP,以高度集成的单芯片满足了宽带产品的需要。在400MHz的时钟频率下, BSP-15处理能力为40 GOPS(每秒400亿次整数运算),处理速度相当于奔腾III的8.5倍,是同系列MAP-CA芯片的1.33倍,是其它解决方案的10倍以上。BSP -15的核心功能是采用软件专为高性能、大视频流的宽带应用而设计,结合iMMediaTools软件开发环境及其提供的视音频库,BSP-15可以为数字视频图像应用提供高效的解决方案。

  据某视频会议产品研发工程师介绍,选用BSP-15芯片进行视音频的系统设计具有3方面优势:其一,BSP-15 是专为视频图像处理而设计的,能够提供高质量的视频效果;其二,BSP-15具有丰富的片上I/O接口,不必添加过多的外围设备,因而可以降低整个系统的成本和设计的复杂度;其三,完全采用C语言编程,没有汇编语言要求,升级方便,灵活性高。与同系列的TI DSP及Philip的Trimedia 系列DSP相比,BSP-15不足之处是软件开发难度较大,稳定性也被怀疑。但由于其出色的处理性能,BSP-15处理器在消费电子产品、视频会议、数字图像处理等方面仍将占有较大的市场。

  以色列VCON通信有限公司去年推出基于新一代Equator BSP-15多媒体处理器的高性能的视频会议编解码器-HD100视频会议引擎。VCON公司首席市场官Gordon Daugherty认为:“视频会议的质量越来越接近广播电视的质量,视频会议市场已经进入了一个新的阶段。VCON集成商可以利用HD100视频会议引擎小巧的体积、极高的音频视频质量,以极具竞争力的成本构建各种先进多媒体会议应用。”

  随着时延问题被IETF技术和标准(如组播技术、带宽预留协议和实时控制协议)逐步解决,基于IP的视频会议方案把终端互操作性和高传输性能结合了起来。就标准而言,资源预留协议(RSVP)有助于避免网络拥塞,保证了视频会议的传输质量;实时传送协议(RTP)虽然不能保证数据传输的完整性,但能利用时间戳方法处理好定时关系,使传输过程中的数据顺序不被打乱。视频通信将会变得更容易,费用会更低,传统的会议模式已经远远不能适应网络时代的需求。而视频会议系统作为支持人们远距离进行实时信息交流、开展协同工作的应用系统,使协作成员可以远距离进行直观、真实的视/音频交流。

 

  ADI公司软件和系统技术部产品行销经理Dan Ivanciw认为,视频会议的技术趋势之一是需要更高压缩率的视频编解码技术;还有在服务质量和安全方面有所改进的网络;今天功能固定的、不灵活的视频会议产品需要加以替换,或者采取昂贵的硬件升级去兼容,或者在将来利用这些变化和改良。另一趋势是基于IP的视频服务与VoIP产品融合。第三种普遍趋势是:服务供应商给更广泛的住户和商业客户提供IP视频增值服务。这种情况也存在于大多数产品领域,用户总是希望增加更多功能,例如三方或多方音视频会议。附加的功能需要终端设备具有更强大的处理能力,但是通过把一些性能融进终端设备中可以减少基础架构方面的需求。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们