|
一、多媒体视频会议的内涵与特点 当人们正在寻求新的信息交流方式来满足各领域日益发展的需要时,多媒体视频会议技 术悄然而至。自从1993年、1995年美国CLI和Intel公司的视频会议产品相继进入中国市场以 来,视频会议技术已在我国许多重要部门和企事业单位发挥了不同程度的作用。预计在未来 几年中,这一技术及其应用将会有很大发展。 多媒体视频会议(Multi-media Video Conferencing)首先是可视化的、实时的、双工 的、交互的。其次,它以会议的形式实现了在不同地理位置上的人们的交流,包括在网络上的 一点对一点、一点对多点、多点对多点的语言、图像、图形、动画、视频、数据的传递与交 流。更重要的是,它体现了超越空间的群体的"Face-To-Face"的协同工作(Group Cooperatv e Working)。事实已经证明,多媒体视频会议技术在教育、医疗与健康、经济或军事决策、 金融服务、新高技术产品协同设计等方面,将大大地为人们节省时间、空间与费用,提高工作 效率。
二、关键技术 多媒体视频会议系统集现代数据通信与网络技术、信息处理技术、微电子技术、光电技 术、计算机软硬件技术于一体,其中关键技术如下:
1.数据压缩与编码技术 视频会议采用数字信号传送,而图像、视频、音频等多媒体信号数字化后的数据量很大 ,如一路电视模拟信号传输时占6~8MHz带宽,数字化后形成200Mbps 以上的数据流,这将占用 大量的长途通信信道,在目前的通信环境与设备条件下,显然是不可行的。于是,20多年来,人 们不断地研究在保证一定质量和压缩比前提下的数据压缩与编码技术。从方法上看有两大类 ,一类是无损压缩与编码,如哈夫曼(Huffman)的可变长度特征编码,Lempel、Ziv 和Welch的 自适应压缩LZW编码,由Elias提出并由Rissanen 和 Pasco 推出的算术编码,以及游程编码L C(RunLength Coding)等,这类统计编码技术又称可逆编码,它不丢失任何信息,但压缩比通常 不可能超过8。另一类是有损压缩与编码,它是近10多年来研究的热点与重点领域,其方法包 括预测、变换、模型、基于重要性、基于内容的编码,以及在以上基础上的混合编码。目前 最通用的是被认为对语音与图像信号的准最佳变换——离散余弦变换(DCT)方法。它以DT为 基础的静态图像编码在20倍左右的压缩下仍然保持相当好的图像质量,加上运动估值与运动 补偿等技术所形成的动态图像编码技术,在120倍左右的压缩下,数据流所恢复的视频的信噪 比还是很高的。因此,这些技术已经具备实用化条件,被国际标准化组织ISO和ITU等用来制定 出一系列的编码标准,如H.261、H.262、H.263等,为多媒体视频会议系统提供了切实可行的 编码技术与标准。 顺便指出,许多生产视频会议设备的厂家都宣称拥有独特的编码技术。这一方面表明了 编码技术的复杂性,但另一方面,笔者认为,其中最重要的恐怕还是出于保护产权的目的。
2.带宽与数据传输 多媒体视频会议依托的环境是多样化的,其网络类型包括LAN、WAN、ISDN、Internet以 及B-ISDN、ATM等。每种网络的带宽与传输协议是不同的,并且在多媒体视频会议系统的信号 中,包括了视频、音频、数据及同步控制信号,不同种类的数据有不同的传输特性和传输要求 。多媒体视频会议要借助现有的传输体系来传送数据,因此,目前国内外商品化的视频会议产 品都有很强的针对性。如: 高档会议室型 以美国Picture Tel、Vtel等公司为代表,使用DDN或专网,一般运行在30 0K~2Mbps速率下,提供高质量的多点控制会议服务,配有高档摄像、音响与显示器材,以保证 高质量的多媒体效果。 桌面会议系统 以美国Intel公司的ProShare系列产品、以色列的Vcon Online系统等为 代表。较高档的通常在DDN与ISDN环境中运行,在112~768Kbps速率下,可提供每秒25~30帧 CIF或QCIF图像;低档的通常在LAN/WAN环境中运行,在384Kbps速率下,提供每秒15~20帧图像 质量。 可视电话类型 将美国Connectix公司的QuickCam数字摄像机配以Microsoft公司的NetM eeting或WhitePine公司的Cu-Seeme等软件,便可构成直接面向千家万户的简便多媒体视频会 议系统。该系统运行在普通公共电话网(PSTN)上,在28.8Kbps或33.6Kbps等速率下,一般可提 供5~10帧QCIF格式的图像。
3.人机交互与协同工作 多媒体视频会议由本地发展到远程,由局部地区发展到国际交流。近年来,计算机信息技 术不断向纵深发展,应用的重点从求解问题向方便人们相互交流的方向转移,信息共享及人与 人之间的合作越来越重要,传统的孤立式工作方法,以文本为主体的信息媒体,以及单纯异步 式的信息交互方式已无法满足人们的需要。 CSCW是一个新的多学科的领域,其涉及的学科包括计算机、通信、分布系统、人工智能 、社会学、心理学等诸多方面。这些学科或学科方向从不同的角度,用不同的方法研究CSC的 有关问题。多媒体视频会议利用CSCW,为空间中相互隔离的人们提供"Face-To-Face" 和WYS IWIS"(你所见即我所见)的以网络信息技术为依托的多媒体协同工作环境。目前,我国"九五 "重点科技项目"现代计算机信息网络及其应用关键技术研究"课题中的"多媒体视频会议系统 "便是按照CSCW模式来研制的。其CSCW研究主要围绕在协调理论指导下的工作流(Work Fow) 的定义,以及执行、监控及协调原则的制定;实时型CSCW应使合作者在相同的时间中共享相同 的对象,由系统确定合作者对对象的哪一个逻辑部分操作,既要并发又要锁定。该课题要充分 利用已经建立了的HTTP、MPEG、H.263、G.723.1 等标准,以及Java、HTML、VRML等工具,设 计高效率的代理机制,使与会者感到自由与高效率。
三、多媒体视频会议标准体系 国际电信联盟ITU从1990年起制定了一系列多媒体技术标准,发布了H系列、G系列、T系 列等标准,形成了整套视频会议的标准体系,从根本上规范了图像、声音、数据的通信方式从 而解决了国际上不同制造商之间的互通问题,主要标准有:
1.多媒体视频会议系统标准 H.320:从56K~2Mbps速率的ISDN和56Kbps交换电路上视频会议框架标准。 H.323:运行在LAN和Intranet上的视频会议框架标准。 H.324:运行在低速率传统电话线和无线通信信道上的视频会议框架标准。
2.视频标准 H.261:视频信号编码传输速率P×64Kbps(P=1~20),图像为CIF与QCIF格式。 H.263: 1995年公布的视频编码标准,支持的图像规格有CIF、QCIF、SQCIF、4CIF、16I F。它将半象素精度用于运动补偿,并有4种供选择的编码算法用于改善性能。4CIF、16CI意 味着Codec完全具有其它较高比特率的视频规格,如MPEG标准。
3.音频标准 G.723.1:音频编码,可以用5.3Kbps和6.3Kbps提供窄带(3.5KHz)音频信号。
4.混合标准 H.221:把音频、视频、数据和控制信息复用到64~1920Kbps单比特流信道的标准。 H.223:在H.221基础上包括了数据调制解调器。
5.控制标准 有H.245等。
6.数据传输标准 有T.120等。
四、发展趋势 近年来,兼有时/频分析优越性的小波分解算法,在克服DCT变换时产生的方块效应方面具 有良好的性能。基于自相似性分析的分形图像模型及其编码方法,在自然场景分析、描述、 映射及迭代函数系统等编码方法中所表现出的优异的编码性能,其某些方面令人叹为观止。 在信息处理和模式识别基础上提出的基于内容(Based-Contents)的面向对象新一代编码技术 ,正在被酝酿制定为MPEG-4、MPEG-7等标准。在未来几年内,可望出现更高效率的编码技术以 支持视频会议系统向更高的性能发展。 Internet的建立与发展为多媒体视频会议提供了一个无限广阔的天地。为了利用Inten et这一全球范围内最大的计算机网络和信息服务资源,近年来,与之相关的视频会议系统领域 有了迅速的发展。其发展趋势主要有以下三方面:
1.出现了许多低成本高性能视频会议系统的硬件和软件 其中比较典型的商品系统是Connectix 公司的VideoPhone系统,包括该公司先进的数字 化摄像机QuickCam和会议系统软件,除音频系统外不再需要其它视频采集压缩硬件。 其网络环境为28.8Kbps Modem、TCP/IP或Novell IPX局域网,或为ISDN及速率更高的广 域网。它支持H.261压缩标准和IP多路广播(Multicast)视频、音频和共享白板。该系统可用 于打电话或举行点 -多点视频会议。比较典型的共享软件是CUSeeMe,由Cornell大学医学院 研制, 并自1993 年起,即得到美国国家科学基金的支持,功能与VideoPhone相似,其中公共的 Reflector 可以实现点-多点或多点-多点连接。目前它们都在迅速发展之中。
2.传输协议的研究和试验 TCP/IP是以文件传送为主要对象的协议,当用于低速链路多媒体传输和实时业务时,效率 很低。 现在有三种 TCP/IP 多路广播协议,即:DVMRP(Distance Vector Multicast Routin g Protocol)、 MOSPF(Multicast Open Shortest Path First)和PIM(Protocol Indepenen t Multicast)。但VideoPhone使用的是独立于以上三种协议的 IGMP(Internet Group Mnag ment Protocol),CUSeeMe使用的是UDP(User Datagram Protocol)。可以看出,传输协议的选 择和试验是视频会议研究的重要方面。 目前,先进国家的Internet主干网速率已开始向 155Mbps过渡。虽然满足传输层带宽要 求的解决方法容易找到,但这些方法常常并不能使高层获得足够的带宽灵敏度。当网络已经 是高性能虚拟主平台,而控制机制并未获得相应的高性能时,高层带宽的不足会成为真正的问 题。在北卡罗来纳MCNC研究三角公园举行的第二届分组视频工作会议上,这种情况甚至使一 些与会者怀疑当前计算机网络处理多媒体应用的能力,而倾向于面向连接电路交换的方式,但 多数人仍希望使用综合的网络方法。除著名的MBONE上的标准视频会议协议RTP (Real-Tim Protocol)外,已纳入Internet RFC的XTP(Xpress Transfer Protocol)的研究和实验也是其 中的重要内容。目前,XTP论坛的成员以诸如多方远程会议等多媒体应用为主要部分进行的试 验有以下方面: (1)弗吉尼亚大学在FDDI网络上运行了100个模拟 的声音通道,以测试FDDI的极限以及测试在模拟交互式声音环境中XTP的一个软件版本。 多方非交互式视频已经在那里运行了几年。另外,还有基于XTP/FDDI的视频邮件演示,它使用 Fluent多媒体界面和标准JPEG压缩,可从任一网络PC的磁盘发送满帧全彩色、30 帧 /秒的图 像到其它远程VGA屏幕。本地磁盘和远程磁盘的回放图像看不出差别。服务器和客户系统上 使用XFS(Xpress File System)。 (2)据德国柏林技术大学报道,在欧洲高级通信技术 (RACE)中的多媒体业务CIO(Coodination、Implememtation and Operation)正使用XT作 为设计的出发点。 (3)美国海军指挥、控制和海洋监视中心的研究、发展、试验评价部门NraD(前海军海洋 系统指挥部门NOSC),用XTP/FDDI进行多方音频传送。一个小组内简单的多方音频传送话筒声 音信号-扬声器时延约25ms。这个小组当前正在研究N方音频系统(N×N多方电话会议)。 (4)在商业方面,Starlight Network公司把XTP的子集移植到视频应用服务器的传输层里 。 通过使用XTP速率控制,全动态全屏幕压缩的视频能以恒定的1.2Mbps通过开关-集线器以 太网传送到各接收站。该网络至少能同时传送10个视频流。
3.对Internet上实时会议系统标准的研究 Internet上的现代邮寄软件均依从RFC822,即E-mail已经具有标准形式。会议系统与UE Net的区别只在于前者是会话,后者是E-mail。虽然许多非正式会议系统已经存在并支持全球 或本地论坛,但Internet目前还没有正式的会议系统标准。许多有识之士鉴于USENet在发展 过程中出现的问题(如USENet信噪比极差),已经开始进行Internet网上实时会议系统标准的 研究,一些研究结果已纳入Internet的RFC。 Cernet的建立大大加速了多媒体视频会议技术的发展,这些技术既可以应用于远程教育 、远程医疗、决策支持等社会公益系统,也可以应用于工业产品设计与制造过程,构造具体、 实际的应用系统,为分散的客户们提供虚拟的协同工作环境,实现目标产品及相关过程的群体 协同设计和系统内部的组织与管理集成化,以提高工作质量和工作效率。 多媒体视频会议系统作为国家"九五"重点科技攻关项目,通过发挥各单位的技术优势,联 合攻关,逐个解决多媒体视频会议专题所涉及的关键技术问题,必将在CSCW支持下的视频会议 体系结构与参考模型方面取得突破,并开发出拥有我国自主版权、先进实用的CSCW多媒体视 频会议应用软件与开发环境,这具有十分重要的意义。 与此同时,在高带宽领域,随着ATM网或高速以太网的发展,运用更好的视频编码算法(如 MPEG-2、MPEG-4)等将获取更高质量的视/音效果。这已成为多媒体视频会议的另一个发展方 向。
|