分布式热线录音系统的整体设计及实现论文

时间:2021-08-31

分布式热线录音系统的整体设计及实现论文

1 概述。

  近年来随着移动互联网的迅速发展, 国内外广播电台正在发生着深刻的变革[8]. 传统广播电台面临着巨大的挑战, 如何吸引广大的听众, 尤其是吸引广大的移动智能终端的听众, 成为了广播电台的最大的问号。 随着广播电台节目主持人与听众之间的互动越来越频繁, 传统的电台导播模式已无法满足电台节目业务的需求, 数字导播系统应用而生。 数字导播系统是新媒体变革大趋势中的产物, 它有效地解决了传统导播设备无法满足接听大量听众来电的问题, 满足了电台和听众对节目形式的多种需求。

  随着数字导播的在各家电台的部署和应用, 听众参与电台节目变得方便快捷, 热线来电的数据统计为节目组提供有用的信息, 因此对热线录音系统的研究变得越来越重要。

  传统的热线来电录音功能, 是由录音服务器直接进行录音的, 录音文件资源也集中存储在录音服务器的硬件存储设备中, 这时录音服务器就需要很高的性能满足实时的录音和存储大量的录音文件。 为了能够减少录音服务器的负荷, 同时为了能够保存大量的录音文件资源, 通过对录音功能的研究和分析, 设计出了分布式的热线录音系统。

  该课题根据热线录音的特点, 设计了基于硬件语音卡设备的热线录音系统, 文件资源分布式地存储在各个频道工作站上。 本文将从分布式热线录音系统的相关技术、整体设计和录音系统的实现来进行讲解。

2 相关技术介绍。

  2.1 硬件录音技术的研究和分析。

  本课题在频率工作站端的热线语音板卡设备是杭州三汇公司生产的三汇语音卡, 使用的是 SHT 系列SHT–2B/USB 型号的语音卡, 这种型号采用 USB 接口,符合 1.1 协议的模拟电话线语音盒, 通过配置不同的功能模块, 即可实现虚拟电话机、座席、外线接入等功能。 该型号的语音卡支持 DTMF 和 FSK 模式。 采用电信标准的回声抵消算法, 支持 IP 电话应用和语音识别应用的 BargeIn. 它支持 4 通道全双工录音/放音, 不同的通道可以同时进行不同格式的录放音, 支持 G711A–law、μ–law、linear PCM、IMA–ADPCM、MP3、VOX 和 WINDOWS 标准 WAV 格式, 可以方便地使用Cooledit 等多种声音工具编辑和播放语音文件。

  2.2 分布式文件系统(DFS)。

  分布式文件系统[1,2](DFS)把一些分散的(分布在局域网内各个计算机上)共享文件夹, 集合到一个文件夹内(虚拟文件夹)。 利用分布式文件夹, 对于用户来说,要访问这些共享文件夹的时候, 只要打开这个虚拟共享文件夹, 就可以看到所有链接到虚拟共享文件夹内的共享文件夹。 用户感觉不到这是一个虚拟的共享文件夹, 感觉不到这些文件夹时分散于各个计算机上的。分布式文件系统的好处是: 集中访问简化操作, 提高文件存取效率。

  2.3 消息队列和 RabbitMQ.

  为实现业务服务器系统对频率工作站录音功能的实时控制与管理需要在业务服务器系统与频率工作站之间建立可靠的通信手段以保障控制命令与状态信息的实时交互。 在分布式热线录音系统中, 使用消息中间件服务器建立了一条基于标准消息队列协议的业务服务器系统与频率工作站交互的通道。

  使用AMQP标准协议作为自定义业务协议的承载手段, AMQP 是一个提供统一消息服务的应用层标准协议, 选用 RabbitMQ[3]消息队列中间件开源项目作为消息中间件服务器。 RabbitMQ 消息队列中间件开源项目AMQP的标准实现, RabbitMQ定义了以下重要概念。

  (1) Exchange, 消息交换机, 它指定消息按什么规则, 路由到哪个队列。

  (2) Queue, 消息队列载体, 每个消息都会被投入到一个或多个队列。

  (3) Binding, 绑定, 作用是把 exchange 和 queue 按照路由规则绑定起来。

  (4) Routing Key, 路由关键字, exchange 根据路由关键字进行消息投递。

3 分布式热线录音系统的整体设计。

  3.1 分布式热线录音系统的整体设计目标。

  数字导播系统是以图形界面实现人机交互, 集导播计算机、主持人计算机、导播话机等为一体的数字音频系统。 分布式热线录音系统是数字导播系统的业务子系统, 实现频率工作站的录音及相关管理功能以及对频率工作站上的录音文件资源进行的管理。 分布式热线录音系统由录音服务器、消息中间件服务器、WEB 服务器和若干个频率工作站组成, 分布式热线录音系统的拓扑图如图 1 所示。 通过对用户需求的调研及详细分析得到了用户的详细需求, 并根据用户需求设计了分布式热线录音系统的整体架构。

  3.2 整体结构设计。

  录音服务器的主要功能是提供对频率工作站录音策略的管理功能、提供与频率工作站的交互接口即录音服务接口协议以完成对频率工作站的录音操作的实时控制、提供对频率工作站的录音资源的快速检索能力。

  消息中间件服务器建立了一条基于标准消息队列协议的业务服务器系统与频率工作站交互的通道, 使用 AMQP 协议承载录音服务接口协议。

  Web 服务器主要为业务服务器系统提供 Web 能力,为用户提供管理分布式热线录音系统的用户界面交互接口。

  分布式文件系统(DFS)为分布式录音系统提供了统一的分布式文件管理能力, 利用 DFS 地址映射能力将不同地址的频率工作站映射到统一的域名下面, 通过自定义的 Uri 构造规则实现对频率工作站录音文件的访问及获取, DFS 只为分布式录音系统提供了文件管理能力, 需要配合其他通信及交互手段实现对频率工作站实时录音的控制功能。

  频率工作站是分布式热线录音系统中实现录音操作的独立功能单元。 频率工作站依据录音策略对导播热线语音通话进行录音操作。 频率工作站录音系统主要包含四个功能模块, 各个模块相互配合并利用相关技术实现频率工作站导播热线语音通话的录音功能。

  频率工作站的四个业务功能模块分别是:

  (1)录音服务协议栈模块。

  (2)录音策略管理模块。

  (3)SIP[4,5]终端功能模块。

  (4)语音设备控制模块。

  分布式热线录音系统的整体结构如图 2 所示: