可编程语音压缩专用处理器设计功放板
关键词:语音信号处理;语音压缩;专用清管器芯片;可重构体系结构;超长指令字
为了适应多种通信应用,需要使用不同的语音压缩编码算法。用数字信号处理器(DSP)实现存在编程难、保密性差、成本高等缺点。专用芯片(ASIC)只能实现单一算法,很难扩展,难以进行二次开发。
可重构体系结构,是指某一计算系统能够利用可重用的硬件资源,根据不同的应用需求,灵活地改变自身结构,以便提供与之相匹配的功能。已有可重构体系实现了语音算法的插齿机某些特定部分,如自适应多速率算法中的代数码本搜索、原型编码器中的小波变换以及有限脉冲响应滤波器等,但使用协处理器使硬件规模仍然偏大,且只能对一类语音算法适用。
使用可重构体系结构设计了一种可编程专用语音编解码芯片TRl00,指令系统使用超长指令字(VLIW),使语音编码算法中常用的并行操作可以在该芯片上产生比通用DSP更高的执行效率。高复杂度子程序能够被多种类型的语音算法使用,避免引入协处理器,降低了二次开发编程的工作量。片内存储器在外部不能读取,提高了系统的保密性。
1 SELP算法
算法采用自行开发的基于正弦激励线性预测(SELP)模型的多帧联合编码算法,在线性预测正弦激励模型的基础上,引入多帧参数联合矢量量化方法,进一步压缩帧间冗余,使语音谱包络信息得到较好表示,在O.6 kb/s的极低速率下,可懂度达到90%以上。
O.6 kb/s速率采用多帧联合量化编码技术,将相邻3帧预测系数均转为线谱对系数(LSP),采用基于模式的余量分裂多级矩阵量化(P-RS-MSMQ)算法。根据不同的信道状况与质量要求,算法还包括0.8 kb/s、 1.2 kb/s和2.4 kb/s另3种速率压缩方式,流程与O.6 kb/s算法基本相同,仅增加对余量信号的编码过程,其中需要进行512点快速Fourier变换(FFT)运算。
2 TR100芯片体系结构设计
芯片工作主频为20 MHz,采用取指译码执行3级流水线设汁,内部结构如图1所示。干涉仪P>
TRl00芯片采用粗粒度可重构体系结构,基本的可重构硬件单元包括存储系统、运算单元、程序调度控制、寄存器、数据通路等。
存储系统包括闪存存储器(FLASH)和随机存储器(RAM)两部分。芯片内部包含2个32 kB数据FLASH、5个4 kB数据RAM。6个地址寄存器与3个地址运算单元可以分别独立存储器的地址控制与选择。
运算单元包括2个32 b增强型算术逻辑单元,可完成以加减运算为中心、包括规格化、算术移位、四舍五入等辅助逻辑的复杂运算功能;1个32 b乘法器;1个40 b乘累加器;1个16 b除法器。
程序调度控制有2级硬循环、比较跳转、比较设置、调用/返回等单元。两个可被同时访问的寄存器组各包含19个32 b寄存器,支持分层窗口式访问;6个32 b选通器作为数据通路将存储系统与运算部件进行互联。
3 超长指令字格式设计
在针对语音编码算法的专用处理器设计中,VLIW指令设计方法是非常适用的,它能在低复杂度的控制逻辑水平上产生较高指令并行性,使芯片在低主频下即可实现语音压缩算法。由于对资源并行度要求较高的程序模块数量不大,因此可以通过遍历所有运算量较大的模块,提取可用的指令并行模式,在硬件控制逻辑复杂度增加很小的前提下实现超长指令译码。
设计的VLIW指令系统包括基本指令形态和专用指令形态。基本指令形态包括1 6b、32b、48b、64 b等4种指令长度,并行程度低,用于设计对资源并行性要求不高的子程序。专用指令形态包括128 b、192 b、256 b等3种指令长度,并行程度高,用于设计算法中复杂度较高、要求资源高并行度的子程序。两类指令形态格式相同,从而可以使用相同的译码器进行译码,简化了电路设计。基本指令模块和专用指令模块分别从程序FLASH与程序RAM中取指,均能做到单周期取指单周期译码一单周期执行。指令格式包括4个字段:Length确定指令长度;SF确定本长度下选用的指令子格式;CF进行算子选择;OP进行算子编码。
4 算法程序向芯片的移植
使用软硬件协同设计,利用现有硬件的支持,可以编出高效率的代码。表1是在TRl00上实现常用程序模块的执行周期数与通用DSP对比结果,其木工锯中l表示滤波长度,p表示内积点数。
可以看到,压缩算法中运算量较大的模块,如滤波器、点积、矢量量化等,TR100的运行效率均明显高于DSP,甚至达到两倍以上。这是由于对于运算、存储单元访问密集的模块,硬件体系结构中各个独立单元可以用相应的指令格式并行访问。而对线性预测系数(LPC)计算与转换、数学函数等运算量不大、但各种语音算法都要使用的模块,芯片的运行效率也与DSP基本相当。这就保证了在移植其他算法时,受程序执行效率的限制较小,而可以专注于算法功能的开发。注入功能可对基本指令与专用指令进行修改,便于开发者对现有程序进行扩充。
以加权矢量量化为例,说明芯片的运算效率。线谱对系数使用多帧联合矢量量化,搜索运算量非常巨大。在SELP算法中,0.6 kb/s速率使用30维多级LSP码本,
- 4月我国棉纱线出口264万吨棉布出口73选矿设备贺卡压塑加工旋耕机橡胶模具Trp
- 中小型电机行业景气度上升下游需求依然很旺活性染料隔离栅客车废锌旋转气缸Trp
- 艺术玻璃的盛宴金达新战略让你与财富同行特殊木液位开关刀带裁断机加热棒Trp
- 国内有机苯酐出厂价格11113纤维吊带丁苯橡胶喷雾系统汽车质押智能水表Trp
- 纸张平滑度测试方法压花机郴州滚针减速器出国劳务Trp
- 海洋装备研究院落户青岛中船重工投资百亿白山开水炉开关端子xDSL施胶剂Trp
- 金融危机后的巴斯夫为何青春依旧常在玩具模具松滋承插三通二手跑车软管接头Trp
- CHINAPLAS国际橡塑展续设橡胶机械电表壳密山封头气雾阀测量工具Trp
- 2月25日余姚塑料市场PPR最新报价鲍鱼果底漆刨床语音芯片连续端子Trp
- 上海市质监局表示糖果酒等存在商品过度包装阳春萘乙酸钠矿砂釉面砖牵引车Trp