一.语音芯片的种类
1. 可录放型:即可随录随放型
ISD系列:从10s到16分钟的一系列芯片,以FLASHRAM闪烁存储器为IC为介质,断电后语音还能保存。特点:内部没有单片机,控制较麻烦;容易丢失数据;芯片和编程器价格都较高。
APR系列:APR9301为单段30秒录放语音芯片,APR9600为40s到60s多段语音长度可调录放芯片,可分段录放,断电后语音能保存。特点:控制不方便;容易丢失数据;芯片价格较高。
PM50系列:采用单片机+语音处理器+FLASHRAM结构,有20s到400s,能反复擦写。特点:控制较方便;芯片价格较高。
WT系列:WTSRB006A是一种简单的SRAM 录放芯片.录音时间可以通过调节振荡电阻的频率在4-8S范围内改变,只能储存一段语音,需要很小电流保存语音。特点:录放电路简单;语音存储时间较短;价格较廉。
2. 一次性(OTP)
APLUS系列:芯片内部是PROM存储器,将语音文件烧录进去,以后不可以更改。有API8108(10s可分8段),API8208(20s可分8段),API840N(40s可分32段),AP8821(21s最大15段),AP8842(42s最大30段)其中AP8821和AP8842可以选择单片机并口控制和按键控制。此系列特点:控制较灵活,价格较低。
WT系列:WT系列有从40s到340s一次性编程语音芯片,可选择单片机串口控制和按键控制,分组可达128组,触发方式比较灵活,有播放和弦音乐等功能。特点:控制较灵活,功能强大,价格较低。
3. 掩膜型(MASK)
标准片(标准声源型):如各种报警声,倒车语音等大批量生产出来的标准品,价格非常便宜,此类特点是不能根据自己的情况更改,包括音质,音调,控制方式等。
定制声源型:用户根据自己的要求而专门制作生产,需要经过设计开发,制作样片,确认样品,几万片起做的芯片投单,确认芯片,交货等几个过程,数量越大摊在芯片上价格越低。特点是不能小批量快速生产,首期投入较大。
二.如何在生产设计中选择语音IC
首先要明确产品的定单的情况如何
(1) 2万以上的生产定单,可直接选用掩膜芯片。
(2) 5000件/批的定单,可以选用OTP,PM50等芯片,语音内容可以调整。
(3) 1000件/批的定单,可以选用OTP,ISD,PM50芯片。
第二是看产品设计中有没有单片机,如果有的话以上芯片都可以选,如果没有的话,选用OTP和PM50控制较方便。
第三是看产品的实际性能需要,可以从以下几个方面考虑
(1) 是否需要自己录音或修改内容, 擦写寿命。
(2)静态电流,音质,工作电压范围.
(3) 语音时间(容量)需要多长,采样频率
(4) 需要分多少段
(5) 单片机预留的口线多少(控制口)
(6)DAC输出(外接放大电路)或PWM输出(直接推喇叭)。
(7)外围元件,稳定性,批量生产交期,开发费用,数量限制。
从时间长度上考虑:
一般情况下,语音芯片(默认OTP:一次性的)的时间长度在10秒-----340秒。基本上集中在短秒数的。它声音清晰,时间短,价钱低,制作容易,订货数量不限,所以是产品试验阶段首选方案。市面上20秒的芯片价格大概在3--4元左右;40秒大概在5-6元;170秒大概在10--12元。一般情况下,是由厂家制作样品,用户服务订货时,由厂家将内容烧写好,然后交给用户。这样用户就可以省掉一些功夫。如果用户的声音需要经常修改,则可以自己购买一套编程器(也叫烧写器,下载器),自己学会是如何制作的,则可以由自己来制作。语音芯片的用途集中在玩具、一般的声音提示、礼品等场合。
语音模块,它的结构大概是:MCU+外挂存储器,所以它的存储容量会比芯片大得多,从10分钟到30分钟都有,但是,价钱一般从20元--80元不等起,是芯片的好几倍。体积也比芯片大,功耗也大。
从功能上考虑:
语音芯片是一次性的,它订货数量不限,出货速度快,但也有缺点:不可以重复多次烧写。我公司出了一些是可以重复擦写的模块,比如:WTV-S模块,WTV-S1模块,WTV-NOR模块,WTM-NOR模块,WTM-NAN模块,WTM-SD模块等等,一些是可以通过专用的烧写器来更换内容,一些是可以直接通过USB口来更换语音内容,甚至还可以在现场下载内容,进行语音的更新,这些强大的功能,极大的丰富了语音模块的内涵,增加了它的应用领域,开拓了新的天地。
应用
录音/放音
语音芯片从使用功能上,基本可以划分为录音语音芯片和放音语音芯片。设计一个使用语音芯片的产品,首先要考虑是否使用录制现场语音,如需要录制语音则选用带有录音功能的语音芯片,否则就选用只有放音功能的语音芯片。通常带有录音功能的语音芯片都具有回放语音的功能,但是在播放语音时,音质都没有专门的放音语音芯片好,所以在选择语音芯片时要权衡功能及音质方面等因素。
安防系统、会议记录系统、录音玩具等产品都要求具备录音功能,这类型产品的开发都会用到录音语音芯片,市场上有录音功能的芯片主要有ISD1110、ISD1400、ISD1700、ISD1800、ISD2500、ISD3300、ISD4000、WTR010、WTV040、APR6000等。利用录音芯片开发的录音模块,拥有更为简洁的外围电路和更佳的效果。如WTR-S4、WTV-NAND录音模块,这些模块利用外部的FLASHROM作为存储中心,因而能够录制更长时间的语音。
仅用到放音功能的设备很多,像治疗仪、倒车雷达、报站器、报警器等。这类型的产品不需要录制现场的语音,将已经处理过的语音利用工具下载到语音芯片播放就可以。放音芯片根据存储方式可分为OTPROM、FLASHROM、EEPROM及MASK四种。
OTPROM、FLASHROM和EEPROM的选择
OTP(OneTimeProgramable)是指一次性可编程语音芯片,语音只能烧写一次,适合应用在不需要修改语音、语音长度短的场合,从放音的长度上可以分为10秒、20秒、40秒、80秒、170秒、340秒。OTP语音芯片的特点是单芯片方案、价格便宜,适合中小型批量生产,即便是小数量生产也可以及时拿货。主要应用在中低端玩具、电子琴、电动车等产品上。
FLASHROM和EEPROM的共性是可重复擦写、存储空间大,可随意更换控制方式和语音内容,能存储更大的语音文件。EEPROM通常都会集成在芯片中,此类型语音芯片价格比较昂贵,如ISD1700、ISD2500等。一般可以外挂的FLASHROM有1Mbit~32Mbit,因需要用“语音芯片+FLASH”才能工作,价格比OTP的稍高,但整体售价比EEPROM的低,适合制样或者中小型批量投产。使用FLASHROM的语音芯片有WT588D、WTV040(需烧写特殊程序)等。
为什么要用MASK掩膜投产
MASK投产使得整个语音芯片方案在保持性能、功能不变的情况下成本降低将近一半,且多数语音芯片在MASK投产不需要更改外围电路。但MASK投产需要订单数量超过2~7万,否则厂家会收取高额的光罩费,MASK生产时间大概要用1个月左右。目前MASK掩膜投产的芯片有WTB及WT588D(≤4MbitFLASHROM),其语音时间在5秒~340秒,是大批量投产的最佳选择。
可以存储更多语音的SD卡方案
SD卡已经成为当前市场上一大主流存储载体,其价格便宜,存储空间大,可移植性强等优点得到大部分厂家青睐。语音芯片也同样向外置SD卡的方向发展,厂家根据主控芯片的特性设计出可以播放各种音频格式的SD卡播放器,如WAV、MP3、WMA、AD4等主流音频格式。WTM-SD模块、USBSD模块在外挂SD卡的时候可以播放WAV、MP3音频格式,WTV020-SD模块可以播放AD4、WAV音频格式等。这类型模块的播放时间均能达到数十小时。
从语音音质、语音长度方面选择
语音存放的长度由音频采样率及芯片内部(或外挂)ROM空间所决定,音频采样率的大小直接影响音频输出的音质,同一型号芯片的音频采样率越高,音质越好,但是需要占用更多的ROM空间。芯片的成本也因存储空间的增大而有不同幅度的上涨。如果对音质要求较高、语音时间在5分钟内,可以考虑选用ISD语音芯片、WTV语音芯片、WT588D语音芯片、ISD语音芯片;要求音质高、语音时间长可以选用WTV020-SD模块、WTM-SD模块、USBSD模块;对音质要求不高、语音时间在340秒以内可选用WTB语音芯片。从录音长度方面考虑,要求录音长度在340秒以内,可选用ISD1700、ISD2500语音芯片;要求录音长度在30分钟内,可选用WTR-S4录音模块;录音长度达到数小时,则要用WTV-NAND录音模块。
是否选用MCU控制
部分语音芯片是只支持串口通讯协议的,因此必须由MCU进行控制,而不能利用脉冲或者电平来控制,此部分芯片中包括ISD3300、ISD4000等,在选择此类芯片的时候要考虑到控制端是否具备MCU。大部分芯片都是可以用MCU或者按键来控制的,如WTV、WTB、WT588D、ISD1700、ISD2500等