语音玩具方案开发
小孩子的玩具多种多样,主要有两种不同的类型,一种是不带电子功能的,例如积木类玩具、毛绒类玩具;另一种是带电子功能的玩具。
带电子功能的玩具虽然有很多种形式,但万变不离其宗,其主要功能其实就三种要素:发声、发光、能动。当然这三种要素并不是完全独立的,有的小玩具只有其中某个功能要素;有的玩具更有趣一些,往往结合了以上三种要素于一体,只是其功能的侧重点不同而已。
因此,儿童玩具主要可以分为两大类:第一类是语音发声玩具;第二类是电动遥控玩具。我们先给大家介绍一下我们深圳市组创微电子有限公司开发的语音玩具方案。
一、语音玩具方案原理
语音玩具就是以趣味声音为主要特色的玩具,拥有丰富多彩的声音互动效果,例如趣味音效、音乐曲子、儿歌故事等。往往还会伴随着五彩缤纷的灯光闪烁效果及触摸、震动、弹簧等其它辅助效果。
语音玩具之所以能够播放声音,是因为里面的电路板里面有语音IC,它可以存储、控制、播放声音内容。
语音芯片的工作原理是将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。根据语音芯片的输出方式分为两大类,一种是PWM输出方式,一种是DAC输出方式,PWM输出音量不可连续可调,不能接普通功放,目前市面上大多数语音芯片是PWM输出方式。另外一种是DAC经内部EQ放大,该语音芯片声音连续可调,可数字控制调节,可外接功放。
二、语音玩具方案的种类
1.单通道语音玩具
单通道的语音玩具就是同一时间只能发出一种声音的玩具,声音可以是音效类、人声类、乐器类,其中音效与人声类的玩具存储的声音格式通常是wav格式,而乐器类玩具的声音文件是只有一个通道的Mid格式。这类代表玩具有:公仔娃娃、打地鼠玩具、故事机。
2.双通道语音玩具
双通道及更多通道的语音芯片,同一单位时间内二个通道都可以发出音乐的音乐IC.电子声音源文件一般为.Mid的二通道文件。这类产品比单通道的语音IC成本要高,语音芯片厂家在设计时为了平衡产品价格和应用,一般来说,功能支持和声音效果方面都会做得更完美一些。
3.多通道乐器玩具
多通道一般是指4通道及以上的玩具,它能够播放三通道以上的声音又称为和弦音乐,常说的4和弦音乐玩具就是指4通道的乐器玩具。一般多通道的语音芯片都是同时支持音乐IC(Music IC)和语音IC(Speech IC)功能的。这类乐器玩具的例子有:电子琴玩具、玩具吉他、八音盒等。
三、语音玩具方案开发流程
语音玩具的功能相对比较简单,通常一个工作日内就能开发完成,大概的步骤是:
(1)客户先提供功能说明书或者参考样机,然后我司根据功能与声音长短来选择合适的语音IC。
(2)客户指定音源(即声音文件),我司也拥有一批声音库可以给客户免费使用,也能帮助客户处理声音文件素材,将其优化成合适的音质与容量大小。
(3)电路设计与程序设计。
(4)功能DEMO制作测试,并送样给客户测试提意见。
(5)测试完毕后进入试产阶段(EP/PP/MP)。
四、语音玩具的声音文件格式
语音玩具所播放的声音是预先制作过的,并存储于语音IC或者Flash芯片里面,因此需要知道音源常见的文件格式,根据产品的需求与所选的语音芯片来确定最佳的音源文件类型。常见支持的声音文件格式有:PCM格式、WAV格式、ADPCM格式、MP3格式、Linear Scale格式、Logpcm格式。
(1)PCM格式:Pulse Code Modulation脉冲编码调制,它将声音模拟信号采样后得到量化后的语音数据,是最基本最原始的一种语音格式。同它极为类似的还有RAW格式和SND格式。它们都是纯语音格式。
(2)WAV格式:Wave Audio Files是微软公司开发的一种声音文件格式,也叫波形声音文件,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,但WAV格式对存储空间需求太大不便于交流和传播。WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据,这些数据包括采样频率和位数,单声道(mono)还是立体声(stero)等。
(3)ADPCM格式:是利用对过去的几个抽样值来预测当前输入的样值,并使其具有自适应的预测功能与实际检测值进行比较,随时对测得的差值自动进行量化级差的处理,使之始终保持与信号同步变化。它适用于语音变化率适中的情况,而且声音回放过程简短。它的优点是对于人声的处理比较逼真,一般达到90%以上,已广泛地应用于电话通信领域。
(4)MP3格式:Moving Picture Experts Group Audio Layer III,简称为MP3。它是利用MPEG Audio Layer 3的技术,采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的mp3文件,并使压缩后的文件在回放时能够达到较接近原音源的声音效果。它的实质是vbr(Variant Bitrate可变波特率)可以根据编码的内容动态地选择合适的波特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小。
(5)Linear Scale格式:根据声音的变化率大小,把声音分成若干段,对每段用线性比例进行压缩,但是它的比例是可变的。
(6)Logpcm格式:基本上对整个声音进行线性压缩,将最后若干位去掉。这种压缩方式在硬件上很容易实现,但音质比Linear Scale差一些,特别是音量较小声音比较细腻的情况下效果较差。主要用于pure speech方面。mid格式。mid格式的语音所占的空间比较狭小,有时短短20几秒的芯片就能装进去十多首mid格式的音乐。
以上就是我们为大家介绍的语音玩具方案相关知识,如果大家有儿童玩具类产品的电子功能开发需求,可以找我们评估芯片类型,并进行硬件与程序开发,提供IC或者PCBA皆可。
- 返回顶部