您现在的位置是：首页 > IT通信百科 > 正文

IT通信百科

语音信息系统,人工智能语音系统是什么

root012023-04-19IT通信百科146

AI语音，即智能语音技术，以语音识别技术为开端，是实现人机语言的通信，包括语音识别技术（ASR）和语音合成技术（TTS）。

AI语音技术是最早落地的人工智能技术，也是市场上众多人工智能产品中应用最为广泛的。

语音识别：给机器装上耳朵，使其能够听懂人的语音指令。

智能语音识别系统：能够对语音识别到的信息进行进一步的处理，一般来说是将语音识别、NLP自然语言理解、知识库三方面与应用向结合。使用户通过自然的语言来控制相应设备。

智能电视：长虹ciri、联想K91、海信xt770、康佳9000、创维E700、750、800等

智能手机：小米1S、金立、步步高、康佳等

智能车载导航：上汽ivoka

语音识别控制系统是一个简单的语音识别和控制系统。

语音识别系统的应用可以分为两个发展方向：一个方向是大词汇量连续语音识别系统，主要应用于计算机的听写机，以及与电话网或者互联网相结合的语音信息查询服务系统，这些系统都是在计算机平台上实现的。另外一个重要的发展方向是小型化、便携式语音产品的应用，如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用，这些应用系统大都使用专门的第三方软件来实现，特别是近几年来迅速发展的语音信号处理专用芯片（ApplicationSpecificIntegratedCircuit，ASIC）和语音识别片上系统（SystemonChip，SOC）的出现。早在计算机发明之前，自动语音识别的设想就已经被提上了议事日程，早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"“RadioRex”"玩具狗可能是最早的语音识别器，当这只狗的名字被呼唤的时候，它就能够从底座上弹出来。

根据语音识别实际应用中的不同，语音识别系统可以分为：特定人与非特定人的语音识别、独立词与连续词的语音识别、小词汇量与大词汇量以及无限词汇量的语音识别。但无论哪种语音识别系统，其基本原理和处理方法大体相同。语音识别原理语音信号输入之后，预处理和数字化是进行语音识别的前提条件。其中，预处理主要是进行预滤波，保留正常人的300～3400Hz的语音信号；数字化是要进行A/D转换及抗混叠等处理；特征提取是进行语音信号训练和识别必不可少的步骤。能够体现语音信号特征的参数包括：(1)基于LPC的倒谱参数；(2)Mel系数的倒谱参数；(3)采用前沿数字信号处理技术的特征分析手段，如小波分析、时/频域分析、人工神经网络等。本文采用基于LPC的倒谱参数表示方法，提取出的特征值存入参考模式库中，用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分，由待识别人的语音经过特征提取后，与系统训练时产生的模板进行匹配，在说话人辨认中，取与待识别语音相似度最大的模型所对应的语音作为识别结果，这就是语音识别的整个过程。语音识别技术从应用类分为特定人语音识别和非特定人语音识别。特定人语音识别技术是针对指定人的语音识别，其他人的话玩具不识别，应用模式是使用前需要指定人的语音训练过程，一般按照玩具提示训练2遍语音词条，然后就可以使用了；非特定人语音识别是不用针对指定的人的识别技术，不分年龄，性别，只要说相同语言就可以，应用模式是在产品定型前按照确定的十几个语音交互词条，采集200人左右的声音样本，经过我们的PC算法处理得到交互词条的语音模型和特征数据库，然后烧录到我们的芯片上，应用我们芯片的玩具就具有交互的功能了。非特定人语音识别应用有的是基于音素的算法，这种模式下不需要采集很多人的声音样本，就可以做交互识别，但是缺点是识别率不高，识别性能不稳定。在PC领域，Microsoft的Word软件就有语音识别技术

发表评论

评论列表

这篇文章还没有收到评论，赶紧来抢沙发吧~

IT通信百科

语音信息系统,人工智能语音系统是什么

计算机网络通信,什么是计算机通信网络

诺基亚 5310,经典机“诺基亚5310”复刻版开售

相关文章

发表评论

评论列表