安防通讯百科

您现在的位置是:首页 > IT通信百科 > 正文

IT通信百科

语音信息系统,人工智能语音系统是什么

root012023-04-19IT通信百科56

AI语音,即智能语音技术,以语音识别技术为开端,是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。

AI语音技术是最早落地的人工智能技术,也是市场上众多人工智能产品中应用最为广泛的。

语音识别:给机器装上耳朵,使其能够听懂人的语音指令。

智能语音识别系统:能够对语音识别到的信息进行进一步的处理,一般来说是将语音识别、NLP自然语言理解、知识库三方面与应用向结合。使用户通过自然的语言来控制相应设备。

智能电视:长虹ciri、联想K91、海信xt770、康佳9000、创维E700、750、800等

智能手机:小米1S、金立、步步高、康佳等

智能车载导航:上汽ivoka

语音识别控制系统是一个简单的语音识别和控制系统。

语音识别系统的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的。另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的第三方软件来实现,特别是近几年来迅速发展的语音信号处理专用芯片(ApplicationSpecificIntegratedCircuit,ASIC)和语音识别片上系统(SystemonChip,SOC)的出现。早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"“RadioRex”"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它就能够从底座上弹出来。

根据语音识别实际应用中的不同,语音识别系统可以分为:特定人与非特定人的语音识别、独立词与连续词的语音识别、小词汇量与大词汇量以及无限词汇量的语音识别。但无论哪种语音识别系统,其基本原理和处理方法大体相同。语音识别原理语音信号输入之后,预处理和数字化是进行语音识别的前提条件。其中,预处理主要是进行预滤波,保留正常人的300~3400Hz的语音信号;数字化是要进行A/D转换及抗混叠等处理;特征提取是进行语音信号训练和识别必不可少的步骤。能够体现语音信号特征的参数包括:(1)基于LPC的倒谱参数;(2)Mel系数的倒谱参数;(3)采用前沿数字信号处理技术的特征分析手段,如小波分析、时/频域分析、人工神经网络等。本文采用基于LPC的倒谱参数表示方法,提取出的特征值存入参考模式库中,用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分,由待识别人的语音经过特征提取后,与系统训练时产生的模板进行匹配,在说话人辨认中,取与待识别语音相似度最大的模型所对应的语音作为识别结果,这就是语音识别的整个过程。语音识别技术从应用类分为特定人语音识别和非特定人语音识别。特定人语音识别技术是针对指定人的语音识别,其他人的话玩具不识别,应用模式是使用前需要指定人的语音训练过程,一般按照玩具提示训练2遍语音词条,然后就可以使用了;非特定人语音识别是不用针对指定的人的识别技术,不分年龄,性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集200人左右的声音样本,经过我们的PC算法处理得到交互词条的语音模型和特征数据库,然后烧录到我们的芯片上,应用我们芯片的玩具就具有交互的功能了。非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本,就可以做交互识别,但是缺点是识别率不高,识别性能不稳定。在PC领域,Microsoft的Word软件就有语音识别技术

发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~