繁体中文   加入收藏 
广汉智能科技欢迎您!
 
公司新闻 行业动态
 
联系我们
当前位置:网站首页 > 新闻中心
资讯:声信号的可视化特征提取方法
双击自动滚屏 发布者:admin 发布时间:2012-4-2 17:02:40 阅读:1888次 【字体:

将水下目标、交通工具、说话人等的分类识别问题统称为声目标识别。特征提取时声目标识别中最为关键的技术之一,特征参数种类和维数直接影响着声识别的准确性。目前应用较多的声学特征包括时域波形特征(过零率、峰尖幅值、波长差、波列面积等)、频域特征(线谱、功率谱、高阶谱、小波普等)和听觉特征(响度、音调、音色、尖锐度、粗早读等)许多研究表明,这些特征都能在一定程度上反映声目标信号的本质特征,具有较好的分类识别效果,尤其是通过特征选择与合等处理后,还能进一步改善识别性能。

上面提及的特征都是基于一维信号的分析处理方法得到的,考虑到图像的二维信号,可能包括更多潜在特征信息,而且图像特征提取与识别已有大量成功的应用,笔者提出一种新的声信号特征提取方法,即先实现声信号的可视化,再提取其图像特征,应用于声目标的分类识别。针对10类语言信号的3类交通噪声,先建立声谱图,然后采用具有生物视觉依据的脉冲偶和神经网络提取图像特征,最后通过分类识别实验检验这种方法的可行性。
声信号可视化方法:时域可视化、频域可视化、时频可视化。
同一说话人不同时刻发同一语音时,时域图和语普图均有差别,不同人发同一语音的语普图遇不相同。用PCNN处理时,对同一说话人不同时刻同一语音的语普图,每次迭代时,点火神经元的个数相似,而对不同人的同一语音,点火神经元个数图有差别较大。
对录制的语言信号进行识别实验,利用平均熵和一致度两种特征,识别率都保持在80%以上。
 
 
 

打印本页 || 关闭窗口

  条款条约隐私声明留言反馈人才招聘
Copyright 2021 All Right Reserved 版权所有:杭州广汉智能科技有限公司
电话:0571-81107068 传真:0571-81107069
地址:杭州市拱墅区丰潭路388号(新武林商业中心)
浙ICP备12012450号

浙公网安备 33010502003303号