与文本无关的闭集声纹识别系统研究
现今,生物认证技术逐渐深入人们的社会和日常生活中,以其独有的方便性和经济性成为一种安全验证方式。声纹是人体特有的一种生物特征,如同指纹、人脸一样。
声纹识别(即说话人识别)就是利用声纹特征进行身份识别认证的一种技术,其识别技术相对其他生物认证技术来说方便、直接。声纹识别与语音识别不同,他只注重语音信号中的说话人的语音特征,而不需要知道语音中的字词含义。
由于每个人的声纹特征不同于其他人(即具有唯一性),很难被冒充或伪造,因此,将声纹识别技术应用到身份认证中不仅安全、可靠,而且非常准确。声纹识别技术按识别任务分为话者辨认和话者确认,按识别内容分为文本相关与文本无关。
本文主要研究的是文本无关的闭集说话人辨认系统,力图在前人研究的基础上提出新观点,以提高识别率。本文首先总体分析研究了说话人识别的课题背景、发展前景和结构原理等,其次详细研究了端点检测、特征提取和高斯混合模型。
端点检测模块主要提出了变步长搜索算法的端点检测和基于倒谱距离与短时过零率的双门限端点检测算法。特征提取模块在分析研究LPCC和MFCC特征的基础上,进行了二次特征提取,并提出了新的特征 ...


雷达卡


京公网安备 11010802022788号







