楼主: nandehutu2022
232 0

[计算机科学] 非特定人元音的概率SVM/GMM分类器 连续语音识别 [推广有奖]

  • 0关注
  • 5粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
69.3721
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24246 点
帖子
4004
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

楼主
nandehutu2022 在职认证  发表于 2022-3-5 10:53:00 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要翻译:
本文讨论了波斯语元音自动识别中存在的问题。本文主要研究一种新的统计识别元音的方法,元音是音节的基本单位。首先,我们描述了一个元音检测系统,然后简要讨论了如何将检测到的元音送入识别单元。在模式识别方面,支持向量机(SVM)作为判别分类器和高斯混合模型(GMM)作为生成模型分类器是目前最流行的两种分类器。目前的系统试图将它们结合在一起,以获得更大的分类能力,提高识别系统的性能。研究的主要思想是将概率支持向量机和传统的GMM模式分类结合语音的带通能量等特征,以获得更好的分类率。这一思想已经在一个基于FarsDat的元音识别系统上进行了分析和测试。结果显示,识别准确率有了难以想象的提高。对提出的各种元音识别算法进行了测试,并对测试结果进行了比较。
---
英文标题:
《Probabilistic SVM/GMM Classifier for Speaker-Independent Vowel
  Recognition in Continues Speech》
---
作者:
Mohammad Nazari, Abolghasem Sayadiyan, SeyedMajid Valiollahzadeh
---
最新提交年份:
2008
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Multimedia        多媒体
分类描述:Roughly includes material in ACM Subject Class H.5.1.
大致包括ACM学科类H.5.1中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Artificial Intelligence        人工智能
分类描述:Covers all areas of AI except Vision, Robotics, Machine Learning, Multiagent Systems, and Computation and Language (Natural Language Processing), which have separate subject areas. In particular, includes Expert Systems, Theorem Proving (although this may overlap with Logic in Computer Science), Knowledge Representation, Planning, and Uncertainty in AI. Roughly includes material in ACM Subject Classes I.2.0, I.2.1, I.2.3, I.2.4, I.2.8, and I.2.11.
涵盖了人工智能的所有领域,除了视觉、机器人、机器学习、多智能体系统以及计算和语言(自然语言处理),这些领域有独立的学科领域。特别地,包括专家系统,定理证明(尽管这可能与计算机科学中的逻辑重叠),知识表示,规划,和人工智能中的不确定性。大致包括ACM学科类I.2.0、I.2.1、I.2.3、I.2.4、I.2.8和I.2.11中的材料。
--

---
英文摘要:
  In this paper, we discuss the issues in automatic recognition of vowels in Persian language. The present work focuses on new statistical method of recognition of vowels as a basic unit of syllables. First we describe a vowel detection system then briefly discuss how the detected vowels can feed to recognition unit. According to pattern recognition, Support Vector Machines (SVM) as a discriminative classifier and Gaussian mixture model (GMM) as a generative model classifier are two most popular techniques. Current state-ofthe- art systems try to combine them together for achieving more power of classification and improving the performance of the recognition systems. The main idea of the study is to combine probabilistic SVM and traditional GMM pattern classification with some characteristic of speech like band-pass energy to achieve better classification rate. This idea has been analytically formulated and tested on a FarsDat based vowel recognition system. The results show inconceivable increases in recognition accuracy. The tests have been carried out by various proposed vowel recognition algorithms and the results have been compared.
---
PDF链接:
https://arxiv.org/pdf/0812.2411
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:语音识别 分类器 SVM GMM Presentation unit 模型 been 语音 discuss

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 07:44