中文语音识别技术在c#中的应用(二)
2024-07-21 02:17:59
供稿:网友
接上篇《中文语音识别技术在c#中的应用(一)》………但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。spvoiceclass 类的voice 属性就是用来设置语种的,我们可以通过spvoiceclass 的getvoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:
private void setchinavoice()
{
voice.voice = voice.getvoices(string.empty,string.empty).item(0) ;
}
0表示是汉用,1234都表示英语,就是口音不同。
这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法。
private void speakchina(string strspeak)
{
setchinavoice() ;
speak(strspeak) ;
}
只发英语语音的方法也是类似的,上面程序里有。
对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用speakchina方法,英文调用speakenglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过analysespeak实现的。
这样,对于一段中英文混合文字,我们只需把它作为参数传递给analysespeak就可以了,他能够完成中英文的混合发音。
当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。
下面简单介绍一下中文语音识别的方法:
先把该语音识别的类源代码贴在下面,然后再做说明:
public class sprecognition
{
private static sprecognition _instance = null ;
private speechlib.ispeechrecogrammar isrg ;
private speechlib.spsharedrecocontextclass ssrcontex =null;
private system.windows.forms.control cdisplay ;
private sprecognition()
{
ssrcontex = new spsharedrecocontextclass() ;
isrg = ssrcontex.creategrammar(1) ;
speechlib._ispeechrecocontextevents_recognitioneventhandler rechandle =
new _ispeechrecocontextevents_recognitioneventhandler(contexrecognition) ;
ssrcontex.recognition += rechandle ;
}
public void beginrec(control tbresult)
{
isrg.dictationsetstate(speechrulestate.sgdsactive) ;
cdisplay = tbresult ;
}
public static sprecognition instance()
{
if (_instance == null)
_instance = new sprecognition() ;
return _instance ;
}
public void closerec()
{
isrg.dictationsetstate(speechrulestate.sgdsinactive) ;
}
private void contexrecognition(int iindex,object obj,speechlib.speechrecognitiontype type,speechlib.ispeechrecoresult result)
{
cdisplay.text += result.phraseinfo.gettext(0,-1,true) ;
}
}
我们定义了ssrcontex 和isrg为语音识别的上下文和语法,通过设置isrg的dictationsetstate方法,我们可以开始或结束识别,在上面的程序中是beginrec和closerec方法。cdisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个control 类来定义它。当然,每次语音识别后都会触发ispeechrecocontextevents_recognitioneventhandler 事件,我们定义了一个这样的方法contexrecognition来响应事件,并且在这个方法里输出识别结果。
这样,中文语音处理的一些最基本的问题就有了一个简单的解决方法,当然,这种方法还有很多不完善的地方,希望大家多提出批评意见,共同提高。