c # - Akustisk træning af Windows tale motor

Indlæg af Hanne Mølgaard Plasc

Problem



Jeg har arbejdet på at forbedre udførelsen af ​​min kode, der bruger Windows tale API specifikt til nogle uundværlige kommandoer, for eksempel åben fil, rul op, rul ned osv.


Selvom de fleste kommandoer synes at blive anerkendt godt, men koden udfører dårligt, når der er tegn med lignende udtale som B, D, G, P. Efter en grundig søgning fandt jeg ud af, at vi måske kunne < strong> Tilføj semantik til grammatikbyggeren som angivet nedenfor, dvs. vi kan give mange tvetydige tilfælde af B den samme semantiske værdi og tilsvarende for D, men det kan ikke være en god idé. En anden måde kan være akustisk træning ved at tænde træningstilstanden ved at bruge ISpRecognizer2::SetTrainingState, der skifter ind eller ud af træningstilstanden.


Choices digits = new Choices();  
GrammarBuilder digitValues = new GrammarBuilder();  
SemanticResultValue temp = new SemanticResultValue("B", B);    
digits.Add(temp);    
digitValues.Append(temp);    

temp = new SemanticResultValue("Bee", B);     
digits.Add(temp);     
digitValues.Append(temp);      

temp = new SemanticResultValue("Ba", B);     
digits.Add(temp);    
digitValues.Append(temp);


Foreslå en løsning, så tvetydigheden mellem lignende lydende ord kan løses. Også foreslå den komplette gennemførelse af træningen af ​​den akustiske model. Tak.

Bedste reference