


C# développe des portails et des applications WeChat en utilisant le traitement vocal
Mar 02, 2017 am 10:04 AMNous savons que WeChat a été con?u à l'origine pour le chat vocal, ce qui l'a rendu plus populaire. Par conséquent, le traitement de la reconnaissance vocale est naturellement devenu un moyen important pour la communication WeChat permettant également le traitement des demandes de messages vocaux. Cet article présente principalement comment utiliser la reconnaissance vocale pour traiter l'ensemble de la cha?ne d'événements de l'application de portail WeChat développée en C#, rendant ainsi plus pratique et diversifié le traitement des entrées des utilisateurs dans notre compte WeChat.
1. Définition de l'interface vocale WeChat 0
L'API de WeChat définit la reconnaissance vocale comme ceci?: Lorsque la fonction de reconnaissance vocale est activée, chaque fois que l'utilisateur envoie une voix au compte officiel , WeChat ajoutera un champ de reconnaissance dans le paquet XML du message vocal poussé.
Le format du message vocal est le suivant.
<xml> <ToUserName><![CDATA[toUser]]></ToUserName> <FromUserName><![CDATA[fromUser]]></FromUserName> <CreateTime>1357290913</CreateTime> <MsgType><![CDATA[voice]]></MsgType> <MediaId><![CDATA[media_id]]></MediaId> <Format><![CDATA[Format]]></Format> <MsgId>1234567890123456</MsgId> </xml>
Paramètres< /th> | Description | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ToUserName |
| ||||||||||||||||
Compte expéditeur (un OpenID) | |||||||||||||||||
CreateTime | Heure de création du message (entier) | tr>||||||||||||||||
MsgType | La voix est une voix | ||||||||||||||||
MediaId | Identifiant du média du message vocal, oui Appeler le multimédia interface de téléchargement de fichiers pour extraire des données. | ||||||||||||||||
Format | Format vocal, tel que amr, speex, etc. | ||||||||||||||||
MsgID td>< td>Identifiant du message, entier 64 bits |
根據(jù)以上微信接口的定義,我們可以定義一個實體類來對消息的傳遞進行處理,如下所示。
/// <summary> /// 接收的語音消息 /// </summary> [System.Xml.Serialization.XmlRoot(ElementName = "xml")] public class RequestVoice : BaseMessage { public RequestVoice() { this.MsgType = RequestMsgType.Voice.ToString().ToLower(); } /// <summary> /// 語音格式,如amr,speex等 /// </summary> public string Format { get; set; } /// <summary> /// 語音消息媒體id,可以調(diào)用多媒體文件下載接口拉取數(shù)據(jù)。 /// </summary> public string MediaId { get; set; } /// <summary> /// 消息ID /// </summary> public Int64 MsgId { get; set; } /// <summary> /// 語音識別結(jié)果,UTF8編碼 /// </summary> public string Recognition { get; set; } }
我們看到,這里我們最感興趣的是語音的識別結(jié)果,也就是Recognition的字段,這個就是微信服務(wù)器自動根據(jù)用戶的語音轉(zhuǎn)換過來的內(nèi)容,我測試過,識別率還是非常高的。
這個實體類,在整個微信應(yīng)用的消息傳遞中的關(guān)系如下所示:
2、語音的處理操作
明確了上面的語音對象實體,我們就可以看看它們之間是如何處理的。
微信消息的處理邏輯如下圖所示。
其中我們來看看語音的處理操作,我的代碼處理邏輯如下所示。
/// <summary> /// 對語音請求信息進行處理 /// </summary> /// <param name="info">語音請求信息實體</param> /// <returns></returns> public string HandleVoice(Entity.RequestVoice info) { string xml = ""; // 開通語音識別功能,用戶每次發(fā)送語音給公眾號時, // 微信會在推送的語音消息XML數(shù)據(jù)包中,增加一個Recongnition字段。 if (!string.IsNullOrEmpty(info.Recognition)) { TextDispatch dispatch = new TextDispatch(); xml = dispatch.HandleVoiceText(info, info.Recognition); } else { xml = ""; } return xml; }
在這里,我先看看,是否獲得了微信的語音識別結(jié)果,如果獲得,那么這個時候,就是和處理用戶文本輸入的操作差不多了,因此把它轉(zhuǎn)給TextDispatch的處理類進行處理。
其中這里面的處理邏輯如下所示。
首先我根據(jù)識別結(jié)果,尋找是否用戶讀出了微信門戶的菜單名稱,如果根據(jù)語音結(jié)果找到對應(yīng)的菜單記錄,那么我們執(zhí)行菜單事件(如果是URL的View類型菜單,我們沒辦法重定向到指定的鏈接,因此給出一個鏈接文本提示,給用戶單擊進入;如果沒有找到菜單記錄,那么我們就把語音識別結(jié)果作為一般的事件進行處理,如果事件邏輯沒有處理,那么我們最后給出一個默認的語音應(yīng)答提示結(jié)果就可以了。
具體的處理代碼如下所示。
/// <summary> /// 如果用戶用語音讀出菜單的內(nèi)容,那么我們應(yīng)該先根據(jù)菜單對應(yīng)的事件觸發(fā),最后再交給普通事件處理 /// </summary> /// <param name="info"></param> /// <returns></returns> public string HandleVoiceText(BaseMessage info, string voiceText) { string xml = ""; MenuInfo menuInfo = BLLFactory<Menu>.Instance.FindByName(voiceText); if (menuInfo != null) { #region 如果找到菜單對象的處理 if (menuInfo.Type == "click") { //模擬單擊事件 RequestEventClick eventInfo = new RequestEventClick(); eventInfo.CreateTime = info.CreateTime; eventInfo.EventKey = menuInfo.Key; eventInfo.FromUserName = info.FromUserName; eventInfo.ToUserName = info.ToUserName; xml = base.DealEvent(eventInfo, eventInfo.EventKey); } else { //由于無法自動切換到連接, //轉(zhuǎn)換為連接文本供用戶進入 string content = string.Format("請單擊鏈接進入<a href=\"{0}\">{1}</a> ", menuInfo.Url, menuInfo.Name); ResponseText textInfo = new ResponseText(info); textInfo.Content = content; xml = textInfo.ToXml(); } #endregion } else { //交給事件機制處理 if (string.IsNullOrEmpty(xml)) { xml = HandleText(info, voiceText); } } //最后如果沒有處理到,那么提示用戶的語音內(nèi)容 if (string.IsNullOrEmpty(xml)) { ResponseText textInfo = new ResponseText(info); textInfo.Content = string.Format("非常抱歉,您輸入的語音內(nèi)容沒有找到對應(yīng)的處理方式。您的語音內(nèi)容為:{0}", voiceText); xml = textInfo.ToXml(); } return xml; }
微信門戶測試界面效果如下所示。
? ? ? ? ? ? ? ? ?
? ?
?
為了方便對客戶會話的記錄,我的微信門戶后臺,會記錄用戶的語音輸入內(nèi)容,如下所示。
?當然,微信后臺的管理界面,也能夠查到相應(yīng)的語音記錄,界面如下所示。
以上就是我對微信語音的消息定義和事件處理的邏輯,其實語音是一個重要的輸入,如果正確的識別內(nèi)容,比手工輸入的效果更好,給用戶提供另外一種高效的輸入和事件處理操作。
這樣的處理模式,能夠使得我們整個微信門戶框架,不管是對于用戶的語音輸入,還是文本輸入,還是菜單事件的處理,都可以融為一體,實現(xiàn)更加完美的銜接。
更多C# développe des portails et des applications WeChat en utilisant le traitement vocal相關(guān)文章請關(guān)注PHP中文網(wǎng)!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)