


C# entwickelt WeChat-Portale und -Anwendungen mithilfe der Sprachverarbeitung
Mar 02, 2017 am 10:04 AMWir wissen, dass WeChat ursprünglich für Voice-Chat entwickelt wurde, was es natürlich zu einem wichtigen Weg für die WeChat-Kommunikation gemacht hat, der auch die Verarbeitung von Sprachnachrichtenanfragen erm?glicht. In diesem Artikel wird haupts?chlich die Verwendung der Spracherkennung zur Verarbeitung der gesamten Ereigniskette der in C# entwickelten WeChat-Portalanwendung vorgestellt, wodurch die Verarbeitung von Benutzereingaben in unserem WeChat-Konto bequemer und abwechslungsreicher wird.
1. Definition der WeChat-Sprachschnittstelle 0
Die WeChat-API definiert die Spracherkennung folgenderma?en: Wenn die Spracherkennungsfunktion aktiviert ist, sendet der Benutzer jedes Mal eine Stimme an den Beamten Konto, WeChat fügt im XML-Paket der gepushten Sprachnachricht ein Erkennungsfeld hinzu.
Das Sprachnachrichtenformat ist wie folgt.
<xml> <ToUserName><![CDATA[toUser]]></ToUserName> <FromUserName><![CDATA[fromUser]]></FromUserName> <CreateTime>1357290913</CreateTime> <MsgType><![CDATA[voice]]></MsgType> <MediaId><![CDATA[media_id]]></MediaId> <Format><![CDATA[Format]]></Format> <MsgId>1234567890123456</MsgId> </xml>
Parameter< /th> | Beschreibung | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
AnBenutzername |
| ||||||||||||||||
Absenderkonto (eine OpenID) | |||||||||||||||||
CreateTime | Nachrichtenerstellungszeit (Ganzzahl) | tr>||||||||||||||||
MsgType | Stimme ist Stimme | ||||||||||||||||
MediaId | Sprachnachrichten-Medien-ID, ja Rufen Sie das Multimedia auf Datei-Download-Schnittstelle zum Abrufen von Daten. | ||||||||||||||||
Format | Sprachformat wie AMR, Speex usw. | ||||||||||||||||
MsgID td>< td>Nachrichten-ID, 64-Bit-Ganzzahl |
根據(jù)以上微信接口的定義,我們可以定義一個實(shí)體類來對消息的傳遞進(jìn)行處理,如下所示。
/// <summary> /// 接收的語音消息 /// </summary> [System.Xml.Serialization.XmlRoot(ElementName = "xml")] public class RequestVoice : BaseMessage { public RequestVoice() { this.MsgType = RequestMsgType.Voice.ToString().ToLower(); } /// <summary> /// 語音格式,如amr,speex等 /// </summary> public string Format { get; set; } /// <summary> /// 語音消息媒體id,可以調(diào)用多媒體文件下載接口拉取數(shù)據(jù)。 /// </summary> public string MediaId { get; set; } /// <summary> /// 消息ID /// </summary> public Int64 MsgId { get; set; } /// <summary> /// 語音識別結(jié)果,UTF8編碼 /// </summary> public string Recognition { get; set; } }
我們看到,這里我們最感興趣的是語音的識別結(jié)果,也就是Recognition的字段,這個就是微信服務(wù)器自動根據(jù)用戶的語音轉(zhuǎn)換過來的內(nèi)容,我測試過,識別率還是非常高的。
這個實(shí)體類,在整個微信應(yīng)用的消息傳遞中的關(guān)系如下所示:
2、語音的處理操作
明確了上面的語音對象實(shí)體,我們就可以看看它們之間是如何處理的。
微信消息的處理邏輯如下圖所示。
其中我們來看看語音的處理操作,我的代碼處理邏輯如下所示。
/// <summary> /// 對語音請求信息進(jìn)行處理 /// </summary> /// <param name="info">語音請求信息實(shí)體</param> /// <returns></returns> public string HandleVoice(Entity.RequestVoice info) { string xml = ""; // 開通語音識別功能,用戶每次發(fā)送語音給公眾號時(shí), // 微信會在推送的語音消息XML數(shù)據(jù)包中,增加一個Recongnition字段。 if (!string.IsNullOrEmpty(info.Recognition)) { TextDispatch dispatch = new TextDispatch(); xml = dispatch.HandleVoiceText(info, info.Recognition); } else { xml = ""; } return xml; }
在這里,我先看看,是否獲得了微信的語音識別結(jié)果,如果獲得,那么這個時(shí)候,就是和處理用戶文本輸入的操作差不多了,因此把它轉(zhuǎn)給TextDispatch的處理類進(jìn)行處理。
其中這里面的處理邏輯如下所示。
首先我根據(jù)識別結(jié)果,尋找是否用戶讀出了微信門戶的菜單名稱,如果根據(jù)語音結(jié)果找到對應(yīng)的菜單記錄,那么我們執(zhí)行菜單事件(如果是URL的View類型菜單,我們沒辦法重定向到指定的鏈接,因此給出一個鏈接文本提示,給用戶單擊進(jìn)入;如果沒有找到菜單記錄,那么我們就把語音識別結(jié)果作為一般的事件進(jìn)行處理,如果事件邏輯沒有處理,那么我們最后給出一個默認(rèn)的語音應(yīng)答提示結(jié)果就可以了。
具體的處理代碼如下所示。
/// <summary> /// 如果用戶用語音讀出菜單的內(nèi)容,那么我們應(yīng)該先根據(jù)菜單對應(yīng)的事件觸發(fā),最后再交給普通事件處理 /// </summary> /// <param name="info"></param> /// <returns></returns> public string HandleVoiceText(BaseMessage info, string voiceText) { string xml = ""; MenuInfo menuInfo = BLLFactory<Menu>.Instance.FindByName(voiceText); if (menuInfo != null) { #region 如果找到菜單對象的處理 if (menuInfo.Type == "click") { //模擬單擊事件 RequestEventClick eventInfo = new RequestEventClick(); eventInfo.CreateTime = info.CreateTime; eventInfo.EventKey = menuInfo.Key; eventInfo.FromUserName = info.FromUserName; eventInfo.ToUserName = info.ToUserName; xml = base.DealEvent(eventInfo, eventInfo.EventKey); } else { //由于無法自動切換到連接, //轉(zhuǎn)換為連接文本供用戶進(jìn)入 string content = string.Format("請單擊鏈接進(jìn)入<a href=\"{0}\">{1}</a> ", menuInfo.Url, menuInfo.Name); ResponseText textInfo = new ResponseText(info); textInfo.Content = content; xml = textInfo.ToXml(); } #endregion } else { //交給事件機(jī)制處理 if (string.IsNullOrEmpty(xml)) { xml = HandleText(info, voiceText); } } //最后如果沒有處理到,那么提示用戶的語音內(nèi)容 if (string.IsNullOrEmpty(xml)) { ResponseText textInfo = new ResponseText(info); textInfo.Content = string.Format("非常抱歉,您輸入的語音內(nèi)容沒有找到對應(yīng)的處理方式。您的語音內(nèi)容為:{0}", voiceText); xml = textInfo.ToXml(); } return xml; }
微信門戶測試界面效果如下所示。
? ? ? ? ? ? ? ? ?
? ?
?
為了方便對客戶會話的記錄,我的微信門戶后臺,會記錄用戶的語音輸入內(nèi)容,如下所示。
?當(dāng)然,微信后臺的管理界面,也能夠查到相應(yīng)的語音記錄,界面如下所示。
以上就是我對微信語音的消息定義和事件處理的邏輯,其實(shí)語音是一個重要的輸入,如果正確的識別內(nèi)容,比手工輸入的效果更好,給用戶提供另外一種高效的輸入和事件處理操作。
這樣的處理模式,能夠使得我們整個微信門戶框架,不管是對于用戶的語音輸入,還是文本輸入,還是菜單事件的處理,都可以融為一體,實(shí)現(xiàn)更加完美的銜接。
更多C# entwickelt WeChat-Portale und -Anwendungen mithilfe der Sprachverarbeitung相關(guān)文章請關(guān)注PHP中文網(wǎng)!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)