Jetzt auch mobil Kommentieren!

Microsofts Spracherkennung nur noch mit 5,1 Prozent Fehlerrate

Von Markus Kasanmascheff am 21.08.2017 11:41 Uhr
12 Kommentare
Microsofts Technologie zur automatischen Spracherkennung konnte weiter verbessert werden. Die Fehlerrate bei der Erkennung von Konversationstext beträgt mittlerweile nur noch 5,1 Prozent. Bereits im letzten Jahr hat Mi­cro­soft die Konkurrenz in Sachen Spracherkennung hinter sich gelassen und kann seinen Vorsprung nun ausbauen.

Zur Messung der Erkennungsrate für Konversationstext in Englisch kommt als Quasi-Stan­dard der so genannte NIST 2000 Switchboard-Test zum Einsatz. Darin erreichte Mi­cro­soft bereits letztes Jahr eine sehr niedrige Fehlerquote von 5,9 Prozent. Die erneute Ver­bes­se­rung von 0,8 Prozentpunkten mag manchem als nicht groß erscheinen. Da sich die Sys­teme inzwischen allerdings der Perfektion annähern, ist die erreichte Optimierung be­acht­lich. Die Erkennungsrate ist mittlerweile genauso hoch oder sogar höher wie die bei pro­fes­sio­nel­len menschlichen Transkriptionen.

Microsoft Cortana: Sprachassistent auf deutsch ausprobiert

Analyse von Telefongesprächen

Für den von Microsoft AI und Microsoft Research durchgeführten Switchboard-Test musste die Erkennungstechnik 2.400 Telefonunterhaltungen über Sport und Politik automatisch in Text umwandeln. Die Ergebnisse wurden mit denen von menschlichen Transkriptionisten verglichen, welche die Aufnahmen mehrfach anhören und sich mit einander austauschen durften.

Spracherkennung für Cortana und Co.

Microsofts Spracherkennung kommt im so ge­nann­ten Cognitive Toolkit (CNTK) zum Ein­satz welches für Cortana, den Skype Über­set­zer, den PowerPoint Presentation Translator und andere Software verwendet wird. Auch App-Entwickler können die exzellente Sprach­er­ken­nung so in ihre eigene Software integrieren.

Die hohen Erkennungsraten werden mit Hilfe neuronaler Netze und Sprachmodellen erreicht. Im Vergleich zum Vorjahr kommt darin jetzt auch ein so genannter bi-direktionaler Sprach­spei­cher zum Einsatz, welcher den Kontext von aktuell gesprochenen Sätzen und von länger zurückliegendem Text analysiert. Bei der automatischen Spracherkennung gab es in den letzten zehn Jahren durch den Einsatz komplexer KI-Systeme einen regelrechten Durchbruch. Vor zwanzig Jahren lag die Fehlerquote beim besten NIST Switchboard-Test noch bei 43 Prozent.

Jedem seine eigene KI: Microsoft macht Entwicklung jetzt simpel
whatsapp
Jede Woche neu: Top-News per E-Mail
12 Kommentare lesen & antworten
Verwandte Themen
Cortana
Hoch © 2000 - 2018 WinFuture Impressum