X

Microsoft: Dazwischenquatschen als Durchbruch bei Sprachassistenten

Microsofts Entwickler wollen einen qualitativen Durchbruch bei der Qualität von Sprachsystemen erreicht haben. Der Arbeit lag dabei die Beobachtung zugrunde, dass die Interaktion mit Sprachassistenten nicht nur unnatürlich wirkt, weil diese nur relativ klare Ansagen verstehen, sondern auch weil sie deutliche Seitenwechsel praktizieren.
Microsoft
05.04.2018  07:52 Uhr
Das sieht in der Praxis so aus, dass der Nutzer beispielsweise eine Frage stellt und kurz danach gibt das jeweilige System die gesprochene Antwort aus. Anschließend kann dann mit der nächsten Anfrage eine weitergehende Information abgerufen oder eine Aktion ausgelöst werden. "Menschen reden miteinander aber nicht auf diese Art", erklärte Li Zhou, der das Team zur Entwicklung von Microsofts chinesischem Chatbot XiaoIce leitet. Seine Gruppe soll es nun aber geschafft haben, ein "Full Duplex"-Sprachsystem zum Laufen zu bringen. Dieses kann im Grunde relativ parallel zuhören und sprechen - so wie es bei menschlichen Konversationen auch häufig der Fall ist. Dialoge sind hier nämlich keine Abfolge abgeschlossener Aussagen beider Gesprächspartner. Wenn man ganz genau hinschaut, wird man erkennen, dass es immer wieder einmal wild durcheinander geht und Überschneidungen auftreten und dies entsprechend auch das Empfinden einer natürlichen Konversation definiert.

Bedeutungsprognosen

Um das nun auch beim Sprachassistenten zu schaffen, mussten nicht nur die Abläufe der Sprachanalyse und Datenverarbeitung im Hintergrund optimiert werden. Das zugrundeliegende KI-System muss vielmehr schon dann, wenn der Nutzer spricht abschätzen, worauf dieser letztlich hinaus will. Und hier kann ein kleiner Trick helfen: Menschliche Aussagen sind selten sehr präzise auf den Punkt gebracht, sondern laufen auch gern mal in einigen eigentlich unnötigen Füllwörtern aus. Das kann sich das System zunutze machen, um im Grunde schon mit der Antwort zu beginnen, bevor der Nutzer scheinbar die Anfrage zu Ende gestellt hat.

In China konnte die Funktionalität bereits in den Praxisbetrieb von Xiaolce übernommen werden. Gemeinsam mit den Kollegen in Redmond und an anderen Standorten Microsofts will das Team nun daran arbeiten, das Verfahren auch in anderen Sprachen verfügbar zu machen.
Verwandte Themen
Cortana
☀ Tag- / 🌙 Nacht-Modus
Desktop-Version anzeigen
Impressum
Datenschutz
Cookies
© 2024 WinFuture