Article

Neuronale Netze in der automatischen Spracherkennung - ein Paradigmenwechsel?

Authors

* Presenting author
Day / Time: 22.03.2018, 11:20-12:05
Room: MW 2001
Typ: Keynote
Abstract: In der automatischen Spracherkennung, wie dem maschinellen Lernen allgemein, werden die Strukturen der zugehörigen stochastischen Modellierung heute mehr und mehr auf unterschiedliche Formen künstlicher neuronaler Netze umgestellt. Dieser Erneuerungsprozess, der schon vor nahezu 30 Jahren begann, führte in den vergangenen 10 Jahren zu erheblichen Verbesserungen in der Erkennungsgenauigkeit. Sowohl in der akustischen Modellierung von Sprache, als auch der a-priori Modellierung von Sprache auf der Textebene markieren künstliche neuronale Netze heute den Stand der Technik in der Spracherkennung für großes Vokabular, und weitere Verbesserungen werden erwartet. Dieser Vortrag gibt einen Überblick über den aktuellen Stand der Forschung im Bereich der auf künstlichen neuronalen Netzen basierenden Modellierung von Systemen zur automatischen Spracherkennung. Dies beinhaltet Diskussionen zu den folgenden Themen: neuronale Netzwerktopologien und Zelltypen, Training und Optimierung, Auswahl der Eingabemerkmale, Adaption und Normalisierung, Multifunktionstraining, sowie neuronale Netzmodellierung statistischer Sprachmodelle. Ungeachtet der deutlichen Fortschritte in der Spracherkennung mittels neuronaler Netze, bleiben jedoch weiterhin viele offene Fragen zu klären, bevor eine vollständig konstistente und eigenständige Modellierung durch neuronale Netze in der Spracherkennung erreicht wird. Der Vortrag wird mit einer Diskussion offener Probleme sowie potentieller zukünftiger Forschungsrichtungen, insbesondere bzgl. der Integration neuronaler Netze in den Entscheidungsprozess der automatischen Spracherkennung, abschliessen.