Registration is wrong! Please check form fields.
Publication detail:

Auf KI basierende Stimmen- und Spracherkennung für KMUs

smm_2019_02_04.jpgErgibt der Einsatz von KI-basierter Sprachtechnologie für KMUs Sinn? Die Antwort auf diese sehr allgemein gehaltene Frage kann natürlich nur "ja" lauten. Allerdings müssen dazu einige matchentscheidende Voraussetzungen erfüllt sein. Die entscheidende Frage sollte bei einem KMU genau gleich lauten, wie sie sich für einen international aufgestellten Grosskonzern stellt: Gibt es einen Business-Case, der den Einsatz dieser sich schnell verbreitenden Technologien rechtfertigt?

Bevor wir uns mit dem Businessnutzen beschäftigen, ist es sinnvoll, die Technologie detaillierter zu betrachten. Der Einsatz von KI ist für ein KMU in etwa ähnlich nutzenstiftend wie eine oben liegende Nockenwelle bei einem Auto: Technologisch durchaus interessant, für sich allein gestellt aber wenig gewinnbringend und nur im Zusammenspiel mit anderen Komponenten zielführend. Das Vorhandensein eines relevanten Business-Cases und der konzertierte Einsatz aller Komponenten entscheiden über den kommerziellen Nutzen.

Der Business- und Kundennutzen

Die Stimmen- und Spracherkennung kann helfen, personalintensive und repetitive verbale Prozesse zu automatisieren. Die Abwicklung eines komplexen Beratungsgesprächs dagegen eignet sich kaum für die Sprachautomation. Die Abfrage von einfachen Produkt-, Bestell- oder Kundeninformationen hingegen kann sehr gut und effizient automatisiert werden. Die wesentliche Frage sollte daher lauten: Wie gross ist der Effizienzgewinn, der durch die Sprachautomation erzielt werden kann, und kann der Kundenservice damit in irgendeiner Form nachhaltig verbessert werden? Erhält das Unternehmen weniger als einige hundert Kundenanrufe pro Tag, dann lässt sich der Businessnutzen der Spracherkennung nicht über eine allfällig erzielte Personaleinsparung berechnen. Entscheidend wäre in einem solchen Fall die Einschätzung des durch eine bessere Erreichbarkeit (keine Telefonwarteschlangen, 7x24 Service etc.) erzielten Zusatznutzens, der zu einem positiven Entscheid für den Einsatz dieser Technologien führen könnte.

Diverse Studien im In- und Ausland haben gezeigt, dass der Kunde primär seine Anfrage schnell und effizient erledigt haben will. Dabei ist es 90 Prozent der Kunden gleichgültig, ob die korrekte Antwort von einem automatischen Spracherkennungssystem kommt oder von einem Mitarbeiter beantwortet wird. Wenn ein Sprachautomationssystem mithelfen kann, die Antwortzeiten auch zu Spitzenzeiten zu reduzieren oder auch ausserhalb der Büroöffnungszeiten zur Verfügung steht, dann ist der Kunde gerne bereit, diese Serviceverbesserung durch die Sprach­erkennung anzunehmen. Der Einsatz von Sprachtechnologien ist ein sehr probates Mittel zur Erhöhung der alles entscheidenden Kundenzufriedenheit.

Die Rolle von KI und Machine Learning bei der Stimmen- und Spracherkennung

Grundsätzlich werden die durch die Spracherkennung erkannten einzelnen Laute, Silben, Wörter und Sätze mit den bereits vorhandenen Referenzdaten verglichen. Diese Referenzdaten können durch das Aufnehmen von Kunden- oder Mitarbeitergesprächen erzeugt oder auch extern manuell gesprochen und annotiert werden. Je mehr Referenzdaten zur Verfügung stehen, umso besser wird die Erkennung der Sprache und des Kontextes. Mit jeder weiteren neuen Sprachaufnahme werden zusätzliche Referenzdaten geschaffen. Die auf dieser Basis stetig wachsende Referenzdatenbank führt zu einer laufend verbesserten Spracherkennung.

Herausforderungen in der Schweiz

Schweizerdeutsch ist primär eine gesprochene Sprache. Es bestehen keine klaren Grammatikregeln, und das Vokabular ist regional unterschiedlich. Das macht es für die grossen US-Spracherkennungslösungsanbieter wie Google, Apple, IBM oder Nuance unattraktiv, für den kleinen Markt Spracherkennungslösungen auf Schweizerdeutsch anzubieten. An derartigen Produkten arbeiten deshalb primär Schweizer Unternehmen.

Die KI-basierte Spracherkennung eignet sich also hervorragend, um einfache Kundenanfragen schnell und effizient zu bearbeiten. Der Business-Case, die zur Verfügung stehenden Sprachdaten sowie die Anzahl der Anrufe oder Abfragen entscheiden darüber, ob die Spracherkennung auch bei einem KMU gewinnbringend eingesetzt werden kann.