Die Sprach-und Sprechererkennung hat in den vergangenen Jahren enorme Fortschritte gemacht. Moderne Sprach- und Sprecherekennung kann Anwender bereits mit Erkennungsraten bis zu 100% bei der Verschriftlichung unterstützen. Die Interpretation und Verdichtung des Gesprochenen z.B zu Protokollen muss dagegen immer noch manuell durchgeführt werden. Hier setzt das Forschungs- und Entwicklungsvorhaben iDOKS an.
iDOKS sieht die Technik-automatisierte Gesprächsverdichtung in Textform vor, die mittels dreier übergeordneter innovativer Lösungsansätze adressiert werden soll:
1. Abbildung komplexer Multi-Sprecher-Szenarien in (Wissens-)graphen-theoretischen Modellen
2. Identifikation von Schlüsselmomenten im Gespräch zur Definition eines logischen Flusses
3. Generierung von Verdichtungen auf Basis der Schlüsselmomente und des Wissensgraphen eventuell unter Einbeziehung von Expertenwissen.
Ansätze des Natural Language Understanding auf Basis von Transformer-Architekturen werden auf Basis vorhandener Datensätze aus komplexen Gesprächssituationen dabei so erweitert, dass ein Domänen-unabhängiges Modell entsteht.
Von der Umsetzung der geplanten FuE-Arbeiten werden zukünftig Anwender in vielfältigen Bereichen profitieren. Sie alle werden erheblich durch das Reduzieren der Dokumentationszeit gewinnen, indem das Ergebnis effizient relevante Informationen von irrelevanten trennen und Gesprächsinhalte verständlich zusammenfassen kann.
Das Ergebnis der Forschungs-und Entwicklungsarbeiten von Seiten des Kompetenzzentrums Effiziente Technologieintegration sind Algorithmen und Module zur Verdichtung auf Basis von Wissensgraphen und maschinellem Lernen.
Laufzeit: 08/2021 – 07/2024
Förderprogramm: „KMU-innovativ“
Förderkennzeichen: 16SV8765