Speech-to-Text am POS

KI-basierte Kundenversteher Technologien.

Step 1: Voice Recording
Qualitative Insights
durch Audioaufnahmen am POS
Erhalten Sie mehr Kontextinformationen durch die Aufnahme ungekürzter Kundenstatements via Audio.
Step 2: Speech-to-text
Transkription mittels KI Zahlreiche Audios werden mit Hilfe von Speech-to-Text-Algorithmen in kürzester Zeit zu Text-Statements transkribiert.
Step 3: Codierung
Codierung mittels KI Text-Statements werden unabhängig von jeglichen Umwelteinflüssen und menschlichen Ermüdungserscheinung mit einem trainierten und überwachten AI-Modell codiert.
Step 4: Insights
Qualitative Insights &
authentisches Storytelling
Mit den Statements Ihrer Kunden können Sie nicht nur quantitative Bewertungen validieren, sondern auch konkrete Handlungsempfehlungen mit Hilfe von deskriptiven, multivariaten und inferentiellen Statistiken sowie Treiberanalysen ableiten.

Tauchen Sie ein in die Welt Ihrer Kunden am POS

KI-basierte Technologien ermöglichen es endlich,
eine große Anzahl von Konsumenten-Geschichten am POS
präzise, schnell und in hoher Qualität zu analysieren.
Wir identifizieren Ihre Erfolgstreiber für mehr Insights.

Speech-to-Text – Video Ton einschalten

Auf der Suche nach dem Storytelling am POS

Das gesprochene Wort ist über die Jahre in der Marktforschung die harte Währung geworden. Galt es früher, einen quantitativen Bogen mal mit der offenen Abfrage abzuschließen, ob der Befragte noch Anmerkungen hätte, beobachtet man heutzutage immer mehr qualitative Abfragen auch in standardisierten Bögen.

Der Anspruch, stetig mehr qualitative Insights auch bei großen Fallzahlen zu generieren, führt dazu, dass die offenen Statements der Befragten immer wichtiger werden – gerade in Kombination mit einer geschlossenen Bewertung.

Herausforderung Mensch am POS

Die andere Welt – der Mensch hat per se immer weniger Zeit, gerade am POS. Da persönliche Befragungen immer herausfordernder werden, ist dem Befragten zusätzlich die Sinnhaftigkeit einer Teil- nahme zu verkaufen. Wie aber lassen sich qualitativere Antworten für aussagekräftigere Insights am POS gewinnen? Mit dieser Frage beschäftigt sich das IWD täglich bei seinen jährlich mehr als 3 Millionen persönlichen Erhebungen am POS in 25 europäischen Ländern.

Die Lösung kann nur heißen: es gilt das gesprochene Wort.

Mehr qualitative Insights durch Audioaufnahmen am POS

Um vollständige qualitative Aussagen in kurzer Zeit erfassen zu können, greift das IWD auf Audioaufnahmen zurück. Hierbei nutzt das IWD die Aufnahmefähigkeit des Smartphones, welches bei einer computergestützten persönlichen Befragung das notwendige Arbeitsgerät ist. Die Statements der Befragten werden via Audio im laufenden Befragungsmodus erfasst. Der Interviewer muss weder tippen noch den Fragebogen unterbrechen, sondern nur an der richtigen Stelle die Aufnahme starten. Diese wird im Gesamtinterview gespeichert und sofort an den Server versendet.

Hohe Akzeptanz bei Befragten und Interviewer

Unsere Erfahrung zeigt eine hohe Teilnahme- bzw. Auskunftsbereitschaft unter den Befragten. 85% haben ihre Statements per Audio abgegeben. Die restlichen 15% konnten von den Interviewern noch schriftlich in der Befragungssoftware erfasst werden.

KI-gestützte Auswertung der Audiodateien

Um die große Menge an Audiodateien auswerten zu können, werden diese mit Hilfe eines Speech-to-Text-Algorithmus transkribiert. Dank dieser automatisierten Transkription bekommt man in kürzester Zeit vollständige Text-Statements. Eine manuelle Transkription in einer wirtschaftlich akzeptablen Zeit wäre an dieser Stelle unmöglich.

Da der Speech-to-Text-Algorithmus noch nicht alle Facetten der menschlichen Sprache beherrscht (das kennen wir von unseren Sprachassistenten im Smartphone nur zu gut), werden die Statements überprüft und wenn nötig korrigiert. Durch maschinelles Lernen wird die Transkription von Mal zu Mal besser und eine Korrektur durch den Menschen immer seltener notwendig.

Nach der Transkription werden die Texte bei Bedarf übersetzt und codiert. Auch hier bedient sich das IWD eines KI-Algorithmus. Dieser wird als virtueller Kodierer trainiert und überwacht. Somit gewährleisten wir eine immer konsistentere Codierung unabhängig von jeglichen Umwelteinflüssen und menschlichen Ermüdungserscheinungen.

Die codierten Statements können anschließend mit einer höheren Aussagekraft beispielsweise in einer deskriptiven, multivariaten und inferentiellen Statistik sowie in der Treiberanalyse verwendet werden.
Speech-to-Text