Wie man einen Sprachassistenten von Grund auf entwickelt

Eine interdisziplinäre Workshopreihe, die die strategischen Grundlagen für deinen Erfolg im Bereich Voice schafft

Die Vorbereitung auf das Zeitalter der Sprache steht bei den großen Unternehmen überall auf der Welt ganz oben auf der Agenda. Sprachassistenten gewinnen zunehmend an Bedeutung  –  fast jeder dritte Europäer und bereits mehr als jede zweite Person im asiatisch-pazifischen Raum nutzt Sprache in der ein oder anderen Weise zur Steuerung von Assistenten und der Suche von Informationen. Es gibt also keinen besseren Zeitpunkt als jetzt, um mit der Entwicklung eines Sprachassistenten zu beginnen.

In den letzten Monaten haben wir einen unserer Kunden dabei unterstützt, die strategischen Grundlagen für einen neuen Sprachassistenten zu schaffen. Dazu haben wir auf Kundenseite ein Team aus Unternehmens- und Markenstrategen, User Experience, User Interface und Service Designern sowie Innenarchitekten und Elektronik-Entwicklern im Rahmen einer vierteiligen Workshopreihe zusammengebracht.

Im Folgenden erfahrt ihr, was wir im Laufe dieser vier halbtägigen Sessions getan haben:

 

 

Ein gemeinsames Verständnis aus Nutzersicht

Im ersten Workshop ging es darum, ein gemeinsames Verständnis zu entwickeln und das Thema Sprachsteuerung aus der Nutzerperspektive zu betrachten. Die Grundlage dafür waren Personas für verschiedene Nutzer sowie für den Sprachassistenten, die auf einer zuvor durchgeführten Nutzerstudie basierten.

Rollenspiele für das Erleben der Beziehungsdynamik zwischen Nutzer und Sprachassistent

Um relevante Nutzungssituationen zum Leben zu erwecken, haben wir uns in Rollenspielen in die Rolle des Nutzers und des Assistenten begeben. Das hat nicht nur Spaß gemacht, sondern es allen Teilnehmern ermöglicht, sich wirklich in die Situation hineinzuversetzen und ein unmittelbares Gefühl dafür zu bekommen, was man als Nutzer in einem solchen Moment erwartet und dafür was angemessen ist und was nicht. Dies war eine wichtige Übung, da aufgrund der relativen Neuheit des Themas noch nicht alle Teilnehmer bereits Erfahrungen mit Sprachassistenten gemacht hatten. Zudem löste sie eine spannende Diskussion über die grundlegende Beziehung zwischen Nutzer und Assistent inklusive Themen wie ein angemessenes Maß an gegenseitigem Respekt aus.

 

 

Ein Blick auf den Wettbewerb und auf wichtige Anforderungen

Im zweiten Workshop lag der Fokus darauf, relevante Nutzungssituationen und die entsprechend benötigten Kompetenzen des Sprachassistenten im Detail zu bestimmen und weitere Erfolgsfaktoren aus der Perspektive von Nutzer, Business und Marke zu bewerten.

Die eigene Kernkompetenz im Zusammenspiel mit anderen Sprachassistenten definieren

Gemeinsam haben wir uns auf dem Markt verfügbare Sprachassistenten wie Google, Siri, Alexa und Cortana angeschaut und ihre jeweiligen Eigenschaften, ihren Markenfit und ihr spezielles Kompetenzfeld bewertet. Einen besonderen Blick warfen wir dabei in Richtung Asien, wo sich Spachasssistenten bereits stärker etabliert haben, und auf hierzulande noch weniger bekannte Assistenten wie zum Beispiel „Nomi“ der chinesischen Automarke Nio. Diese Betrachtung brachte alle zu dem Ergebnis, dass es wichtig ist, einen markenadäquaten Assistenten zu entwickeln, der optimal mit anderen Assistenten und ihren Skills zusammenarbeitet anstatt mit ihnen zu konkurrieren.

Nutzer, Business und Marke stecken den Rahmen

Im nächsten Schritt haben wir relevante Anforderungen aus Nutzer-, Business- und Markensicht mit Blick in Richtung 2025 gesammelt und entsprechend ihrer Bedeutung für den Erfolg des Voice Assistant priorisiert. Wichtige Themen, die dabei zur Sprache kamen, waren Vertrauen, funktionale Unterstützung, emotionale Bindung, Individualität sowie die Vernetzung des Assistenten mit anderen Diensten wie beispielsweise Kalender-Apps.

Ein Tag im Leben eines Nutzers mit dem Sprachassistenten

Als letzte Übung haben wir uns überlegt, wie ein Tag im Leben eines Benutzers vom Aufstehen bis zum Schlafengehen mit unserem neuen Assistenten aussehen könnte. Dabei haben wir die Kernkompetenzen der bereits existierenden Assistenten im Auge behalten und uns vor allem auf Themen und Aufgaben konzentriert, die noch nicht abgedeckt sind und gut zur Marke passen. Diese Übung half uns, die Kompetenzfelder des zu entwickelnden Sprachassistenten zu ermitteln, die wir erneut aus Marken-, Business- und Nutzersicht priorisiert haben.

 

 

Die Entwicklung des Charakters des Sprachassistenten

Im dritten Workshop kamen wir zum Kern der Workshopreihe, der Definition des Charakters des neuen Sprachassistenten. Die Ergebnisse der beiden vorherigen Workshops halfen uns dabei, da sie uns bereits eine grobe Vorstellung davon gaben, in welche Richtung der Assistent gehen sollte.

Archetypen spiegeln Nutzerbedürfnisse und die Marke wider

Als erste Übung haben wir uns die zwölf verschiedenen Archetypen angesehen und die drei wichtigsten definiert, die für den Sprachassistenten eine Rolle spielen. Archetypen spiegeln die Grundstrukturen menschlicher Handlungsmuster wider und in unserem konkreten Fall ging es darum, welche Archetypen in der Marke glaubwürdig präsent sind und welche für den Nutzer in unserem Kontext eine Rolle spielen. Wir einigten uns auf den Beschützer, den Entdecker und den Magier.

Mit dem „Assistent als Person“ zur konkreten Persönlichkeit

Darauf aufbauend haben wir im nächsten Schritt eine Methode genutzt, die wir regelmäßig im Rahmen der Markenentwicklung anwenden. Sie heißt „Marke als Person“. In dieser Übung beschreiben wir eine Marke   –   oder in diesem Fall den Assistenten   –   als Person mit allen Details, die diese ausmachen. Wie sieht er oder sie aus? Was ist sein oder ihr Hintergrund? Was würden Freunde über ihn oder sie sagen? Am Ende hatten wir eine relativ lange Beschreibung der Persönlichkeit des Assistenten, auf die sich alle Teilnehmer einigen konnten. Daraufhin haben wir uns alle direkt und teils auch indirekt beschriebenen Persönlichkeitsmerkmale angeschaut und darüber abgestimmt, welche für die Marke und den Nutzer am relevantesten sind. Das Endergebnis war ein Set von fünf Kernattributen und weiteren Subattributen, die sie konkretisieren.

Definition der möglichen Varianz im Verhalten

Darüber hinaus haben wir festgelegt, welche dieser Attribute   –   abhängig von Nutzer und Situation   –   eine größere Varianz zulassen und welche mehr oder weniger fest sind. Humor und Empathie zum Beispiel sind nicht in allen Situationen gleich wichtig und auch nicht von allen Nutzern gleichermaßen erwünscht.

Big Five als Kontrollmethode

Um zu sehen, ob jeder wirklich das gleiche Bild von der Persönlichkeit des Assistenten hat, haben wir die Big Five verwendet   –   ein etabliertes Modell im Bereich der Psychologie. Ihm zufolge existieren fünf Hauptdimensionen der Persönlichkeit und jeder Mensch lässt sich auf den folgenden Skalen einordnen: Offenheit für Erfahrungen, Gewissenhaftigkeit, Extraversion, Verträglichkeit und Neurotizismus.

Wir haben die Big Five des Sprachassistenten in Teams anhand eines Online-Big-Five-Fragebogens ermittelt, den wir aus Sicht des Assistenten ausgefüllt haben. Das Ergebnis zeigte, dass wir ein Attribut tatsächlich unterschiedlich interpretiert hatten und hatten so die Möglichkeit, darüber zu diskutieren und das Attribut nochmals zu spezifizieren.

 

 

Last but not least: Die Gestaltung des Verhaltens des Sprachassistenten

Im vierten und letzten Workshop haben wir den gemeinsam definierten Charakter auf die primären Gestaltungsdimensionen eines Sprachassistenten übertragen, um so die eigentliche User Experience zu auszugestalten.

Die fünf Gestaltungsdimensionen eines Sprachassistenten

Idealerweise hatten wir Experten verschiedener Disziplinen an Bord und konnten so gemeinsam diskutieren und definieren, wie sich die Persönlichkeitsattribute des Assistenten in den Bereichen Stimme, Sprachstil, Aktionen, Klänge und Visualisierung widerspiegeln können. Fragen, die sich aufkamen, drehten sich um die Wärme der Stimme, ihr Geschlecht („Müssen wir eines festlegen?“) und ihr Alter, die Tonhöhe der Stimme des Assistenten, die Verspieltheit der Klänge sowie die Dynamik der visuellen Elemente.

Das war’s! In kurzer Zeit konnten wir die wichtigsten Parameter des Sprachassistenten sowie seine Persönlichkeit und deren Auswirkungen auf das Design definieren. Alle Beteiligten waren bei der Entstehung der strategischen Grundlagen dabei und können diese nun ideal für ihre zukünftige Arbeit nutzen.

Und was passierte dann?

Im Anschluss an die Workshopreihe entwickelten wir auf Basis der Ergebnisse zusammen mit einem erfahrenen Drehbuchautor einen Prototyp des Sprachassistenten, der Sprache, Visuals und Klänge kombiniert.

Dieser Prototyp half uns, den Entscheidungsträgern im Unternehmen unseres Kunden sowie potenziellen Nutzern ein realistisches und greifbares Bild unserer Entwicklungen zu vermitteln und die nächsten Schritte zur weiteren Entwicklung des Sprachassistenten zu unternehmen.

 

Neugierig geworden?

Du möchtest einen Sprachassistenten entwickeln?
Lass es uns wissen!

think moto ist ein digitales Designstudio mit Sitz in Berlin. Wir beraten Unternehmen in Innovationsfragen und entwickeln markenadäquate Conversational User Interfaces sowie Visualisierungen und Embodiments
für Sprachassistenten und Chatbots.
Du findest uns unter thinkmoto.de.

Um unsere Website optimal gestalten und fortlaufend verbessern zu können, verwenden wir Cookies. Durch die weitere Nutzung der Website stimmen Sie der Verwendung von Cookies zu. Details