Blog

Sprachassistenten wie Alexa und Google Assistant sind aus unserem Alltag kaum noch wegzudenken. Es gibt aber Bereiche, wo man sie aus datenschutzrechtlichen Bedenken vielleicht lieber nicht einsetzen möchte - wenn es um sehr persönliche Daten geht, zum Beispiel, oder bei besonders schutzbedürftigen Personen. 

Hier gibt es aber durchaus ernstzunehmende Alternativen - Open-Source-Sprachassistenten wie beispielsweise Jasper, Rhasspy, Mycroft, Almond und andere. (Eine prima Übersicht bietet dieser Artikel). Diese setzen in der Regel auf lokaler Hardware wie einem Raspi auf und sind daher potentiell sehr interessante "Maker"-Lösungen. 

In diesem Informatikprojekt wollen wir in kleinen Teams von 3-4 Studierenden jeweils einen Proof-of-Concept umsetzen, um zu testen, wie gut diese Frameworks in der Praxis funktionieren - wie umfangreich ist das Framework, wie robust ist es, wie gut ist es dokumentiert. Am Schluss machen wir eine gemeinsame Präsentation, wo die Teams ihre Ergebnisse vorstellen. Das Ergebnis ist ein einfaches, aber funktionsfähiges sprachsensitives System, das Sie dann praktisch demonstrieren, und die eigenen Erfahrungen mit dem Framework.

Wenn Sie in dem Projekt mitmachen und dann Geschmack daran gefunden haben, gibt es in diesem Rahmen (oder in anderen Themenstellungen des INTIA-Projekts) eine Menge an Projektthemen im Anschluss an das Informatikprojekt. Somit wäre ein fließender Übergang zu Praxisprojekt und Bachelorarbeit gut denkbar.

Interesse? 

Wir machen eine Informationsveranstaltung am Dienstag 18. August um 13:00. Es gibt eine Videoaufzeichnung von dieser Veranstaltung: 

Kontext

Das Informatikprojekt führe ich im Rahmen des Forschungsprojektes INTIA durch, ein BMBF-gefördertes interdisziplinäres Projekt aus vier Professor*innen der TH Köln und sieben Mitarbeiter*innen. Hier entwickeln wir einen Innovationskoffer, mit dem Jugendliche und Fachkräfte aus Einrichtungen der sozialen Arbeit selbstständig Prototypen erstellen und erproben können. Ein Teilaspekt davon ist ein Hardware- und Software-Baukasten, mit dem diese Prototypen gebaut werden können. Sprachassistenten sollen einen Baustein abbilden, der alternative Eingabe- und Ausgabemöglichkeiten bietet. Die etablierten Lösungen wie Alexa und Google Assistant sind hier datenschutztechnisch nicht geeignet, weil es um einen sehr privaten Raum und um Menschen geht, die besonders schutzbedürftig sind. Daher wollen wir (als ein Teil-Forschungsziel von INTIA) solche Open-Source Sprachassistenten als datenschutzkonforme Alternative zu existierenden Lösungen evaluieren.

Was Sie im Rahmen dieses Informatikprojektes machen, fließt also direkt in eine praktische Umsetzung von digitalen Hilfsmitteln in der Behinderten- und Erziehungshilfe ein. State-of-the-Art-Technologieentwicklung wird in unserem Projekt direkt mit schützenswerten Personengruppen in der Praxis eingesetzt und evaluiert. Ihre Arbeit landet also nicht in der Schublade.

Uns interessiert die technische Eignung existierender Softwarestacks. Dafür definieren wir zusammen mit Ihnen ein MVP (Minimum Viable Product) aus dem Bereich Smart Home, das dann von Ihnen mit einem Framework Ihrer Wahl im Team umgesetzt wird. In diesem Szenario soll gezeigt werden, dass der umgesetzte Sprachassistent Anweisungen erkennt, die wichtigen Informationen extrahiert und daraufhin eine einfache Handlung (z.B. "Licht an") ausführt. Daran anschließend bewerten Sie aus Ihrer Sicht die Eignung für das konkrete Szenario.

Zum Weiterlesen in das Thema empfiehlt sich der oben schon genannte Blog-Post von Kathy Reid: https://makezine.com/2020/03/17/private-by-design-free-and-private-voice-assistants/. Dieser bietet einen grundlegenden Einblick in das Thema und die existierenden Open-Source-Lösungen.

Aufwand

Der Umfang von 10 CP (300h) wird sich bei diesem Projekt in etwa wie folgt verteilen: 

AktivitätAufwand (h)in Arbeitstagen
Kickoff, Teamorganisation, Einlesen, DevEnv405
Enwicklungszeit19224
Dokumentation der Entwicklungserfahrung405
Abschlusspräsentation mit Vorbereitung283,5
Summe300 (10 CP)37,5

Umsetzung

Wir bieten zwei Formen der Umsetzung des Informatikprojekts an. Ein Teilteam muss sich als Ganzes für eine der beiden Formen entscheiden. 

  1. Als Blockprojekt mit Entwicklungszeitraum vom 21. September bis 30. Oktober mit 4 Arbeitstagen pro Woche.
    1. Wenn der reguläre Vorlesungsbetrieb Anfang November beginnt, sind Sie also mit dem Hauptteil des Projekts durch.
    2. Den "freien Tag" (z.B. freitags) legen Sie selbst im Team fest. 
    3. Ergänzung nach dem Feedback aus der Infoveranstaltung: Wir können den Block in Absprache so anpassen, dass z.B. eine Klausurlernphase möglich ist (beispielsweise durch 2 Wochen Pause mittendrin)
  2. Semesterbegleitend mit 2d/Woche ab November. 
    1. Die beiden Tage legen Sie im Team fest (z.B. immer Di+Mi)
    2. An den Tagen sollten Sie sich dann nur mit dem Projekt beschäftigen, und keine andere Lehrveranstaltung (oder Arbeit) haben.

Weitere Randbedingungen: 

  • In jedem Fall setzen wir das Projekt agil um. Wir stellen für alle Teams einen Scrum Master und einen Product Owner sowie Zugang zu entsprechenden Tools. Die Sprintlängen passen wir dann jeweils an die Form an. Das Teilteam muss sich vorab auf feste Arbeitstage einigen und führt morgens ein Standup durch. 
  • Austausch im Team und Projektbetreuung findet wegen der immer noch akuten Covid-19-Bedrohung remote statt. Wir würden hier gern bei Discord bleiben, das sich bei ST2 sehr bewährt hat. 
  • Arbeit und Dokumentation findet auf GitHub statt
  • Technik in Form von Raspberry PIs wird zur Verfügung gestellt

Wie geht's weiter? 

Als Anmeldung treten Sie bitte bis 26. August diesem ILIAS-Kurs bei: https://ilias.th-koeln.de/ilias.php?ref_id=1626974&cmdClass=ilrepositorygui&cmdNode=w4&baseClass=ilRepositoryGUI. Dann können wir die Team-Infrastruktur entsprechend planen. 

In diesem Kurs habe ich mehrere Gruppen "Block-Team <n>" und "Semesterbegleitendes Team <n>" angelegt. Bitte treten Sie einer dieser Gruppen bei.

Am Donnerstag 17. September von 14:00 - 17:00 machen wir das inhaltliche Kickoff. Hier sind die Einwahldaten: 

https://th-koeln.zoom.us/j/4425088059

Meeting-ID: 442 508 8059 Kenncode: 420





Posts