PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Maschinelles Lernen und Datenanalyse

Tandemkurs:
FB 4: In der Mess- und Prüftechnik
FB 8: In der Soziologie

PD Stefan Bosse

Universität Bremen - FB Mathematik und Informatik

1 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Überblick

2 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Motivation

Dieser Online Kurs mit interaktiven Übungen soll:

  • Einen anwendungsorientierten Einstieg in die Datenanalyse und Interpretation mit Verfahren des Maschinellen Lernens bieten;

  • Einen Überblick über gängige und weniger gängige Verfahren geben;

  • Interaktive Tutorials und Übungen mit zielgruppenorientierten Fallbeispielen sollen Verfahren begreifbar und erfahrbar machen!

3 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Tandemkurs

  • Dieser Kurs adressiert zwei primäre Zielgruppen:

    • FB 4: Produktionstechniker und Materialwissenschaftler (und SysEngs)
    • FB 8: Soziologen (und Psychos)
  • Dabei gibt es zwei Inhaltsstränge:

    • Einen gemeinsamen Strang mit Grundlagen und Verfahren
    • Getrennte Stränge für Anwendungsbeispiele
4 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Ontologie der Inhalte

  • Die Ontologie des Kurses besteht aus den Bausteinklassen:

    • Modelle
    • Verfahren (Training, Test, Inferenz)
    • Überwachtes Training
    • Nicht überwachtes Training
  • Weiterhin aus den Anwendungs- und Datenklassen:

    • Sensorische und experimentelle Daten (Mess- und Prüftechnik)
    • Erhebungs- und Umfragedaten (Soziologie)
    • Metrische und Kategorische Variablen

Die Grenzen der Datenklassen sind fließend! Der Mensch als Sensor!

5 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Gemeinsame Verfahren und Modelle → Unterschiedliche Daten, Aussagen, Anwendungen

6 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Ontologie der Veranstaltung

  1. Synchrone Vorlesungen mit Livestream (experimentell!)

    • Studenten können über einen Chat/Eingabefeld Fragen stellen
    • Aufzeichnung der Vorlesung → 2.
  2. Asynchrone Video Vorlesungen und Tutorials (alternativ)

    • Auch offline seh- und hörbar
  3. Gemeinsame Treffen mit Videokonferenz (Zoom)

  4. Interaktive Tutorials und Übungen mit NoteBook und ggfs. WorkBook im WEB Browser!

    • Offline ausführbar (evtl. werden Daten von einem Server geladen)
7 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

  1. Texte und Folien
    • Vorlesungsskripte (am Anfang: für jedes Modul/jede Einheit) im PDF
    • Das vorlesungsskript gibt die Folieninhalte 1:1 wieder (nur anderes Layout)
    • Alle Folien im HTML Format (auch offline lesbar)
    • Begleitende Literatur (Bücher im PDF)
8 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Ontologie der Services

  1. WEB Service: Informationen, Dokumente, Folien, Videos:
    http://edu-9.de/Lehre/ml2k

  2. Dokuwiki: News, Informationen und Links, Chats, Videostreams:
    http://ag-0.de/dokuwiki

    • Registrierung und Login erforderlich
    • Interaktiv!
  3. SAS: Student Assignment System (TODO):
    http://edu-9.de/cas

    • Registrierung und Login erforderlich
  4. VIDEO: (Video Opencast Server http://ag-0.de)

9 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Prüfungsleistungen

  1. Eine mündliche Abschlussprüfung (20 Minuten); oder alternativ 2.

  2. Eine schriftliche Seminararbeit (Experimentelle Arbeit oder Literaturrecherche)

    • 15-20 Seiten PDF
  3. Bearbeitung und Abgabe der digitalen Übungen (JSON Dateien)

10 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Literatur

  • Zur Vertiefung!

S. Richter, Statistisches und maschinelles Lernen. Springer Spektrum, 2019.

E. Alpaydın, Introduction to Machine Learning. MIT Press, 2010.

11 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Programmierung

Axel Rauschmayer, JavaScript For Impatient Programmers.

M. Haverbeke, Eloquent JavaScript. 2018.

12 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Domainspezifische Literatur

J. Bell, Machine Learning - Hands-On for Developers and Technical Professionals. John Wiley & Sons, Ltd, 2015.

P. Attewell and D. B. Monaghan, Data mining for the social sciences : an introduction. University of California Press, 2015.

13 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Software

NoteBook

  • Interaktive vorwiegend praktische Übungen werden rein digital im WEB Browser mit den NoteBooks durchgeführt

  • Ein digitale Übung (oder Turorial) besteht aus:

    • Textabschnitten
    • Informationsblöcken
    • Aufgaben (mit Lösungen)
    • Editoren für Programmcode
    • Ausführungsterminals für Programmcode
    • uvm.
14 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Ein NoteBook im WEB Browser

15 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

NoteBook Konzept

  • Top-down Bearbeitungsfluß

  • Statische Struktur mit dynamischen Inhalten

  • Alle dynamischen Inhalte können in einer JSON Datei gespeichert und wieder geladen werden

  • Es können Notizzettel überall im NoteBook angeheftet werden (werden auch gespeichert)

  • Musterlösungen (dynamische Inhalte) können eingebettet und mit einem Schlüssel freigeschaltet werden

16 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

WorkBook

  • Dynamische Struktur mit dynamischen Inhalten

  • Ein WorkBook besteht aus

    • Textabschnitten (MarkDown)
    • Codesnippets mit Editoren und Ausgabekonsolen
    • Speziellen Snippets wie editierbare Tabellen oder allg. Formulare
  • Programmierung in JavaScript

  • Alle dynamischen Inhalte und Daten können im JSON Format gespeichert und wieder geladen werden

17 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Ein WorkBook Beispiel

18 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Machinelles Lernen

Schlüsselwörter und Begriffe

Welche Begriffe werden häufig bei ML genannt:

  • Klassifikation×
  • KI×
  • Statistik×
  • Algorithmen×
  • Nächster Nachbar(KNN)×
  • Überwacht×
  • Nicht überwacht×
  • Deep Learning×
  • Lernen×
  • Transfer×
  • Anpassung×
  • Wissen×
  • Verknüpfung×
  • Prozess von Wissenstransfer×
  • Inkoorperiertes Kapital×
  • Zukunft×
  • Änderung×
  • No search results.
19 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Anwendungsgebiete

Welche Anwendungsgebiete gibt es:

  • Umfragen×
  • Alexa×
  • NLP×
  • Gesichtserkennung×
  • Shoppen×
  • Werbung und Marktsteuerung×
  • Scoring×
  • Dynamische Inhalte×
  • Facebook×
  • No search results.
20 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Fragestellungen

Welche Fragestellungen (zu lösende Probleme) gibt es:

  • Wie kann Online Kommuikation gewaltfreier machen?×
  • Wie gehen Wahlen aus?×
  • Optimierung von Lernaufwand?×
  • Wetterprognose×
  • Prognose von Aktienkursen?×
  • No search results.
21 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Inhalte

  1. Eingabe x: Daten (Attribute) und Eigenschaften (Analyse)

  2. Sensoren: Erfassung von Daten, S(welt): weltx

  3. Ausgabe y: Numerische und kategorische Werte

  4. Metriken und Taxonomie: Grundlagen des Maschinellen Lernens

  5. Algorithmen und Modelle: f(x): xy

  6. Training, Lernen, Prädiktion, Test M(<x,y>): <x,y> → f

  7. Anwendungen

22 / 23

PD Stefan Bosse - Maschinelles Lernen und Datenanalye - Modul 0: Überblick

Geschichte

www.pinterest.com Die Geschichte fokussiert auf Neuronale Netze. Es gibt mehr.

23 / 23