• Und was ist mit KI?

    An sogenannter Künstlicher Intelligenz wird zwar seit vielen Jahrzehnten geforscht, aber in der öffentlichen Wahrnehmung (und vor allem der Nutzung) ist das Konzept erst in den letzten Jahren - vor allem durch sogenannte Large Language Models (LLMs) - angekommen. "KI"-Methoden (beziehungsweise maschinelles Lernen) verbergen sich aber auch in den verschiedensten hier im Kurs vorgestellten Methoden. Clusteranalyse, Computer Vision, LSA und viele weitere Methoden basieren auf maschinellem Lernen. Für viele Analyseverfahren gibt es sowohl Ansätze mit als auch ohne maschinellem Lernen (z.B. bei OCR, Named Entity Recognition, POS-Tagging, Sentimentanalyse und vielen weiteren.

    Die Transformer-Architektur, auf der auch große Sprachmodelle wie (Chat-)GPT - steht für Generative Pretrained Transformer - basieren, hilft bei unterschiedlichsten Klassifikationsfragen:

    • Ist ein Wort ein Adjektiv oder ein Substantiv? (POS-Tagging)
    • Stammt ein Text aus einem Roman oder einem Magazin (Genre-Klassifikation)
    • Wurde dieser Text von Goethe oder Schiller geschrieben (Autorschaftserkennung)
    • Ist auf diesem Bild ein Hund oder eine Katze (Bildklassifikation)
    • In welche Richtung schauen die Personen auf diesem Rennaissance-Gemälde (Gaze-Detection)
    • ...

    Es gibt Software-Tools, die Methoden des maschinellen Lernens (mit oder ohne Transformer) bereitstellen. Häufig ist es allerdings von Vorteil, wenn man eine Programmiersprache und die entsprechenden Programm-Bibliotheken erlernt. Im Bereich Machine Learning ist dies zumeist die Programmiersprache Python.

    Mittlerweile kommen auch in den Digital Humanities immer häufiger LLMs und Chatbots wie Chat-GPT, Claude, LLama, etc. zum Einsatz. Dieser Einsatz hat Vorteile (Geschwindigkeit, man muss keine Programmiersprache lernen, etc.) und Nachteile (häufig falsche Ergebnisse, das System weiß nicht welche Angaben falsch oder richtig sind). Die Anwendung von Chatbot-basierter Reinigung, Annotation, Analyse und Visualisierung von Daten in den Digital Humanities schreitet extrem schnell voran, wird aber in der Forschung durchaus auch kontrovers gesehen.

    Für Interessierte hier eine kurze Erklärung wie aktuelle LLMs funktionieren.