Wir erläutern die Prozesse hinter dem Training von Künstlicher Intelligenz. Denn ChatGPT führt uns vor Augen, wie gefährlich der unreflektierte Umgang mit KI ist und welche Ansprüche wir an die Qualität von KI stellen sollten.
Kein Tag vergeht ohne Schlagzeilen von und über ChatGPT: Vor einigen Tagen wurde bekannt, dass der Textgenerator von OpenAI bei seiner Entwicklung zu kenianischen Billigarbeitern gegriffen hat. Für weniger als 2 US-Dollar pro Stunde wurden Mitarbeiter der ostafrikanischen Firma Sama beauftragt, um die Künstliche Intelligenz zu trainieren, so ein Bericht von “Time”.
Reflektierter Umgang mit KI-Inhalten
Künstliche Intelligenz ist von menschlichem Input abhängig. Sie wird manuell mit Daten gefüttert, um zu lernen. Doch wie steht es um die Qualität bei der Entwicklung von KI, wenn dieses Training an Billiglohnkräfte abgegeben wird?
“Das Wissen der KI wird vor allem aufgrund der zur Verfügung gestellten Labels generiert. Die Personen, die die Daten und in weiterer Folge die Labels aufbereiten, sind demnach die Lehrer:innen dieser”, so unser KI-Experte Dr. Ernst Nusterer. Der Prozess wird, wie im Fall von OpenAI, oft ausgelagert und für einen definierten Stundensatz bei Labeling-Firmen erledigt. “Die Entscheidungen einer KI sehen wir leichtsinnig gerne als objektiv an – das ist sie aber keineswegs, und dieser Irrtum ist brandgefährlich”.
Labeling und Qualitätsansprüche: Eine neue Herausforderung
Wir erarbeiten seit über 5 Jahren KI-Lösungen hausintern. Dabei ist das Labeling und die hohen Ansprüche des Trainings zentrales Thema. Hier ist ein eigenes Team damit beauftragt, zu entscheiden was man der KI beibringt. Oberste Priorität hat die Qualität der verwendeten Daten, so Tina Waldner vom Labeling-Team: “Unklare Daten, von denen wir auch nur vermuten, dass sie beim Training ein Problem darstellen könnten, werden erst gar nicht in den Datenpool aufgenommen. Ganz nach dem Motto: Lieber weniger, aber dafür gute Daten.”
Nicht nur die Qualität des Trainingsmaterials ist entscheidend. Für das Labeling ist vor allem auch Konzentration beim Team gefragt: “Wir achten auf genaues und präzises Arbeiten, ebenso wichtig ist die interne Absprache. Wir müssen immer am selben Stand sein, um gleich arbeiten zu können. Ein sehr wichtiger Punkt ist der ständige Austausch mit dem Entwicklerteam.”, so Waldner weiter.
Bei der schnell fortschreitenden Entwicklung von KI-Software muss künftig auch der Prozess im Hintergrund und dessen Qualität transparenter werden. Hier spielt der Mensch eine tragende Rolle. Denn letztendlich entscheidet das Training, wie gut eine Software ist, welchen Mehrwert sie bietet, und ob wir den Ergebnissen wirklich vertrauen können.
Mediale Inhalte im Wandel: Reden wir darüber!
Content-generierende KI wird sich in den kommenden Jahren ihren Platz in der Medienlandschaft suchen. Wir analysieren die Entwicklungen mit Erfahrung aus erster Hand. Schreibe uns gerne, wenn du mit uns darüber sprechen willst: contact@linkthat.eu