Warum die KI scheitern wird

Mama, das Internet ist voll

Bereits seit vielen Jahren haben Computer und Computerprogramme große Datenmengen durchforstet, aber weil das eher spezialisierte Bereiche waren, z. B. Astronomie, Physik, Medizin usw., hat das kaum einen interessiert. Seit aber künstlich generierte Texte und Bilder so gut geworden sind und so schnell generiert werden können, erfährt "Künstliche Intelligenz" große Aufmerksamkeit.

Künstliche Intelligenz erstellt Texte und Bilder anhand von Trainingsdaten aus dem Internet. Diese menschlichen Texte und Bilder im Internet sind aber (fast) alle urheberrechtlich geschützt und zwar automatisch, per Gesetz, man muss seine Texte und Bilder nicht irgendwie "aktiv" urheberrechtlich schützen.

Im Grunde begeht die KI also einen gigantischen Urheberrechtsverstoß. Das sehe nicht nur ich so, sondern auch die New York Times. Diese strebt gerade in den USA einen Gerichtsprozess gegen OpenAI an, mit der Argumentation, dass die New York Times viel Geld für aufwändig recherchierte, journalistische Inhalte ausgibt und OpenAI bzw. ChatGPT bedient sich kostenlos daran, um wiederum mit daraus generierten Texten und Bildern Geld zu verdienen.

Schlussfolgerung: Die Künstliche Intelligenz ist noch nicht intelligent genug, um seinen eigenen Urheberrechtsverstoß zu erkennen.

Das KI-Unternehmen OpenAI (mit seinen Programmen ChatGPT für Text, DALL-E für Bilder und Sora für Videos) bedient sich frei im Internet (auch bei dir oder bei mir) und verdient damit Geld. Dies stellt ganz klar einen Urheberrechtsverstoß dar, oder hast du oder ich zugestimmt, dass deine Texte und Bilder zum Training des kommerziellen Programmes ChatGPT genutzt werden dürfen? Wir können das auch nicht überprüfen, denn kein KI-Unternehmen gibt bisher an, welche Trainingsdaten genau genutzt werden.

Meine Meinung: Wir müssen der KI mal die digitalen Eier langziehen.

Auf der anderen Seite tappt man als normaler Bürger im Internet recht schnell in abmahnfähige Urheberrechtsverletzungen (kurze Musikschnipsel genutzt, scheinbar "freie" Stockfotos genutzt, zu lange Abschnitte aus Texten und Videos genutzt usw.) - und die KI bedient sich überall gratis (Texte, Bilder, Musik, Videos) und macht damit Gewinn/Profit? Kommt nur mir das komisch vor? Man darf mir gerne dazu eine E-Mail schreiben, in meinem Impressum findet ihr die E-Mail-Adresse (sie ist etwas umständlich formuliert, um SPAM zu vermeiden).

Anders ist die Lage bei gemeinnützigen Unternehmen wie dem Internet Archive. Das Internet Archive speichert, vereinfacht gesagt, regelmäßig das gesamte Internet ab, ähnlich wie früher die antike Bibliothek von Alexandria versucht hat, jede damalige Papyrusrolle zu bekommen. Aber das Internet Archive verdient damit kein Geld, sondern ist auf Spenden angewiesen. Das Internet Archive verändert auch nichts an den Daten und generiert keine neuen Inhalte, sondern will das schnelllebige Internet wie in einer Bibliothek "aufbewahren".

Meine Meinung: Ein profit- bzw. gewinnorientiertes Unternehmen wie OpenAI bedient sich ohne Zustimmung an urheberrechtlich geschützten Texten. Wenn das kein Urheberechtsverstoß ist, was dann? Wieso darf sich eine "Maschine" an hunderttausenden Texten/Bildern bedienen und damit Gewinn machen, während der normale Bürger für Textfragmente, Bilder, kurze Video- und Musikschnipsel [1] abgemahnt wird?

Lösung: Man darf sich nur an Texten bedienen, deren Urheber vor mindestens 70 Jahren verstorben ist (Jesus und Hitler sind dabei, Putin fehlt). Dieser Weg ist juristisch nicht zu beanstanden, denn so steht es im Urheberrechtsgesetz (§ 64). Die KI würde mit seinen Antworten dann ziemlich "veraltet" wirken und nicht einmal das Handy, das Internet und erst recht nicht es selbst kennen :-)

Der geneigte Leser merkt schon, der Stephan mag keine KI. Das stimmt (in Teilbereichen), und ich werde auch meine Gründe (für diese Teilbereiche) angeben:

1. KI vermüllt das Internet (es füllt mit Daten-Plastik die Ozeane, später als Mikroplastik unser Inneres)

2. KI gibt nur höchstens durchschnittliche Antworten (für die Hausarbeit reichts)

3. KI langweilt uns zu Tode (glattgeschliffene, immer "moralisch korrekte" Antworten)

4. KI ist maschinell (Menschen wollen mit echten Menschen kommunizieren)

5. KI wird vor allem von den "Bösen" genutzt (Russen-Bots, Enkeltrick-Stimmen-Betrüger, SPAM)

6. KI wird uns nerven (wie ein mit Werbung vollgestopfter Briefkasten)

7. KI halluziniert (erst vermüllt es das Internet, dann trainiert es sich damit selbst)

8. KI steht für Katastrophen Intelligenz (ich liebe Katastrophen!)

Die KI ist uns in der Generierung von "Viel, Viel, Viel" Texten und Bildern weit überlegen. Sie wird uns durch reine "Masse" erdrücken. Irgendwann besteht das Internet zu 99 % aus KI generierten Texten/Bilden/Videos und zu 1 % aus menschlichen Texten/Bildern/Videos. Später dann aus 99,999 % KI und 0,001 % Mensch. Dann gehen wir wie Diogenes [2] mit der Laterne durch das Internet und rufen "Ich suche einen Menschen!"

"Mama, das Internet ist voll" war mal ein Witz. KI könnte das schaffen.


[1] Es gibt interessante Gerichtsfälle zum Urheberrecht, z. B. zu dem Zitat "Mögen hätt ich schon wollen, aber dürfen hab ich mich nicht getraut!" von dem bereits lange (aber nicht lange genug) verstorbenen Karl Valentin. Oder zum Urheberrechtsstreit für einen Musikschnipsel der Band Kraftwerk. Der Musikschnipsel dauerte 2 Sekunden, der Rechtsstreit dauerte 20 Jahre (und läuft immer noch). Das ist Hochgeschwindigkeitsrechtsprechung! Ihr könnt diese Fälle einfach googeln und dann genießen.

[2] Diogenes von Sinope war ein antiker Philosoph aus Griechenland und lebte in der Tonne. Als Alexander der Große ihn besuchte, sagte Diogenes zu ihm: "Geh mir aus der Sonne!" Tagsüber (Sonnenschein!) ging Diogenes mit einer Laterne durch die Straßen und rief: "Ich suche einen Menschen!" Er fand wohl, dass sich die anderen nicht so verhielten, wie er es von einem Menschen erwartete. Aber wenigsten traf er noch auf Menschen, nicht auf KI-Bots.


Zurück zur Startseite