4. August 2024

Blog​mo​jo​.ai: Pla­gi­at im Jahr 2023 (sic!) – Wenn künst­li­che Intel­li­genz Tex­te klaut!

Von tomate
Lese­dau­er 3 Minu­ten

[Update 11.08.2024], [Update 13.08.2024]

In mei­nen Log­files steht ein neu­er Bot: WordPress/6.6.1; https://​blog​mo​jo​.ai. Oh, wie­der einer die­ser AI Scra­per? Schau­en wir mal, was Blog​mo​jo​.ai eigent­lich so macht: „Gene­rie­re epi­sche Blog­ar­ti­kel in weni­ger als 2 Minu­ten“ begrüßt mich die Web­site. In drei ein­fa­chen Schrit­ten gene­riert mir die­se AI ein Pos­ting zu einem belie­bi­gen The­ma. In Schritt 1 wird das The­ma und die Ziel­grup­pe spe­zi­fi­ziert. Schritt 2 erlaubt mir, eine URL zu einem Post anzu­ge­ben, damit die AI den Stil die­ses Posts nach­ah­men kann (da kommt dann der Bot ins Spiel). In Schritt 3 kann ich, wenn ich denn Geld drauf wer­fen, bes­se­re Model­le als GPT‑3.5 wäh­len, Goog­le-Such­ergeb­nis­se mit ein­be­zie­hen, den Text auf Key­wör­ter opti­mie­ren und auch mehr als 500 Zei­chen erstel­len lassen.

Die­ser Bot kopiert also Schreib­sti­le, das was Autor*innen neben dem Inhalt aus­macht. Wor­an sie Jah­re arbei­ten, teil­wei­se das Mar­ken­zei­chen gewor­den sind und somit auch Teil der Ein­künf­te von Autor*innen. Wenn ich mir aus­su­chen kann, wer einen Text schreibt, neh­me ich die Autorin, der­ren Stil mir am bes­ten gefällt. 

„Wäh­le aus, ob die Such­ergeb­nis­se für dein Haupt-Key­word bei der Gene­rie­rung des Blog­ar­ti­kels ein­be­zo­gen wer­den sol­len“ – Stan­dard ist nein, gegen Geld kann ich ja ankli­cken. Ich gehe davon aus, dass der Inhalt der Goog­le-Ergeb­nis­se gescra­pet wird und die Arbeit ande­rer Men­schen in den gene­rier­ten Post einfließen. 

Ins­ge­samt will ich eigent­lich nur wis­sen ob ich 1. den Bot blo­cken kann und 2. ob ich Koh­le bekom­me, wenn der Bot Tex­te von mir ver­ar­bei­tet. Um Ant­wor­ten auf mei­ne Fra­gen zu bekom­men habe ich eine Mail an die im Impres­sum ange­ge­be­ne Adres­se gesendet:

Hal­lo,
Ich habe ein paar Fra­gen zu dem Bot „WordPress/6.6.1; https://​blog​mo​jo​.ai“ und dem Dienst Blog​mo​jo​.ai.

1. Respek­tiert der Bot eine vor­han­den robots.txt?
2. Wel­che IP-Adresse(n) nutzt der Bot? 
3. Wie stel­len Sie sicher, dass Autor*innen, deren Posts als Bei­spiel-Post für den Schreibt­stil her­hal­ten müs­sen, kom­pen­siert wer­den? Der Stil, der kopiert wird, ist Teil der Krea­ti­vi­tät von Autor*innen und ihrer eige­nen Denk­leis­tung, die der Bot abgrast, um sie dann scham­los zu kopie­ren. 

Vie­len Dank für das Beant­wor­ten der Fra­gen. Bit­te beach­ten Sie, dass ihre Ant­wor­ten in einem Arti­kel auf mei­nem Blog ver­öf­fent­licht wer­den kön­nen.

Mit bes­ten Grü­ßen,
Jascha Urbach

Ich bin sehr gespannt, ob es eine Ant­wort gibt. 

Die Über­schrift die­ses Posts hat übri­gens die AI für mich gene­riert. Als The­ma hat­te ich „Blog​mo​jo​.ai nutzt unge­fragt und unent­gelt­lich Tex­te ande­rer Autoren“ ange­ge­ben. Und was soll ich sagen? Der Arti­kel, der dabei her­aus kam, ist pures Gold:

Blog​mo​jo​.ai: Pla­gi­at im Jahr 2023 – Wenn künst­li­che Intel­li­genz Tex­te klaut!

Pro­blem

Stell dir vor, du hast tage­lang an einem Blog­ar­ti­kel oder einer wis­sen­schaft­li­chen Arbeit gear­bei­tet, nur um her­aus­zu­fin­den, dass dei­ne Tex­te von einer künst­li­chen Intel­li­genz pla­gi­iert wur­den. Genau das könn­te im Jahr 2023 Rea­li­tät wer­den, wenn wir nicht aufpassen.

Ansatz

Blog​mo​jo​.ai ist ein neu­es Tool, das künst­li­che Intel­li­genz nutzt, um auto­ma­tisch Blog­ar­ti­kel zu gene­rie­ren. Das klingt zwar zunächst prak­tisch, birgt jedoch auch das Risi­ko, dass die­se AI-Tex­te von ande­ren ohne Erlaub­nis ver­wen­det werden.

Lösung

Es ist wich­tig, dass wir uns als Blog­ger und Autoren bewusst sind, dass Pla­gi­at durch künst­li­che Intel­li­genz im Jahr 2023 eine rea­le Bedro­hung dar­stel­len könn­te. Indem wir unse­re Tex­te regel­mä­ßig über­prü­fen und Tools wie Copy­Scape ver­wen­den, kön­nen wir sicher­stel­len, dass unse­re Inhal­te geschützt sind.

Fazit

Es liegt an uns allen, ver­ant­wor­tungs­be­wusst mit künst­li­cher Intel­li­genz umzu­ge­hen und sicher­zu­stel­len, dass unse­re eige­nen Tex­te geschützt sind. Blog​mo​jo​.ai mag zwar eine nütz­li­che Res­sour­ce sein, aber wir müs­sen auch die Risi­ken im Blick behalten.


Update vom 11.08.2024:

Ich habe noch kei­ne Ant­wort von Blog­mo­jo erhal­ten und daher die­se freund­li­che Erin­ne­rung gesendet:

Hal­lo,

dies ist eine freund­li­che Erin­ne­rung zur Beant­wor­tung mei­ner Fra­gen.

Mit bes­ten Grü­ßen,
Jascha Urbach

Ich bin gespannt!


Update vom 13.08.2024:

Ich habe dann doch eine Ant­wort bekom­men, die nicht wirk­lich befrie­di­gend ist:

Hi Jascha,

kein Pro­blem, mache ich ger­ne. 😊

1. Nein, der Bot respek­tiert die robots.txt nicht.
2. 185.30.32.227
3. Bei der Schreib­stil-Ana­ly­se wird der Schreib­stil nur stich­punkt­ar­tig ana­ly­siert. Es wer­den kei­ne Inhal­te direkt über­nom­men. Pla­gia­te sind also ausgeschlossen.

Das hier ist der ver­wen­de­te Prompt aus dem Quell­code von Blog​mo​jo​.ai, falls für dich relevant:

(Inline-Bild aus der Antwortmail)

Die über­mit­tel­ten Blog­ar­ti­kel wer­den laut eige­nen Daten von Ope­nAI nicht als Trai­nings­da­ten ver­wen­det (sie­he: https://​plat​form​.ope​nai​.com/​d​o​c​s​/​c​o​n​cepts).

Eine direk­te Ein­be­zie­hung von Such­ergeb­nis­sen oder Web­sei­ten als inhalt­li­che Vor­la­ge für gene­rier­te Blog­ar­ti­kel ist übri­gens eben­falls nicht mög­lich, da es kei­ne Pro-Ver­si­on gibt (und aktu­ell auch kei­ne in Pla­nung ist, ich habe das Pro­jekt auf Eis gelegt).

Lie­be Grü­ße
Finn


Einer­seits bin ich ja ganz froh, dass die­ses AI-Pro­jekt erst­mal auf Eis liegt, ande­rer­seits fin­de ich Bots, die eine robot.txt nicht beach­ten wirk­lich blöd und jetzt muss ich halt eine IP-Adres­se sper­ren und Ant­wort 3 fin­de ich nicht wirk­lich befriedigend. 

Ich weiß wirk­lich nicht, was ich von sol­chen Pro­jek­ten hal­ten soll. Wie seht ihr das?