Deepfakes verstehen
Kapitel 1 von 6
Kapitel Eins

Kann man seinen Augen
noch trauen?
Deepfakes verstehen,
fundiert
erklärt.
Deepfakes im
Klassenzimmer
verstehen.
— Was Deepfakes sind, wie KI Bilder, Stimmen und Videos fälscht und woran man Fälschungen erkennt.

Ein Video, in dem ein Politiker etwas sagt, das er nie gesagt hat. Ein Anruf in der Stimme Ihres Enkels, der gar nicht Ihr Enkel ist. Das nennt man Deepfakes. Klingt beunruhigend – aber keine Sorge: Man kann lernen, Fälschungen zu erkennen. Genau das machen wir hier, ganz in Ruhe, Schritt für Schritt.

Deepfakes sind synthetische Medien — Bilder, Videos oder Audio, die von generativen KI-Modellen erzeugt oder manipuliert wurden. Diese Seite ordnet die Technik ein (GANs, Diffusionsmodelle, Voice-Cloning), zeigt die typischen Artefakte und die wirksamsten Prüfmethoden. Sachlich, ohne Panik, mit Blick auf das, was man konkret tun kann.

Was ist echt, was ist gefälscht? Diese Lerneinheit macht Schülerinnen und Schüler ab Klasse 7 fit im Umgang mit Deepfakes und Desinformation: Sie üben das Erkennen von Fälschungen, das Prüfen von Quellen und den ruhigen Umgang mit aufwühlenden Inhalten. Mit Quiz, Diskussionsimpulsen und einem interaktiven Such-Spiel.

~ Atmen Sie durch. Wir gehen das gemeinsam an.
~ Mit eingeordneter Technik und prüfbaren Methoden.
~ Empfohlene Lerneinheit: 2 Schulstunden á 50 Min.
Kapitel Zwei

Was sind
Deepfakes?

Deepfakes,
technisch
betrachtet.

Eine Definition
für die Klasse.

Ein Deepfake ist ein Bild, Video oder eine Tonaufnahme, die von einer KI so verändert oder neu erzeugt wurde, dass sie täuschend echt aussieht oder klingt – obwohl das so nie passiert ist. Man kann damit einer Person Worte in den Mund legen oder ihr Gesicht in ein fremdes Video setzen.

Ein Deepfake ist ein mit Deep Learning erzeugtes oder verändertes synthetisches Medium. Der Begriff entstand 2017 (aus „Deep Learning“ + „Fake“) und umfasst heute Bild-, Video- und Audio-Manipulationen: Face-Swap, Face-Reenactment, vollständig generierte Porträts sowie Voice-Cloning.

Ein Deepfake ist eine Fälschung, die mit Künstlicher Intelligenz gemacht wurde. Das Wort kommt von „Deep Learning“ (so lernt die KI) und „Fake“ (Fälschung). Es gibt gefälschte Fotos, Videos und sogar Stimmen. Das Tückische: Sie sehen oft echter aus als frühere Bildbearbeitungen.

Wichtig: Nicht jedes bearbeitete Bild ist gleich ein Deepfake. Ein aufgehübschtes Urlaubsfoto ist harmlos. Gemeint sind Fälschungen, die gezielt täuschen sollen.

Synthetische Medien sind der Oberbegriff; Deepfakes sind der Spezialfall, der eine reale Person oder reale Szene vortäuscht. Die zugrunde liegende Generative KI ist dieselbe Technik, die auch harmlose Bildgeneratoren antreibt — der Unterschied liegt in der Täuschungsabsicht.

Ein Deepfake ist eine KI-Fälschung, die so tut, als wäre sie echt.
Synthetische Medien an sich sind neutral. Zum Deepfake werden sie durch die Absicht, eine reale Person oder ein reales Ereignis glaubhaft vorzutäuschen.
Begriffshierarchie: Generative KISynthetische MedienDeepfake. Jeder innere Begriff ist ein Spezialfall des äußeren: Generative KI erzeugt beliebige neue Inhalte; synthetische Medien sind ihr Bild-/Video-/Audio-Output; ein Deepfake ist der Sonderfall, der eine reale Person oder Szene glaubhaft vortäuscht.
Manipulationsarten nach Modalität:
  • Face-Swap — das Gesicht von Person A wird in eine bestehende Aufnahme von Person B montiert (Identitätstausch).
  • Face-Reenactment / Puppeteering — die Identität bleibt, aber Mimik, Kopf­haltung und Lippenbewegung werden von einem „Treiber“-Video gesteuert.
  • Lip-Sync — nur der Mundbereich wird neu generiert, damit er zu einer fremden (oft geklonten) Tonspur passt.
  • Voice-Cloning / TTS — die Stimme einer Person wird aus Sprachproben nachgebildet und spricht beliebigen Text.
  • Text-to-Image / Full Synthesis — eine Person oder Szene wird vollständig erzeugt; es gibt kein Original (z. B. „diese Person existiert nicht“).
Zwei Modell-Familien erzeugen heute die überzeugendsten Fälschungen: GANs (Generative Adversarial Networks) und Diffusionsmodelle. GANs liefern in einem Schritt scharfe Resultate, sind aber instabil im Training; Diffusionsmodelle arbeiten ein Bild iterativ aus Rauschen heraus, sind robuster und dominieren seit ca. 2022 die Bild- und Videogenerierung. Beide werden in Kapitel 3 genauer aufgeschlüsselt.
📚 Lernziele
  • Ihr könnt einen Deepfake von normaler Bildbearbeitung unterscheiden.
  • Ihr erklärt, woher das Wort „Deepfake“ kommt.
  • Ihr nennt drei Arten von Deepfakes (Bild, Video, Stimme).
📖 Wichtige Begriffe
  • Deepfake: Mit KI erzeugte oder veränderte Fälschung, die echt wirkt.
  • Synthetische Medien: Computererzeugte Bilder, Videos oder Töne.
  • Voice-Cloning: Eine Stimme aus wenigen Sprachproben nachbilden.
💡 Wusstest du…

Das Wort „Deepfake“ ist erst 2017 entstanden — jünger als die meisten von euch. Die Technik dahinter wird seitdem rasant besser und einfacher zu bedienen.

❓ Quiz
Was macht ein Deepfake zum Deepfake?

Antwort B: „Eine KI erzeugt oder verändert ein Medium, damit es echt wirkt.“

A (ein Filter auf dem Selfie) täuscht niemanden. C (ein gemaltes Bild) ist Handarbeit, keine KI. Nur B trifft das Konzept.

Für die Lehrkraft — die drei Optionen zum Vorgeben: A: „Ein lustiger Filter auf einem Selfie.“ / B: „Eine KI erzeugt oder verändert ein Medium, damit es echt wirkt.“ / C: „Ein von Hand gemaltes Porträt.“

🎯 Erweiterte Lernziele (Bloom-Taxonomie)
  • K1 — Wissen: Schüler nennen die Wortherkunft von „Deepfake“.
  • K2 — Verstehen: Schüler erklären den Unterschied zwischen Bildbearbeitung und Deepfake.
  • K3 — Anwenden: Schüler ordnen Beispiele (Filter, Face-Swap, geklonte Stimme) richtig zu.
  • K4 — Analysieren: Schüler diskutieren, warum die Täuschungsabsicht entscheidend ist.
⏱ Zeitplan für dieses Kapitel (≈ 15 Min)
  • 2 Min: Lead-Text gemeinsam lesen.
  • 3 Min: Begriffe an der Tafel sammeln (mit Schüler-Vermutungen).
  • 2 Min: „Wusstest du…“-Fakt kurz besprechen.
  • 5 Min: Quiz in Kleingruppen — erst vermuten, dann auflösen.
  • 3 Min: Diskussion: „Wo ist die Grenze zwischen Spaß-Filter und Fälschung?“
💬 Diskussions-Leitung

Frage: „Habt ihr schon mal ein Foto bearbeitet? Ab wann wird daraus eine Täuschung?“

Anschluss-Frage: „Wem könnte ein gefälschtes Video von euch schaden?“

🤔 Antizipierte Schüler-Fragen
  • „Sind Snapchat-Filter Deepfakes?“ — Nein, sie täuschen niemanden über die Realität.
  • „Kann man das selbst machen?“ — Technisch ja, aber es kann strafbar sein (siehe Kapitel 6).
Kapitel Drei

Wie entsteht
so eine Fälschung?

Wie eine Fälschung
trainiert wird.

Wie eine KI
das lernt.

Stellen Sie sich vor, jemand schaut sich tausend Fotos und Videos derselben Person an, bis er jede Mimik kennt: wie sie lächelt, blinzelt, den Kopf neigt. Genau das macht eine KI – nur viel schneller. Aus all diesen Beispielen lernt sie das Gesicht so gut, dass sie es neu zusammensetzen und auf andere Aufnahmen übertragen kann.

Klassische Deepfakes nutzen ein Autoencoder-Paar: Zwei Encoder lernen die Gesichter von Person A und B in einen gemeinsamen latenten Raum zu komprimieren; ein getauschter Decoder rekonstruiert daraus das Zielgesicht. Moderne Verfahren setzen zunehmend auf Diffusionsmodelle und GANs, die fotorealistische Ergebnisse direkt synthetisieren.

Eine KI lernt aus vielen Aufnahmen einer Person – ähnlich wie ihr eine Person erkennt, weil ihr sie oft gesehen habt. Hat die KI genug Beispiele gesehen, kann sie das Gesicht oder die Stimme neu zusammensetzen. Je mehr Material (Trainingsdaten) sie bekommt, desto überzeugender wird die Fälschung.

Das Beunruhigende daran: Früher brauchte man teure Technik und viel Können. Heute reichen oft schon ein Handy, eine App und ein paar öffentliche Fotos. Deshalb begegnen uns Fälschungen immer häufiger.

Face-Swap-Pipeline (klassischer Autoencoder-Ansatz):
  1. Daten sammeln: hunderte bis tausende Bilder von Quell- und Zielperson aus verschiedenen Winkeln und Lichtsituationen.
  2. Ausrichten (Alignment): Gesichts-Landmarken erkennen, zuschneiden, auf eine kanonische Pose normalisieren.
  3. Trainieren: ein Encoder wird auf beide Gesichter trainiert und komprimiert sie in einen gemeinsamen latenten Raum; zwei getrennte Decoder rekonstruieren je ein Gesicht.
  4. Tauschen: Quellgesicht enkodieren, aber mit dem Ziel-Decoder rekonstruieren — Mimik bleibt, Identität wechselt.
  5. Compositing: generiertes Gesicht zurück­warpen, Ränder per Maske einblenden, Farbe/Korn angleichen, oft Frame-für-Frame mit zeitlicher Glättung.
GANs vs. Diffusionsmodelle:
  • GAN — ein Generator erzeugt Fälschungen, ein Diskriminator versucht, sie von echten Bildern zu unterscheiden. Beide trainieren gegeneinander, bis der Generator den Diskriminator täuscht. Schnell beim Erzeugen, aber anfällig für „Mode Collapse“ und Trainings­instabilität.
  • Diffusionsmodell — fügt einem Bild im Training schrittweise Rauschen hinzu und lernt, diesen Prozess umzukehren. Beim Generieren startet es aus reinem Rauschen und „entrauscht“ in vielen Schritten zum Bild. Stabiler, vielfältiger und steuerbar per Text-Prompt (Cross-Attention); seit ca. 2022 Stand der Technik für Bild und zunehmend Video.
Der latente Raum ist dabei zentral: eine komprimierte, „bedeutungs­tragende“ Zahlendarstellung, in der ähnliche Gesichter nah beieinander liegen. Wer in diesem Raum gezielt verschiebt, ändert Alter, Blickrichtung oder Ausdruck — ohne Pixel direkt zu malen.
Stimme klonen (Voice-Cloning / Neural TTS): Referenz-AudioSprecher-Embedding (ein „Stimm-Fingerabdruck“ als Vektor) → Text + Embedding in ein Text-to-Speech-Modell → Mel-SpektrogrammVocoder → Wellenform. Moderne Zero-Shot-Systeme brauchen dafür nur wenige Sekunden Audio. Für Telefonbetrug genügt schon eine Sprachnachricht oder ein öffentliches Video. Lip-Sync-Verfahren koppeln diese Tonspur dann an neu generierte Mundbewegungen im Video.
📚 Lernziele
  • Ihr beschreibt in eigenen Worten, wie eine KI ein Gesicht „lernt“.
  • Ihr erklärt, warum Deepfakes Trainingsdaten brauchen.
  • Ihr versteht, warum Fälschungen immer leichter zu erstellen sind.
💡 Wusstest du…

Für eine geklonte Stimme reichen modernen Systemen oft wenige Sekunden Audio — zum Beispiel aus einer Sprachnachricht oder einem öffentlichen Video.

❓ Quiz
Was braucht eine KI, um ein überzeugendes Deepfake zu erstellen?

Antwort A: „Viele Beispielaufnahmen (Trainingsdaten) der Person.“

Ohne genügend Material kann die KI das Gesicht oder die Stimme nicht gut nachbilden. B und C sind erfunden.

Für die Lehrkraft — Optionen: A: „Viele Beispielaufnahmen der Person.“ / B: „Die Telefonnummer der Person.“ / C: „Nichts, KI errät einfach alles.“

⏱ Zeitplan (≈ 12 Min)
  • 3 Min: Analogie „Wie erkennt ihr einen Freund von Weitem?“ sammeln.
  • 4 Min: Pipeline Schritt für Schritt an der Tafel.
  • 5 Min: Quiz + Diskussion „Warum wird das immer einfacher?“.
🖨 Arbeitsblatt-Mini
  1. Erkläre in zwei Sätzen, woraus eine Deepfake-KI lernt.
  2. Warum sind öffentlich gepostete Fotos und Videos dafür nützlich?
  3. Nenne einen Grund, warum Fälschungen heute häufiger sind als früher.
🔗 Querverweis

Die Grundlagen dazu — wie KI überhaupt aus Daten lernt und Bilder erzeugt — vertieft die Schwesterseite KI verstehen.

Kapitel Vier

Woran erkennt
man Fälschungen?

Die typischen
Artefakte.

Finde die
KI-Fehler.

KIs werden immer besser – aber sie machen noch verräterische Fehler. Im folgenden Bild haben sich ein paar typische KI-Patzer versteckt. Tippen Sie auf das, was Ihnen seltsam vorkommt. Keine Sorge, hier kann nichts schiefgehen – es ist zum Üben.

Generatoren scheitern bevorzugt an Stellen mit hoher struktureller Konsistenz-Anforderung: Hände, Zähne, Ohren, Schmuck, Haar-Hintergrund-Übergänge, Licht- und Reflexlogik, Hintergrundtext. Suchen Sie die Artefakte in der Szene — jeder Fund blendet eine kurze Erläuterung ein.

Klickt euch durch das Bild und findet die typischen KI-Fehler! Für jeden Treffer gibt es eine kurze Erklärung. Tippt ihr auf eine echte Stelle, sagt euch das Bild Bescheid. Findet ihr alle?

Finde die KI-Fehler
Tippen Sie auf alles, was Ihnen an diesem KI-Porträt komisch vorkommt. Klicken Sie die Artefakte an. Tastatur: mit Tab anspringen, mit Enter oder Leertaste auslösen. Tippt auf die Fehler. Mit der Tab-Taste springt ihr von Stelle zu Stelle, mit Enter wählt ihr aus.

Noch nichts gefunden – schau dir Hände, Ohren, Zähne und den Hintergrund genau an.

Stark! Du hast alle typischen KI-Fehler entdeckt. In echt sind sie oft subtiler – aber genau dieser prüfende Blick ist die halbe Miete.
  • Hände & FingerZu viele, zu wenige oder verbogene Finger.
  • ZähneVerschmolzen, zu gleichmäßig oder seltsam viele.
  • Ohren & SchmuckLinks und rechts passen nicht zusammen.
  • Haar & HintergrundUnscharfe, verschmierte Übergänge.
  • Licht & SchattenSchatten und Spiegelungen ergeben keinen Sinn.
  • Text im HintergrundSchrift wird zu zusammenhanglosem Kauderwelsch.
  • Lippen & Ton (Video)Mund und Stimme laufen nicht synchron.
  • Wichtiger als allesDie Quelle: Woher stammt das Material?
Forensische Signale (jenseits des bloßen Hinsehens):
  • Frequenz-Artefakte: GAN- und Upsampling-Schichten hinterlassen im Fourier-Spektrum periodische Gitter­muster, die das Auge nicht sieht, ein Detektor aber misst.
  • Physiologische Inkonsistenzen: unnatürliches Blinzeln, fehlender Puls­schimmer in der Haut (rPPG), starrer Blick — frühe Tells, die neuere Modelle aber zunehmend ausgleichen.
  • Beleuchtungs- und Geometrie-Checks: Schatten­richtung, Reflexe in beiden Augen, Perspektive von Schmuck und Zähnen.
  • Zeitliche Kohärenz (Video): Flackern an Maskenrändern, springende Texturen zwischen Frames, Lippen-Ton-Versatz von wenigen Millisekunden.
Grenzen automatischer Detektoren: Klassifikatoren erkennen meist nur die Generator-Familie, auf der sie trainiert wurden. Bei einem unbekannten Modell, nach erneutem Komprimieren (Re-Encoding durch Messenger/Plattformen), Skalieren oder Screenshot bricht die Trefferquote ein. Das ist ein Katz-und-Maus-Rennen: Jeder neue Detektor wird zum Trainingssignal für die nächste Generator-Generation. Deshalb verschiebt sich der verlässliche Nachweis von der Erkennung (ist es gefälscht?) zur Provenance (woher stammt es nachweislich?).
Herkunftsnachweis & Wasserzeichen:
  • C2PA / Content Credentials — kryptografisch signierte Metadaten, die festhalten, womit ein Medium aufgenommen oder bearbeitet wurde („digitale Nährwert-Tabelle“). Vertrauenswürdig, solange die Signatur­kette intakt ist; ein simpler Screenshot entfernt sie aber.
  • Unsichtbare Wasserzeichen (z. B. SynthID) — robuste Signale, die direkt in KI-erzeugte Inhalte eingebettet werden und auch Re-Encoding überstehen sollen.
  • Detektor-Score — als Wahrscheinlichkeit behandeln, nicht als Beweis; immer mit Quellenprüfung kombinieren.
Fazit: Visuelle Tells sind ein Frühindikator und sinken mit jeder Modellgeneration. Verlässlich wird es erst durch die Kombination aus Herkunftsprüfung, Provenance-Standards und mehreren unabhängigen Quellen.
📚 Lernziele
  • Ihr benennt mindestens vier typische KI-Artefakte.
  • Ihr versteht: Erkennungsmerkmale sind ein Hinweis, kein Beweis.
  • Ihr wisst, dass die Herkunftsprüfung wichtiger ist als das bloße Hinsehen.
❓ Quiz
Welche Stelle ist bei KI-Bildern besonders oft fehlerhaft?

Antwort C: „Die Hände.“

Hände sind komplex und in Trainingsdaten in unzähligen Stellungen — KI verwechselt leicht die Fingerzahl. A (der Himmel) und B (eine einfarbige Wand) sind dagegen leicht.

Optionen: A: „Ein blauer Himmel.“ / B: „Eine weiße Wand.“ / C: „Die Hände.“

⏱ Zeitplan (≈ 18 Min) — Kern der Stunde
  • 5 Min: Interaktives „Finde die KI-Fehler“ am Beamer, Klasse ruft Fundstellen.
  • 5 Min: Checkliste gemeinsam durchgehen, eigene Beispiele ergänzen.
  • 5 Min: Diskussion „Warum reicht Hinsehen allein nicht?“.
  • 3 Min: Quiz + Auflösung.
🎯 Methoden-Tipp

Lassen Sie die Klasse zuerst raten, bevor das Spiel die Stelle bestätigt. Das schult genaues Hinsehen mehr als das Abklicken.

🖨 Arbeitsblatt-Mini
  1. Liste fünf Stellen auf, an denen KI-Bilder oft Fehler machen.
  2. Erkläre, warum Hände für eine KI schwierig sind.
  3. Was ist verlässlicher als das bloße Hinsehen? (Stichwort: Herkunft)
Kapitel Fünf

Warum wirken
Fälschungen?

Desinformation
und ihre Hebel.

Warum wir
darauf hereinfallen.

Eine Fälschung muss gar nicht perfekt sein, um zu wirken. Sie muss uns nur im richtigen Moment erwischen: wenn wir wütend, erschrocken oder begeistert sind. Dann teilen wir schnell – und schon verbreitet sich die Falschmeldung. Das Gegenmittel ist erstaunlich einfach: kurz innehalten, bevor man glaubt oder weiterleitet.

Desinformation nutzt psychologische Hebel: emotionale Erregung erhöht die Teilen-Wahrscheinlichkeit, Geschwindigkeit unterläuft die kritische Prüfung, und Echokammern verstärken Bestätigung. Wirksame Gegenmittel sind Methoden statt Bauchgefühl: Quellenprüfung, Rückwärts-Bildersuche, Lateral Reading und der Abgleich mehrerer unabhängiger Quellen.

Fälschungen verbreiten sich über Gefühle und Tempo. Was uns aufregt, teilen wir schneller – ohne nachzudenken. In Gruppen mit gleicher Meinung (Echokammern) glaubt man sich gegenseitig. Die gute Nachricht: Mit ein paar einfachen Schritten könnt ihr fast jede Fälschung enttarnen.

Echt oder Fake? — Schau dir diese Schlagzeile an:
„SCHOCK: Bekannter Star verschenkt heute sein ganzes Vermögen – nur wer DIESEN Link teilt, bekommt etwas ab!“

Drei Werkzeuge helfen fast immer: Innehalten (nicht sofort teilen), die Rückwärts-Bildersuche (woher kommt das Bild?) und der Blick auf mehrere Quellen (berichten seriöse Medien dasselbe?).

Nicht jede Fälschung ist ein Deepfake: Oft genügt ein Cheap Fake — ein echtes Bild aus dem Kontext gerissen, ein verlangsamtes Video, eine irreführende Bildunterschrift. Solche Manipulationen sind billiger, schneller und verbreiten sich genauso wirksam wie aufwendige KI-Fälschungen. Deshalb ist die Herkunftsfrage meist nützlicher als die Suche nach Render-Artefakten.
Warum sich das verstärkt:
  • Algorithmische Verstärkung: Empfehlungssysteme optimieren auf Verweildauer und Interaktion — und Empörung erzeugt beides. Reichweite folgt der Emotion, nicht der Wahrheit.
  • Geschwindigkeit schlägt Korrektur: Eine Falschmeldung ist oft viral, bevor ein Faktencheck erscheint; die spätere Richtigstellung erreicht nur einen Bruchteil.
  • Liar’s Dividend: Wo alles fälschbar ist, lässt sich auch Echtes als „Deepfake“ abtun. Allein die Existenz der Technik liefert eine bequeme Ausrede.
Prüf-Werkzeugkasten (Lateral Reading in der Praxis):
  1. Quelle aufmachen: mehrere Tabs öffnen, prüfen wer publiziert und was Dritte über die Quelle schreiben — statt sich in die Seite selbst zu vertiefen („vertical reading“).
  2. Bild rückwärts suchen: Rückwärts-Bildersuche zeigt Erst­erscheinen und Originalkontext.
  3. Frame prüfen: bei Videos Einzelbilder isolieren und einzeln rückwärts suchen.
  4. Quer­abgleich: berichten mehrere unabhängige, seriöse Medien dasselbe? Eine einzelne Quelle ist kein Beweis.
📚 Lernziele
  • Ihr erklärt, warum Emotionen Fälschungen befeuern.
  • Ihr nennt drei Prüf-Werkzeuge (Innehalten, Rückwärts-Bildersuche, mehrere Quellen).
  • Ihr beschreibt, was Lateral Reading bedeutet.
❓ Quiz
Was solltest du als Erstes tun, wenn dich eine Nachricht stark aufregt?

Antwort B: „Kurz innehalten und die Quelle prüfen, bevor ich teile.“

Sofort teilen (A) verbreitet mögliche Fälschungen. Ignorieren und vergessen (C) hilft nicht beim Lernen. B ist der ruhige, kluge Weg.

Optionen: A: „Sofort an alle weiterleiten.“ / B: „Kurz innehalten und die Quelle prüfen.“ / C: „Einfach ignorieren.“

⏱ Zeitplan (≈ 15 Min)
  • 4 Min: „Echt oder Fake?“-Schlagzeile am Beamer, Klasse stimmt ab.
  • 4 Min: Drei Prüf-Werkzeuge einführen und an einem Beispiel zeigen.
  • 4 Min: Lateral Reading erklären (mehrere Tabs).
  • 3 Min: Quiz + Diskussion.
💬 Diskussions-Leitung

Frage: „Welche Gefühle machen euch besonders anfällig fürs schnelle Teilen?“

🔗 Querverweis

Wie Betrüger KI-Stimmen für falsche Notrufe nutzen, vertieft die Seite Sicher im Netz.

Kapitel Sechs

Was kann
ich tun?

Ruhig und
verantwortlich.

Regeln für
den Alltag.

Sie müssen jetzt nicht jedem Bild misstrauen. Wer ein paar einfache Gewohnheiten hat, ist gut geschützt – und behält die Ruhe. Paranoia ist nicht das Ziel, ein wacher, gelassener Blick schon.

Die richtige Haltung ist informierte Gelassenheit, nicht Generalmisstrauen. Konkrete Praktiken — Quellenprüfung, Rückruf über bekannte Kanäle, ein Familien-Codewort, sparsames Teilen — senken das Risiko deutlich. Dazu gehört der verantwortliche Umgang: keine Fälschungen erstellen oder weiterverbreiten.

Ihr seid Deepfakes nicht hilflos ausgeliefert. Mit ein paar Regeln bleibt ihr sicher und ruhig. Und genauso wichtig: Macht selbst keine Fälschungen, die anderen schaden – das kann ernste Folgen haben.

  • Innehalten statt sofort glauben. Regt mich etwas stark auf, ist das ein Grund, erst recht zu prüfen.
  • Bei verdächtigen Anrufen zurückrufen. Legen Sie auf und wählen Sie selbst die bekannte Nummer.
  • Ein Familien-Codewort vereinbaren. So erkennen Sie echte Notrufe von geklonten Stimmen.
  • Quelle prüfen. Wer berichtet das noch? Eine Rückwärts-Bildersuche hilft.
  • Nicht alles teilen. Im Zweifel lieber nicht weiterleiten.
  • Stopp – atmen – prüfen. Bevor ihr etwas glaubt oder teilt.
  • Mehrere Quellen checken. Eine einzelne Seite ist kein Beweis.
  • Rückwärts-Bildersuche nutzen. Woher stammt das Bild wirklich?
  • Keine Fälschungen von Mitschülern. Auch „aus Spaß“ kann es ernst und strafbar werden.
  • Im Zweifel Erwachsene fragen. Lehrkraft, Eltern, Vertrauensperson.
  • Herkunft vor Hinsehen. Quellenprüfung schlägt das Suchen nach Artefakten.
  • Out-of-band verifizieren. Verdächtige Anfragen über einen unabhängigen, bekannten Kanal gegenprüfen.
  • Provenance nutzen. Auf C2PA-Herkunftsnachweise und Wasserzeichen achten, wo vorhanden.
  • Rechtslage kennen (DE). Recht am eigenen Bild, Persönlichkeitsschutz, Betrug — Erstellung kann strafbar sein.
  • Digitale Spuren minimieren. Weniger öffentliches Bild- und Audiomaterial = weniger Material für Missbrauch.
Rechtlicher Rahmen in Deutschland (kein eigenes „Deepfake-Gesetz“, aber bestehende Normen greifen):
  • Recht am eigenen Bild (§§ 22 f. KunstUrhG) — Veröffentlichung von Bildnissen grundsätzlich nur mit Einwilligung.
  • Allgemeines Persönlichkeitsrecht (Art. 2 I i. V. m. Art. 1 I GG) — schützt Identität und Ehre.
  • Betrug (§ 263 StGB) bei Schockanruf/„Enkeltrick 2.0“; Beleidigung/Verleumdung (§§ 185 ff. StGB).
  • Manipulierte intime Aufnahmen sind besonders streng geschützt; auf EU-Ebene flankiert der AI Act mit Kennzeichnungspflichten für synthetische Medien.
Die Erstellung oder Weiterverbreitung schädigender Fälschungen ist damit häufig strafbar — auch „aus Spaß“.
Ausblick — das Katz-und-Maus-Rennen: Generatoren und Detektoren treiben sich gegenseitig voran; ein verlässlicher, rein technischer „Fälschungs-Melder“ ist nicht in Sicht. Tragfähig ist ein Dreiklang aus Provenance (signierte Herkunft, C2PA/Content Credentials), robusten Wasserzeichen für KI-Inhalte und Medienkompetenz in der Breite.
Zum Weiterlesen:
  • C2PA — Content Credentials (Provenance-Standard) — c2pa.org
  • BSI: Deepfakes — Gefahren und Gegenmaßnahmen — bsi.bund.de
  • „Generative Adversarial Networks“ — Goodfellow et al., 2014 (arxiv.org/abs/1406.2661)
  • „High-Resolution Image Synthesis with Latent Diffusion Models“ — Rombach et al., 2022 (arxiv.org/abs/2112.10752)
Deepfakes sind ein Werkzeug – und wie jedes Werkzeug kann man es zum Guten oder zum Schlechten nutzen. Sie haben heute gelernt, genauer hinzusehen und ruhig zu prüfen. Das ist schon der wichtigste Schritt.
Die Technik wird besser, die Tells subtiler — aber Herkunftsprüfung, Provenance-Standards und ein methodischer Umgang bleiben wirksam. Aufklärung schlägt Alarmismus: Wer die Mechanik kennt, fällt seltener herein und kann andere mitnehmen.
Ihr seid jetzt besser gewappnet als die meisten. Tragt das weiter: Erklärt es Freunden und Familie. Ein ruhiger, prüfender Blick ist die beste Verteidigung gegen Fälschungen.

🍎 Für Lehrkräfte: Unterrichtspaket

Diese Seite lässt sich als komplette Doppelstunde „Deepfakes & Desinformation“ einsetzen. Alle Inhalte sind frei nutzbar (CC BY 4.0) — bitte „Webagentur Hochmeir e.U. (webhoch.com)“ als Quelle nennen. Das komplette, druckbare Lehrer-Paket ergänzt diese Seite mit Arbeitsblättern (inkl. Lösungen), einem Klassentest mit Bewertungs­rubrik, Hausaufgaben in drei Niveaus, einer Elternbrief-Vorlage und dem Lehrplan-Bezug.

📄 Zum druckbaren Lehrer-Paket

📅 Vorschlag: Doppelstunde (90 Min)

  1. 10 Min — Einstieg: „Habt ihr schon mal etwas online gesehen, das sich als Fälschung herausstellte?“
  2. 15 Min — Kapitel 2 & 3: Was Deepfakes sind und wie sie entstehen.
  3. 20 Min — Kapitel 4: „Finde die KI-Fehler“ am Beamer + Checkliste.
  4. 20 Min — Kapitel 5: „Echt oder Fake?“ + Prüf-Werkzeuge, Lateral Reading.
  5. 15 Min — Kapitel 6: Schutzregeln, Familien-Codewort, Rechtslage.
  6. 10 Min — Abschluss: Quiz-Auswertung und Diskussion „aufgeklärt statt ängstlich“.

Differenzierung: Schwächere Gruppen bleiben im Einfach-Modus; stärkere wechseln in „Im Detail“ für Technik und Rechtslage.

Häufige Fragen

Häufig gestellte Fragen

Die wichtigsten Fragen rund um Deepfakes – kompakt zum Nachschlagen.

Quick-Reference zu Deepfakes. Antworten sind im FAQPage-Schema für Suchmaschinen und KI-Assistenten hinterlegt.

Ein Deepfake ist ein mit Künstlicher Intelligenz erzeugtes oder verändertes Medium — ein Bild, Video oder eine Tonaufnahme —, das täuschend echt wirkt, aber so nie stattgefunden hat. Der Name setzt sich aus „Deep Learning“ (der KI-Technik dahinter) und „Fake“ (Fälschung) zusammen.
Achten Sie auf verräterische Details: Hände mit zu vielen oder verformten Fingern, seltsame Zähne, asymmetrische Ohren oder Schmuck, unscharfe Übergänge zwischen Haaren und Hintergrund, Schatten und Spiegelungen, die nicht zusammenpassen, sowie verzerrte Schrift im Hintergrund. Bei Videos passt oft die Lippenbewegung nicht exakt zum Ton. Das wichtigste Werkzeug ist aber die Frage: Woher stammt das? Eine Rückwärts-Bildersuche und der Blick auf mehrere unabhängige Quellen entlarven die meisten Fälschungen.
Eine KI wird mit vielen Aufnahmen einer Person trainiert — Fotos, Videoausschnitte oder Sprachproben. Sie lernt die typischen Merkmale (Gesicht, Mimik, Stimme) und überträgt sie auf neue Inhalte. Technisch stecken dahinter generative Modelle wie GANs und Diffusionsmodelle sowie Verfahren wie Face-Swap und Voice-Cloning. Die Werkzeuge werden ständig einfacher und billiger.
Ja. Schon wenige Sekunden Audio reichen modernen Voice-Cloning-Systemen, um eine Stimme nachzubilden. Betrüger nutzen das für den „Enkeltrick 2.0“: Ein vermeintlicher Angehöriger ruft in Not an. Gegenmittel: auflegen, unter der bekannten Nummer zurückrufen und eine Frage stellen, deren Antwort nur die echte Person kennt.
Es gibt kein eigenes „Deepfake-Gesetz“, aber bestehende Gesetze greifen: das Recht am eigenen Bild, der Persönlichkeitsschutz, Verleumdung, Betrug und das Urheberrecht. Wer eine Person ohne Einwilligung in gefälschte oder kompromittierende Szenen setzt, macht sich häufig strafbar. Manipulierte intime Aufnahmen sind besonders streng geschützt.
Fälschungen wirken über Emotionen und Tempo. Ein Inhalt, der wütend, ängstlich oder schadenfroh macht, wird schneller geteilt als ein nüchterner. In Echokammern bestätigen sich Gleichgesinnte gegenseitig. Das beste Gegenmittel ist innehalten: kurz prüfen, bevor man teilt.
Bei einer Rückwärts-Bildersuche lädt man ein Bild (oder seine Adresse) bei einer Suchmaschine hoch, statt nach Wörtern zu suchen. Man sieht dann, wo das Bild sonst noch auftaucht, wann es zuerst erschien und in welchem Zusammenhang. So lässt sich ein aus dem Kontext gerissenes oder altes Foto schnell entlarven.
Ruhig bleiben statt in Panik handeln. Bei verdächtigen Anrufen oder Nachrichten: nicht sofort reagieren, sondern über einen bekannten, eigenen Kanal zurückfragen. Vereinbaren Sie in der Familie ein Codewort für Notfälle. Teilen Sie nicht unbedacht jeden Inhalt weiter und prüfen Sie die Quelle, bevor Sie etwas glauben.
Betrieben von webhoch.com