Sie haben den halben Tag in der Schlange gestanden, um endlich den perfekten Aussichtspunkt zu erreichen — und genau in dem Moment, als Sie auf den Auslöser drücken, drängen sich drei Touristen mit Selfie-Stangen ins Bild. Zurück im Hotel sehen Sie: Auf jedem Foto sind fremde Hinterköpfe.
Diese Frustration kennt jeder Reisefotograf. Die gute Nachricht: Mit dem richtigen KI-Prompt können diese Passanten in 30 Sekunden "verschwinden", als wären sie nie dagewesen.
Dieser Leitfaden erklärt nicht nur, welchen Prompt Sie kopieren sollen — er erklärt Satz für Satz, warum jede Formulierung unverzichtbar ist und wie Sie bei verschiedenen Szenarien anpassen können.
Vorher vs. Nachher: KI-Ergebnis

Das Bild zeigt einen echten Vorher-Nachher-Vergleich: Links das Originalfoto vor dem Kolosseum voller Touristen, rechts das KI-bearbeitete Ergebnis — alle Hintergrundpersonen verschwunden, die Steintexturen und Bodenpflaster vollständig erhalten.
Warum "Remove the people from this photo" immer scheitert
Viele beginnen mit diesem Prompt:
Remove the people from this photo.
Das Ergebnis: Entweder werden die Personen zu geisterhaften, halbdurchsichtigen Silhouetten, oder der gesamte Hintergrund wird roh ausradiert und durch verschwommene Farbkleckse ersetzt.
Was fehlt? Mindestens 4 Informationsebenen:
| Fehlende Ebene | Folge | Beispiel |
|---|---|---|
| Kein "Wer ist Passant" | KI entfernt auch Ihr Hauptmotiv | Freund verschwindet ebenfalls |
| Keine Füllmethode angegeben | KI ersetzt durch unscharfe Farbblöcke | Sichtbare Bearbeitungsspuren |
| Keine Lichtbeschränkung | Füllbereich hat andere Lichtrichtung | Schatten bricht plötzlich ab |
| Keine Perspektivbeschränkung | Größenverhältnisse werden verzerrt | Bodenperspektive biegt sich |
Vollständiger Prompt — 8 Phrasen, jede mit technischer Bedeutung
Intelligently detect and remove tourists from the background of this photo. Keep the main subject intact while seamlessly replacing removed people with natural background continuation. Maintain consistent lighting and perspective.
"Intelligently detect" — Warum "intelligently" nicht weggelassen werden kann
detect weist die KI an, zuerst zu "finden" und dann zu "verarbeiten". intelligently signalisiert semantisches Verständnis statt einfacher Farbdifferenz.
"remove tourists from the background" — Warum "background" statt "image"
from the background grenzt den Bearbeitungsbereich ein — nur Personen im Hintergrund werden entfernt, das Vordergrundmotiv bleibt. tourists ist präziser als people und verhindert, dass ortstypische Elemente (Händler, Wachen) fälschlicherweise entfernt werden.
"Keep the main subject intact" — Schutzgrenze
Die wichtigste Einschränkung im gesamten Prompt. Sie verhindert, dass beim Entfernen von Passanten nahe am Hauptmotiv dessen Rand "angebissen" wird.
"seamlessly replacing" — Übergangsart
seamlessly fordert einen Verlaufsübergang an der Bearbeitungsgrenze statt harter Kante.
"natural background continuation" — Füllstrategie
continuation fordert die KI auf, Textur und Struktur des Hintergrunds fortzusetzen. Bei Kopfsteinpflaster müssen die Fugen weiterlaufen; bei Rasen müssen Dichte und Richtung übereinstimmen.
"Maintain consistent lighting and perspective" — Realismus-Absicherung
Verhindert, dass die Füllfläche im falschen Licht erscheint oder die Bodenperspektive nach der Bearbeitung bricht.
Drei Szenarien — Angepasste Prompt-Strategien
Szenario 1: Dichte Menschenmenge (über 30% des Bildes)
Typisch: Chinesische Mauer, Eiffelturm, Hauptbahnhöfe
Ergänzung zum Basisprompt:
The crowd covers a large area. Prioritize reconstructing architectural
details and ground textures. Use surrounding visible areas as reference
for the reconstruction.
Szenario 2: Wenige Passanten (1–5 Personen verteilt)
Typisch: Strand im Hintergrund, Parkweg, Museumshalle
Ergänzung:
Only 2-3 people need to be removed. Preserve all ground shadows and
reflections that belong to the environment, not to the removed people.
Szenario 3: Passant verdeckt das Hauptmotiv (schwierigster Fall)
Ergänzung:
One person partially occludes the main subject. Remove that person and
inpaint the occluded areas of the main subject based on visible body
proportions and clothing patterns.
Erfolgsquote ca. 70%. Bei Verdeckung über 40% des Motivs besser ein anderes Foto wählen.
5 Feinabstimmungs-Tipps: Von "brauchbar" zu "unbearbeitbar"
- Lichtquelle angeben:
The main light source comes from the upper left. - Hintergrundmaterial beschreiben:
The background contains marble flooring with gray veins. - "photorealistic" statt "realistic": Löst fotorealistische Qualität aus
- Ausgabeauflösung angeben:
Output at the same resolution as the input image. - Komplexe Szenen aufteilen: Linke und rechte Bildhälfte getrennt verarbeiten
5 häufige Fehler und Korrekturen
| Fehler | Ursache | Korrektur |
|---|---|---|
| Personen werden "Geister" | Kein Füllbefehl | completely remove and fill the area with background content |
| Wiederholende Texturen | Füllbereich zu groß | avoid repetitive pattern artifacts |
| Rand des Hauptmotivs fehlt | Grenzfehler der KI | create a 5-pixel safety margin around the main subject |
| Falsche Farbe im Füllbereich | Globales Lichtverständnis fehlt | match the exact color temperature of the surrounding area |
| Bodenschatten verschwunden | Schatten irrtümlich entfernt | preserve environmental shadows, only remove shadows cast by tourists |
FAQ
Kann KI auch Personen in Videos entfernen?
Aktuelle Tools verarbeiten Einzelbilder. Video-Bearbeitung erfordert frameweise Konsistenz — deutlich komplexer.
Wie viele Personen können auf einmal entfernt werden?
Keine harte Grenze, aber wenn Personen über 50% der Fläche belegen, leidet die Qualität spürbar.
Unterschied zu Photoshops "Content-Aware Fill"?
Photoshop kopiert statistisch benachbarte Pixel. KI versteht semantisch ("das ist eine Backsteinmauer") und generiert logisch passende Texturen — besonders bei Perspektive und reflektierenden Flächen deutlich besser.
Testen Sie den Basisprompt und die Szenario-Ergänzungen direkt in Nanobanana Pro und vergleichen Sie die Ergebnisse selbst.