Zum Hauptinhalt springen

Unfake Text

Bereinigt manipulierte Strings durch Mapping von Lookalikes auf lateinische Zeichen. Vollbreite-Zeichen validieren und Zeilenumbrüche beibehalten.

1
?
2

Bitte Parameter konfigurieren und Aktion ausführen.

Über Unfake Text


Unfake Text hilft dabei, täuschend echten Text wieder zu normalisieren, indem bekannte Homoglyphen ersetzt und Vollbreite-Zeichen normalisiert werden.

Funktionen


Dieses Tool bietet folgende Funktionen:

  • Homoglyph Cleanup – Konvertiert häufig verwendete kyrillische/griechische Buchstaben zurück ins Lateinische.
  • Normalisierung in voller Breite – Konvertiert Zeichen voller Breite in normale Breite.
  • Layout bleibt erhalten – Leerzeichen und Zeilenumbrüche bleiben unverändert.

Beispiele


  • Ungefälschte kyrillische Doppelgänger
    Eingabe:
    Passwort jetzt zurücksetzen
    
    Homoglyphen konvertieren: Ein
    Volle Breite konvertieren: Aus
    
    Ausgabe:
    Passwort jetzt zurücksetzen
  • Ungefälschter Text in voller Breite
    Eingabe:
    Hello, world!
    
    Homoglyphen konvertieren: Aus
    Volle Breite konvertieren: Auf
    
    Ausgabe:
    Hallo Welt!
  • Unfake beider
    Eingabe:
    VΕRΙFY ACCΟUNT
    
    Homoglyphen konvertieren: Ein
    Volle Breite konvertieren: Auf
    
    Ausgabe:
    KONTO VERIFIZIEREN

Praktische Anwendungsbeispiele


  • Erkennung von Phishing-Angriffen durch Homoglyphen - Sicherheitsanalysten können verdächtige URLs oder E-Mail-Anzeigenamen prüfen. Das Tool macht versteckte kyrillische oder griechische Zeichen sichtbar, die legitime Markennamen imitieren, um Login-Daten bei Phishing-Attacken abzugreifen.
  • Umgehung von Inhaltsfiltern in sozialen Medien - Moderatoren nutzen das Tool, um 'Fancy Fonts' oder mathematische Symbole zu normalisieren, mit denen Nutzer versuchen, Keyword-Filter zu umgehen. Die Umwandlung in Standard-Latein ermöglicht eine korrekte automatisierte Inhaltsprüfung.
  • Datenbereinigung für Legacy-Software-Exporte - Beim Datenimport aus Altsystemen oder asiatischen Eingabemethoden führen vollbreite Zeichen (Full-width) oft zu Fehlern in Datenbank-Indizes. Das Tool standardisiert diese Zeichen auf Normalbreite, um Dubletten zu vermeiden.
  • Text-Normalisierung für Machine Learning - Entwickler bereiten Textkorpora für LLMs vor, indem sie visuelles Rauschen entfernen. Eine einheitliche Normalisierung stellt sicher, dass die Tokenisierung konsistent bleibt, was die Genauigkeit von KI-Modellen deutlich erhöht.

Häufig gestellte Fragen


Wie geht das Tool mit gemischten Schriftsystemen um?

Es scannt den Text gezielt nach bekannten Verwechslungskandidaten (Homoglyphen) aus anderen Alphabeten und ersetzt diese durch die lateinische Entsprechung, während reguläre Zeichen unberührt bleiben.

Werden alle Homoglyphen-Varianten erfasst?

Das Tool deckt die am häufigsten für Betrug und Filterumgehung genutzten Zeichen ab. Es ist auf Glyphen optimiert, die in gängigen Webschriftarten visuell nicht vom Original zu unterscheiden sind.

Bleibt das Layout des Textes erhalten?

Ja. Die Konvertierung findet nur auf der Ebene der Zeichenkodierung statt. Leerzeichen, Zeilenumbrüche und die allgemeine Textstruktur werden nicht verändert.

Warum verursachen diese Zeichen Probleme in Datenbanken?

Für einen Computer sind ein lateinisches 'a' und ein kyrillisches 'а' zwei völlig unterschiedliche Datensätze, auch wenn sie für uns gleich aussehen. Das Tool vereinheitlicht diese Codes für eine fehlerfreie Verarbeitung.

Textwerkzeuge
Andere Tools, die Ihnen gefallen könnten
Text in Kursivschrift schreiben
Transformiert lateinische Zeichen in Unicode-Schreibschrift. Die Logik bewahrt Ziffern und Sonderzeichen für plattformübergreifende Kompatibilität.
Textstruktur visualisieren
Analysieren Sie Textkompositionen als Vektorgrafik. Token, Leerzeichen und Interpunktion werden in Farbschichten zerlegt. Exportieren Sie SVG-Modelle.
Textzeilen entpacken
Bereinigen Sie Textbloecke durch Mapping harter Umbrueche auf Trennzeichen. Die absatzbewusste Logik bewahrt die Struktur komplexer Datensaetze.
Zalgo-Effekt rueckgaengig machen
Bereinigen Sie korrupte Zeichenfolgen durch Entfernen kombinierender Unicode-Marken. Normalisieren Sie Glitch-Texte fuer Datenbanken und Parser.
Symbole im Text sortieren
Textzeichen nach UTF-8-Werten ordnen. Nutzen Sie Ignorierlisten und Duplikatentfernung zur Normalisierung komplexer Datensätze auf Zeilenebene.
Text drehen
Verschieben Sie Zeichen zyklisch in Strings. Reformatieren Sie mehrzeilige Strukturen zeilenweise. Normalisieren Sie Texte für komplexe Datenschemata.
ROT47-Text
Verschieben Sie druckbare ASCII-Zeichen um 47 Stellen. Map-Funktion fuer Zeichen 33-126 zur reversiblen Verschleierung gewaehrleistet Datenintegritaet.
ROT13-Text
Verschieben Sie Buchstaben um 13 Stellen im Alphabet. Sonderzeichen und Ziffern bleiben unberuehrt, waehrend die Gross- und Kleinschreibung gewahrt bleibt.
Text umschreiben
Normalisieren Sie Datensaetze mit Wortgrenzen-Logik und benutzerdefinierten Regeln. Nutzen Sie den zweiten Durchlauf zur Bereinigung von Leerzeichen.
Woerter im Text durch Ziffern ersetzen
Wandeln Sie Textzahlen in Ziffern um. Nutzen Sie Case-Sensitivity und Ganzwort-Matching zur Bereinigung komplexer Datensaetze vor der DB-Ingestion.
Vokale im Text ersetzen
Vokale via benutzerdefinierter Logik transformieren. Unterstützt Case-Sensitivity und rekursive Durchläufe zur technischen Datenbereinigung.
Leerzeichen im Text ersetzen
Wandeln Sie Tabs und Zeilenumbrueche in definierte Symbole um. Reduzieren Sie redundante Leerzeichen-Cluster zur Bereinigung technischer Datensaetze.
Buchstaben im Text ersetzen
String-Daten mittels benutzerdefinierter Regeln bereinigen. Nutzt Case-Sensitivity und zwei Durchläufe für komplexe Transformationen. Präzises Mapping sichern.
Konsonanten im Text ersetzen
Definieren Sie Substitutionsregeln fuer Konsonanten in komplexen Datensaetzen. Verarbeiten Sie Zeichenketten mit optionaler Case-Sensitivity und Logik-Iterationen.
Zeilenumbrueche im Text ersetzen
Transformieren Sie Textbloecke durch gezieltes Mapping von Umbruechen. Reduzieren Sie Redundanzen und validieren Sie Datenformate fuer den Export.
Ziffern im Text durch Woerter ersetzen
Wandeln Sie numerische Muster in Wortfolgen um. Isolierte Zahlen filtern und gemaess orthografischer Standards rekursiv verarbeiten.
Kommas im Text ersetzen
Sanitize Textdaten durch intelligentes Ersetzen von Kommas. Bewahrt Dezimaltrenner und bereinigt redundante Sequenzen fuer valide RFC-konforme CSV-Strukturen.
Textbuchstaben entfernen
Extrahieren Sie unerwünschte Zeichen aus Datensätzen. Die Logik unterstützt Case-Sensitivity und bereinigt redundante Leerzeichen für sauberen Output.
Schriftstil aus Text entfernen
Normalisieren Sie dekorative Unicode-Styles in lateinische Zeichen. Optimieren Sie die Barrierefreiheit und Datenbank-Kompatibilität durch Sanitization.
Anfuehrungszeichen aus Woertern entfernen
Validieren Sie Textdaten durch rekursives Entfernen von Quote-Zeichen. Mehrstufiges Stripping optimiert für CSV-Strukturen und Datenbank-Exporte.