Unfake Text

Bereinigt manipulierte Strings durch Mapping von Lookalikes auf lateinische Zeichen. Vollbreite-Zeichen validieren und Zeilenumbrüche beibehalten.

Eingabetext ?

Gib den Text ein oder füge ihn ein, den du wieder in normalen Text umwandeln möchtest.

Konvertierungsoptionen

Wähle aus, welche Arten von Fake-Zeichen zurückkonvertiert werden sollen.

Homoglyphen (kyrill./griech. Lookalikes) in Latein umwandeln Vollbreite Zeichen in normale Breite umwandeln

Ergebnis (normalisiert):

Bitte Parameter konfigurieren und Aktion ausführen.

Über Unfake Text

Unfake Text hilft dabei, täuschend echten Text wieder zu normalisieren, indem bekannte Homoglyphen ersetzt und Vollbreite-Zeichen normalisiert werden.

Funktionen

Dieses Tool bietet folgende Funktionen:

Homoglyph Cleanup – Konvertiert häufig verwendete kyrillische/griechische Buchstaben zurück ins Lateinische.
Normalisierung in voller Breite – Konvertiert Zeichen voller Breite in normale Breite.
Layout bleibt erhalten – Leerzeichen und Zeilenumbrüche bleiben unverändert.

Beispiele

Ungefälschte kyrillische Doppelgänger

Eingabe:
Passwort jetzt zurücksetzen

Homoglyphen konvertieren: Ein
Volle Breite konvertieren: Aus

Ausgabe:
Passwort jetzt zurücksetzen

Ungefälschter Text in voller Breite

Eingabe:
Ｈｅｌｌｏ，　ｗｏｒｌｄ！

Homoglyphen konvertieren: Aus
Volle Breite konvertieren: Auf

Ausgabe:
Hallo Welt!

Unfake beider

Eingabe:
ＶΕRΙFY ＡCCΟUNT

Homoglyphen konvertieren: Ein
Volle Breite konvertieren: Auf

Ausgabe:
KONTO VERIFIZIEREN

Praktische Anwendungsbeispiele

Erkennung von Phishing-Angriffen durch Homoglyphen - Sicherheitsanalysten können verdächtige URLs oder E-Mail-Anzeigenamen prüfen. Das Tool macht versteckte kyrillische oder griechische Zeichen sichtbar, die legitime Markennamen imitieren, um Login-Daten bei Phishing-Attacken abzugreifen.
Umgehung von Inhaltsfiltern in sozialen Medien - Moderatoren nutzen das Tool, um 'Fancy Fonts' oder mathematische Symbole zu normalisieren, mit denen Nutzer versuchen, Keyword-Filter zu umgehen. Die Umwandlung in Standard-Latein ermöglicht eine korrekte automatisierte Inhaltsprüfung.
Datenbereinigung für Legacy-Software-Exporte - Beim Datenimport aus Altsystemen oder asiatischen Eingabemethoden führen vollbreite Zeichen (Full-width) oft zu Fehlern in Datenbank-Indizes. Das Tool standardisiert diese Zeichen auf Normalbreite, um Dubletten zu vermeiden.
Text-Normalisierung für Machine Learning - Entwickler bereiten Textkorpora für LLMs vor, indem sie visuelles Rauschen entfernen. Eine einheitliche Normalisierung stellt sicher, dass die Tokenisierung konsistent bleibt, was die Genauigkeit von KI-Modellen deutlich erhöht.

Häufig gestellte Fragen

Wie geht das Tool mit gemischten Schriftsystemen um?

Es scannt den Text gezielt nach bekannten Verwechslungskandidaten (Homoglyphen) aus anderen Alphabeten und ersetzt diese durch die lateinische Entsprechung, während reguläre Zeichen unberührt bleiben.

Werden alle Homoglyphen-Varianten erfasst?

Das Tool deckt die am häufigsten für Betrug und Filterumgehung genutzten Zeichen ab. Es ist auf Glyphen optimiert, die in gängigen Webschriftarten visuell nicht vom Original zu unterscheiden sind.

Bleibt das Layout des Textes erhalten?

Ja. Die Konvertierung findet nur auf der Ebene der Zeichenkodierung statt. Leerzeichen, Zeilenumbrüche und die allgemeine Textstruktur werden nicht verändert.

Warum verursachen diese Zeichen Probleme in Datenbanken?

Für einen Computer sind ein lateinisches 'a' und ein kyrillisches 'а' zwei völlig unterschiedliche Datensätze, auch wenn sie für uns gleich aussehen. Das Tool vereinheitlicht diese Codes für eine fehlerfreie Verarbeitung.

Textwerkzeuge

Andere Tools, die Ihnen gefallen könnten

Text in Kursivschrift schreiben

Transformiert lateinische Zeichen in Unicode-Schreibschrift. Die Logik bewahrt Ziffern und Sonderzeichen für plattformübergreifende Kompatibilität.

Textstruktur visualisieren

Analysieren Sie Textkompositionen als Vektorgrafik. Token, Leerzeichen und Interpunktion werden in Farbschichten zerlegt. Exportieren Sie SVG-Modelle.

Textzeilen entpacken

Bereinigen Sie Textbloecke durch Mapping harter Umbrueche auf Trennzeichen. Die absatzbewusste Logik bewahrt die Struktur komplexer Datensaetze.

Zalgo-Effekt rueckgaengig machen

Bereinigen Sie korrupte Zeichenfolgen durch Entfernen kombinierender Unicode-Marken. Normalisieren Sie Glitch-Texte fuer Datenbanken und Parser.

Symbole im Text sortieren

Textzeichen nach UTF-8-Werten ordnen. Nutzen Sie Ignorierlisten und Duplikatentfernung zur Normalisierung komplexer Datensätze auf Zeilenebene.

Text drehen

Verschieben Sie Zeichen zyklisch in Strings. Reformatieren Sie mehrzeilige Strukturen zeilenweise. Normalisieren Sie Texte für komplexe Datenschemata.

ROT47-Text

Verschieben Sie druckbare ASCII-Zeichen um 47 Stellen. Map-Funktion fuer Zeichen 33-126 zur reversiblen Verschleierung gewaehrleistet Datenintegritaet.

ROT13-Text

Verschieben Sie Buchstaben um 13 Stellen im Alphabet. Sonderzeichen und Ziffern bleiben unberuehrt, waehrend die Gross- und Kleinschreibung gewahrt bleibt.

Text umschreiben

Normalisieren Sie Datensaetze mit Wortgrenzen-Logik und benutzerdefinierten Regeln. Nutzen Sie den zweiten Durchlauf zur Bereinigung von Leerzeichen.

Woerter im Text durch Ziffern ersetzen

Wandeln Sie Textzahlen in Ziffern um. Nutzen Sie Case-Sensitivity und Ganzwort-Matching zur Bereinigung komplexer Datensaetze vor der DB-Ingestion.

Vokale im Text ersetzen

Vokale via benutzerdefinierter Logik transformieren. Unterstützt Case-Sensitivity und rekursive Durchläufe zur technischen Datenbereinigung.

Leerzeichen im Text ersetzen

Wandeln Sie Tabs und Zeilenumbrueche in definierte Symbole um. Reduzieren Sie redundante Leerzeichen-Cluster zur Bereinigung technischer Datensaetze.

Buchstaben im Text ersetzen

String-Daten mittels benutzerdefinierter Regeln bereinigen. Nutzt Case-Sensitivity und zwei Durchläufe für komplexe Transformationen. Präzises Mapping sichern.

Konsonanten im Text ersetzen

Definieren Sie Substitutionsregeln fuer Konsonanten in komplexen Datensaetzen. Verarbeiten Sie Zeichenketten mit optionaler Case-Sensitivity und Logik-Iterationen.

Zeilenumbrueche im Text ersetzen

Transformieren Sie Textbloecke durch gezieltes Mapping von Umbruechen. Reduzieren Sie Redundanzen und validieren Sie Datenformate fuer den Export.

Ziffern im Text durch Woerter ersetzen

Wandeln Sie numerische Muster in Wortfolgen um. Isolierte Zahlen filtern und gemaess orthografischer Standards rekursiv verarbeiten.

Kommas im Text ersetzen

Sanitize Textdaten durch intelligentes Ersetzen von Kommas. Bewahrt Dezimaltrenner und bereinigt redundante Sequenzen fuer valide RFC-konforme CSV-Strukturen.

Textbuchstaben entfernen

Extrahieren Sie unerwünschte Zeichen aus Datensätzen. Die Logik unterstützt Case-Sensitivity und bereinigt redundante Leerzeichen für sauberen Output.

Schriftstil aus Text entfernen

Normalisieren Sie dekorative Unicode-Styles in lateinische Zeichen. Optimieren Sie die Barrierefreiheit und Datenbank-Kompatibilität durch Sanitization.

Anfuehrungszeichen aus Woertern entfernen

Validieren Sie Textdaten durch rekursives Entfernen von Quote-Zeichen. Mehrstufiges Stripping optimiert für CSV-Strukturen und Datenbank-Exporte.