Methodik
So konvertiert binaerkonverter.de zwischen Text und Binär
Diese Seite erklärt ehrlich, wie die Konvertierung zustande kommt. Spoiler: Es sind die im Browser eingebauten Web-APIs TextEncoder und TextDecoder, ergänzt um eine strikte 7-Bit-Prüfung für den ASCII-Modus. Jede Konvertierung läuft komplett lokal, ohne Server.
Wichtiger Hinweis
binaerkonverter.de ist ein technisches Konvertierungs-Tool für die Umwandlung zwischen Text und Binärcode. Es ist keine Verschlüsselung, keine Datensicherheits-Lösung und kein Authentifizierungs-Mechanismus. Wer sensible Daten schützen will, braucht echte Kryptographie (AES, RSA, Ed25519), nicht Binär-Encoding.
Zeichenkodierung
Das Tool unterstützt zwei Zeichenkodierungen, die in der Praxis dominieren:
- ASCII (American Standard Code for Information Interchange): 7-bit Festbreite, 128 Codepoints (0 bis 127). Ursprünglich als ANSI X3.4-1963 publiziert, überarbeitet zu X3.4-1986 und als RFC 20 standardisiert. Deckt das englische Alphabet, Ziffern, Satzzeichen und Steuerzeichen ab. Deutsche Umlaute (ä, ö, ü, ß) sind nicht enthalten und werfen in unserem ASCII-Modus einen sauberen Fehler.
- UTF-8 (Unicode Transformation Format, 8-bit): variable Länge von 1 bis 4 Bytes pro Codepoint, im ersten Byte ASCII-kompatibel (Codepoints 0 bis 127 bleiben 1 Byte). Spezifiziert in RFC 3629, parallel im Unicode Standard und ISO/IEC 10646. Heute auf über 98 Prozent aller Web-Seiten in Benutzung (W3Techs-Erhebung, fortlaufend aktualisiert). Der Buchstabe ä etwa ist Codepoint U+00E4 und wird in UTF-8 zur Byte-Folge C3 A4 (binär 11000011 10100100, also 2 Bytes).
Konvertierungs-Algorithmus
Die Umwandlung läuft über die Web-APIs TextEncoder und TextDecoder
des WHATWG Encoding Standard, die in allen modernen Browsern direkt verfügbar
sind. Der Text-zu-Binär-Weg in Worten:
-
new TextEncoder().encode(text)liefert eineUint8Arraymit den UTF-8-Bytes des Strings (im ASCII-Modus prüfen wir vorher viacharCodeAt(i) <= 127, sonst Fehler). -
Pro Byte wird mit
byte.toString(2).padStart(8, '0')ein 8-stelliger Binär-String erzeugt (führende Nullen aufgefüllt). - Die Binär-Strings werden mit dem gewählten Trennzeichen verbunden.
Die Rückrichtung Binär zu Text:
-
Das Eingabe-Feld wird per
replace(/[^01]/g, '')auf reine 0/1-Zeichen reduziert, alle Trennzeichen werden so ignoriert. - Die Länge muss durch 8 teilbar sein, sonst Fehler "Ungerade Bit-Zahl".
-
Jeder 8-Bit-Block wird per
parseInt(slice, 2)in einen Byte-Wert umgewandelt und in eineUint8Arraygeschrieben. -
new TextDecoder('utf-8', { fatal: true }).decode(bytes)macht daraus den finalen String. Dasfatal: true-Flag sorgt dafür, dass ungültige UTF-8-Sequenzen einen Fehler werfen, statt still ein Ersatzzeichen (U+FFFD) einzusetzen.
Trennzeichen
Die Binär-Ausgabe lässt sich mit vier Trennzeichen-Optionen formatieren:
- Leerzeichen (Standard):
"01000001 01000010"- gut lesbar pro Byte-Block. - Keine Trennung:
"0100000101000010"- kompakte Roh-Ausgabe. - Komma:
"01000001,01000010"- CSV-freundlich. - Zeilenumbruch: jedes Byte in eigener Zeile, gut für vertikale Inspektion.
Das gewählte Trennzeichen beeinflusst nur die Darstellung, nicht die Daten. Der
Eingabe-Parser im Binär-zu-Text-Modus ignoriert alles außer den Zeichen
[01], sodass alle vier Formate problemlos zurückgelesen werden.
Bits pro Gruppe
Zwei Gruppen-Größen stehen zur Verfügung:
- 8 Bit (Standard): 1 Byte pro Block. Das ist die natürliche Einheit des Computers seit dem System/360 (IBM, 1964) und der Standard in praktisch allen modernen Architekturen.
- 16 Bit: zwei Bytes je Block werden zu einer 16-stelligen Binärzahl zusammengefasst. Bei ungerader Byte-Anzahl wird mit einer führenden 0-Byte gepaddet, damit die Gruppierung sauber aufgeht.
Fehler-Fälle
Der Konverter wirft sauber abgegrenzte Fehler, damit du sofort siehst, was schief ging:
- ASCII-Modus + Umlaut: "Zeichen 'ä' ist nicht in ASCII (7-bit) verfügbar". Der Versuch, ein Zeichen mit Codepoint größer als 127 in 7-Bit-ASCII zu packen, schlägt deterministisch fehl. Lösung: in den UTF-8-Modus wechseln.
- Binär ungerade Bits: "Bit-Zahl muss durch 8 teilbar sein". Tritt auf, wenn die Eingabe nach Bereinigung nicht in volle Bytes zerlegt werden kann.
- Ungültige UTF-8-Sequenz: der fatal-decoder wirft, wenn ein Multi-Byte-Header (z.B. 11000011) nicht von der erwarteten Anzahl Continuation-Bytes (10xxxxxx) gefolgt wird. Das passiert in der Praxis, wenn ein Binär-String aus einer anderen Codierung stammt oder verstümmelt ist.
Datenschutz und Privatsphäre
Die gesamte Konvertierung läuft im Browser über JavaScript. Eingegebene Texte und
Binär-Sequenzen werden nicht an unsere Server übertragen, nicht gespeichert und nicht an
Dritte weitergegeben. Wer den Tab schließt, hinterlässt keine Spuren. Die einzige
persistente Information ist die Wahl der Codierung (ASCII oder UTF-8), die im
localStorage des Browsers liegt und jederzeit über die Browser-Einstellungen
gelöscht werden kann. Details im Datenschutz.
Was wir nicht machen
binaerkonverter.de ist keine Verschlüsselung. Binär ist nur eine andere Darstellung derselben Daten, kein Schutz vor Auslesen. Wer Geheimnisse schützen will, braucht echte Kryptographie (AES-256, RSA-4096, Ed25519) und ein sauberes Schlüssel-Management. Das Tool ist auch keine Komprimierung: die Binär-Darstellung benötigt im Gegenteil ein Vielfaches an Zeichen-Speicher gegenüber dem Ursprungstext.
Korrektur-Policy
Wenn dir ein Bug auffällt, etwa ein falsch berechneter Multi-Byte-Wert, ein nicht akzeptiertes Zeichen oder eine inhaltliche Unstimmigkeit in einem Ratgeber, schreib an info@akara-solutions.de. Bestätigte Korrekturen dokumentieren wir öffentlich auf Korrekturen.
Verantwortung
Für die Engine und ihre redaktionelle Pflege sind Mateusz Viola (Konvertierungs-Engine, Trennzeichen, localStorage), Jan-Tristan Rudat (Computing-Geschichte, Encoding-Standards, Entwickler-Ratgeber) und Eike-Christian Ramcke (DSGVO, Urheber- und Markenrecht) zuständig. Inhaltlich Verantwortlicher gem. § 18 Abs. 2 MStV ist Eike-Christian Ramcke, Geschäftsführer der AKARA Solutions GmbH (vollständige Angaben im Impressum).
Quellen
- RFC 3629 - UTF-8, a transformation format of ISO 10646. F. Yergeau, November 2003. Aktueller Internet-Standard für UTF-8.
- ANSI X3.4-1986 (R2017): Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII). Auch als RFC 20 verfügbar.
- The Unicode Consortium: The Unicode Standard, Version 15.1. Mountain View, 2023. Definitive Referenz für alle Codepoints.
- WHATWG: Encoding Living Standard. Spezifiziert TextEncoder und TextDecoder, fortlaufend aktualisiert.
- MDN Web Docs: TextEncoder und TextDecoder. Mozilla Developer Network, Browser-Kompatibilität und Beispiele.
- Donald E. Knuth: The Art of Computer Programming, Volume 1: Fundamental Algorithms. 3. Auflage, Addison-Wesley, 1997. Abschnitt 1.2.4 zu binärer Arithmetik und Stellenwertsystemen.