Codierung von Daten

Wie bereits oft erwähnt, basiert die Erzeugung von Daten, die anschließend von einem Computer verarbeitet werden, auf dem Binärsystem (“0” und “1”). Ein Computer besteht aus vielen Schaltwerken, dabei sorgen diese Schaltungen, dass jeder Tastendruck in definierte elektronische Impulse umgewandet wird, die vom Computer verarbeitet werden können.Da aber nur zwei verschiedene Schaltzustände existerien, bei der Datenerfassung aber alle notwendigen Buchstaben, Ziffern und Sonderzeichen benötigt werden, hat mein eine Codierung einführt, um aus Abfolgen von Zuständen verschiedene Zeichen zu erzeugen.
Die zwei hauptsächlichen Codoeriung sind der ASCII-Code (American Standard Code for Information Interchange, für DOS verwendet), der für 256 Zeichen eine Abfolge von elektronische Codierungen festlegt, und der ANSI-Code
(American National Standards Institute, für Windows-Anwendungen verwendet).

Der ASCII-Code

Der ASCII-Code (American Standard Code for Information Interchang, manchmal auch US-ASCII bezeichnet) ist eine 7-Bit-Zeichenkodierung, d.h. eine Abfolge von sieben Zuständen (“0” oder “1”) definiert ein Zeichen, d.h. diese Codierung wird dazu verwendet, um Zeichen, die mit Hilfe von elektrischen Signalen übertragen werden sollen, zu verschlüsseln um sie dann elektronisch zu weiterzuleiten. So ist z.B. der Buchstabe A die Abfolge 1000001. Da jedes Bit zwei Zustände bzw. Werte annehmen kann, gibt es 128 verschiedene Zeichen, so dass Sonderzeichen � wie z.B. die deutschen Umlaute Ä, Ö, Ü � nicht im ASCII-Zeichensatz enthalten sind.
Inzwischen gibt es aber auch den ASCII-Code, der eine 8-Bit-Zeichenkodierung ist, und eine Erweiterung des (alten) ASCII-Codes ist und somit auch Sonderzeichen codiert werden. Die Erweiterungen des 8-Bit ASCII-Codes sind weitgehend kompatibel mit dem 7-Bit-ASCII-Code, so dass alle (alten) definierten Zeichen auch in dem 8-Bit-ASCII-Code durch die gleichen Bitmuster codiert werden. So ist z.B. der Buchstabe A die Abfolge 01000001.

Der 7-Bit ASCII-Code lässt sich in folgende Bereiche einteilen:

  • Steuerzeichen (0-32)
  • Sonderzeichen (33-47)
  • Zahlen (48-57)
  • Sonderzeichen (58-64)
  • Großbuchstaben (65 – 90)
  • Sonderzeichen (91 – 96)
  • Kleinbuchstaben (97-122)
  • Sonderzeichen (123.-126)
  • Steuerzeichen (127)

Überlick über die ASCII-Zeichen (ohne die Steuerzeichen 0 -32)

 

Binärcode
ASCII Zeichen
0100001
!
0100010
0100011
#
0100100
$
0100101
%
0100110
&
0100111
0101000
(
0101001
)
0101010
*
0101011
+
0101100
,
0101101
0101110
.
0101111
/
0110000
0
0110001
1
0110010
2
0110011
3
0110100
4
0110101
5
0110110
6
0110111
7
0111000
8
0111001
9
0111010
:
0111011
;
0111100
<
0111101
=
0111110
>
0111111
?
1000000
@
1000001
A
1000010
B
1000011
C
1000100
D
1000101
E
1000110
F
1000111
G
1001000
H
1001001
I
1001010
J
1001011
K
1001100
L
1001101
M
1001110
N
1001111
O
1010000
P
1010001
Q
1010010
R
1010011
S
1010100
T
1010101
U
1010110
V
1010111
W
1011000
X
1011001
Y
1011010
Z
1011011
[
1011100
1011101
]
1011110
^
1011111
_
1100000
`
1100001
a
1100010
b
1100011
c
1100100
d
1100101
e
1100110
f
1100111
g
1101000
h
1101001
i
1101010
j
1101011
k
1101100
l
1101101
m
1101110
n
1101111
o
1110000
p
1110001
q
1110010
r
1110011
s
1110100
t
1110101
u
1110110
v
1110111
w
1111000
x
1111001
y
1111010
z
1111011
{
1111100
|
1111101
}
1111110
~
1111111
DEL

 

Der ANSI-Code

Der ANSI Code (American National Standards Institute) ist ein 8-Bit-Code, der insgesamt 256 Zeichen , also Buchstaben, Ziffern, Interpunktionszeichen und Sonderzeichen umfasst. Mit Hilfe dieses Codes wird in Windows-Programmen Text dargestellt. Der ANSI-Code  ist eine Weiterentwicklung bzw. Erweiterung des ASCII-Codes und hat sich inzwischen als Standard auf den Windows- und Macintosh-Betriebssystemen durchgesetzt. Sieht man in einem Tabellenwek nach, so ist den Positionen 0 bis 31 den Steuerzeichen vorbehalten, danach das Leerzeichen, darauf folgen Sonderzeichen, schließlich Großbuchstaben und Kleinbuchstaben, gefolgt von weiteren Sonderzeichen., wobei hierdurch gleich erkannt werden kann, dass der ANSI-Code dem deutlich bekannteren ASCII-Code sehr ähnlich ist.

Weitere Codes

  • Unicode: Der Unicode ist der größte und umfassendste Zeichensatz, ist auf einer 32-Bit-Codierung aufgebaut und umfasst so ca. 100000 verschiedene Zeichen.
  • UTF-8 (Unicode Transformation Format 8-Bit): Der UTF-8-Code ist in den ersten 128 Zeichen identisch mit ASCII-Code. Darüber hinaus ist es möglich, Zeichen mit einer variablen Länge zwischen 1 und 4 Byte (Folge von 8 Bit) darzustellen. Neben UTF-8, dass eher für europäische Sprachen optimiert ist, gibt es noch UTF-16, dass für asiatische Sprachen optimiert wurde. Dies liegt daran, dass asiatische Sprachen bis zu 4 Byte je Zeichen benötigen.

Codierung von Daten – Testfragen/-aufgaben

1. Was versteht man unter der Codierung von Daten?

Die Codierung von Daten ist der Prozess der Umwandlung von Daten in eine Form, die von Computern und anderen elektronischen Geräten verwendet oder bearbeitet werden kann.

2. Welche zwei Haupttypen von Daten werden in der Computertechnik verwendet?

Die zwei Haupttypen von Daten sind binäre und textuelle Daten.

3. Was ist eine Binärkodierung und worin besteht ihr Hauptvorteil?

Binärkodierung ist eine Methode zur Darstellung von Daten in falsch/ richtig, oder 0/1. Ihr Hauptvorteil liegt in ihrer Einfachheit und Universalität.

4. Was ist ASCII und wofür wird es verwendet?

ASCII, das American Standard Code for Information Interchange, ist ein Codierungsstandard, der zum Interpretieren und Darstellen von Text in Computern und anderen Geräten verwendet wird.

5. Wie unterscheidet sich Unicode von ASCII?

Unicode ist ein erweiterter Standard, der Zeichen aus nahezu allen bekannten Schriftsystemen codieren kann, während ASCII nur eine begrenzte Anzahl von Zeichen kodieren kann.

6. Was ist Datenkompression und wofür wird sie verwendet?

Datenkompression ist der Prozess der Reduzierung der Menge an speicherplatz, die benötigt wird, um Daten zu speichern oder zu übertragen. Sie wird verwendet, um die Effizienz der Datenspeicherung und Übertragung zu verbessern.

7. Was bedeutet Redundanz in Bezug auf Daten?

Redundanz bezieht sich auf zusätzliche oder sich wiederholende Daten, die nicht notwendig sind, um die ursprünglichen Daten zu rekonstruieren. Es kann zur Fehlererkennung und Fehlerkorrektur genutzt werden.

8. Was versteht man unter dem Begriff “Verschlüsselung”?

Verschlüsselung ist der Prozess der Umwandlung von Daten in eine Form, die nur von Personen gelesen werden kann, die den entsprechenden Schlüssel haben. Es wird hauptsächlich für den Datenschutz und die Sicherheit verwendet.

9. Was ist ein Codebuch in der Codierung?

Ein Codebuch ist eine Art Tabelle, die zur Übersetzung von Daten in ihre entsprechende codierte Form verwendet wird.

10. Wie werden Daten in Geräten wie CDs und DVDs codiert?

Daten auf CDs und DVDs werden durch eine Technik namens Pit and Land Coding codiert, bei der Daten als physische Vertiefungen (Pits) und Plateaus (Lands) auf der Oberfläche der Disc repräsentiert werden.

Autor: , Letzte Aktualisierung: 06. März 2024