Suchfunktion


 
 

Navigation

Inhaltsverzeichnis
Informatik

Startseite

Codierung von Daten

Allgemeines:
Wie bereits oft erwähnt, basiert die Erzeugung von Daten, die anschließend von einem Computer verarbeitet werden, auf dem Binärsystem ("0" und "1"). Ein Computer besteht aus vielen Schaltwerken, dabei sorgen diese Schaltungen, dass jeder Tastendruck in definierte elektronische Impulse umgewandet wird, die vom Computer verarbeitet werden können.Da aber nur zwei verschiedene Schaltzustände existerien, bei der Datenerfassung aber alle notwendigen Buchstaben, Ziffern und Sonderzeichen benötigt werden, hat mein eine Codierung einführt, um aus Abfolgen von Zuständen verschiedene Zeichen zu erzeugen.
Die zwei hauptsächlichen Codoeriung sind der ASCII-Code (American Standard Code for Information Interchange, für DOS verwendet), der für 256 Zeichen eine Abfolge von elektronische Codierungen festlegt, und der ANSI-Code
(American National Standards Institute, für Windows-Anwendungen verwendet). 
 

Der ASCII-Code:
Der ASCII-Code (American Standard Code for Information Interchang, manchmal auch US-ASCII bezeichnet) ist eine 7-Bit-Zeichenkodierung, d.h. eine Abfolge von sieben Zuständen ("0" oder "1") definiert ein Zeichen, d.h. diese Codierung wird dazu verwendet, um Zeichen, die mit Hilfe von elektrischen Signalen übertragen werden sollen, zu verschlüsseln um sie dann elektronisch zu weiterzuleiten. So ist z.B. der Buchstabe A die Abfolge 1000001. Da jedes Bit zwei Zustände bzw. Werte annehmen kann, gibt es 128 verschiedene Zeichen, so dass Sonderzeichen wie z.B. die deutschen Umlaute Ä, Ö, Ü nicht im ASCII-Zeichensatz enthalten sind. 
Inzwischen gibt es aber auch den ASCII-Code, der eine 8-Bit-Zeichenkodierung ist, und eine Erweiterung des (alten) ASCII-Codes ist und somit auch Sonderzeichen codiert werden. Die Erweiterungen des 8-Bit ASCII-Codes sind weitgehend kompatibel mit dem 7-Bit-ASCII-Code, so dass alle (alten) definierten Zeichen auch in dem 8-Bit-ASCII-Code durch die gleichen Bitmuster codiert werden. So ist z.B. der Buchstabe A die Abfolge 01000001. 

Der 7-Bit ASCII-Code lässt sich in folgende Bereiche einteilen:

  • Steuerzeichen (0-32)
  • Sonderzeichen (33-47)
  • Zahlen (48-57)
  • Sonderzeichen (58-64)
  • Großbuchstaben (65 - 90)
  • Sonderzeichen (91 - 96)
  • Kleinbuchstaben (97-122)
  • Sonderzeichen (123.-126)
  • Steuerzeichen (127)
 
      Überlick über die ASCII-Zeichen (ohne die Steuerzeichen 0 -32)
 
Binärcode
ASCII Zeichen
0100001
!
0100010
"
0100011
#
0100100
$
0100101
%
0100110
&
0100111
'
0101000
(
0101001
)
0101010
*
0101011
+
0101100
,
0101101
-
0101110
.
0101111
/
0110000
0
0110001
1
0110010
2
0110011
3
0110100
4
0110101
5
0110110
6
0110111
7
0111000
8
0111001
9
0111010
:
0111011
;
0111100
<
0111101
=
0111110
>
0111111
?
1000000
@
1000001
A
1000010
B
1000011
C
1000100
D
1000101
E
1000110
F
1000111
G
1001000
H
1001001
I
1001010
J
1001011
K
1001100
L
1001101
M
1001110
N
1001111
O
1010000
P
1010001
Q
1010010
R
1010011
S
1010100
T
1010101
U
1010110
V
1010111
W
1011000
X
1011001
Y
1011010
Z
1011011
[
1011100
\
1011101
]
1011110
^
1011111
_
1100000
`
1100001
a
1100010
b
1100011
c
1100100
d
1100101
e
1100110
f
1100111
g
1101000
h
1101001
i
1101010
j
1101011
k
1101100
l
1101101
m
1101110
n
1101111
o
1110000
p
1110001
q
1110010
r
1110011
s
1110100
t
1110101
u
1110110
v
1110111
w
1111000
x
1111001
y
1111010
z
1111011
{
1111100
|
1111101
}
1111110
~
1111111
DEL


Der ANSI-Code:
Der ANSI Code (American National Standards Institute) ist ein 8-Bit-Code, der insgesamt 256 Zeichen , also Buchstaben, Ziffern, Interpunktionszeichen und Sonderzeichen umfasst. Mit Hilfe dieses Codes wird in Windows-Programmen Text dargestellt. Der ANSI-Code  ist eine Weiterentwicklung bzw. Erweiterung des ASCII-Codes und hat sich inzwischen als Standard auf den Windows- und Macintosh-Betriebssystemen durchgesetzt. Sieht man in einem Tabellenwek nach, so ist den Positionen 0 bis 31 den Steuerzeichen vorbehalten, danach das Leerzeichen, darauf folgen Sonderzeichen, schließlich Großbuchstaben und Kleinbuchstaben, gefolgt von weiteren Sonderzeichen., wobei hierdurch gleich erkannt werden kann, dass der ANSI-Code dem deutlich bekannteren ASCII-Code sehr ähnlich ist. 
 

Weitere Codes:

  • Unicode: Der Unicode ist der größte und umfassendste Zeichensatz, ist auf einer 32-Bit-Codierung aufgebaut und umfasst so ca. 100000 verschiedene Zeichen.
  • UTF-8 (Unicode Transformation Format 8-Bit): Der UTF-8-Code ist in den ersten 128 Zeichen identisch mit ASCII-Code. Darüber hinaus ist es möglich, Zeichen mit einer variablen Länge zwischen 1 und 4 Byte (Folge von 8 Bit) darzustellen. Neben UTF-8, dass eher für europäische Sprachen optimiert ist, gibt es noch UTF-16, dass für asiatische Sprachen optimiert wurde. Dies liegt daran, dass asiatische Sprachen bis zu 4 Byte je Zeichen benötigen. 
.