Kódolás - Megjelenítési kódok

Article Index
Kódolás - Megjelenítési kódok
ASCII kód
Unicode
All Pages

 

Binárisan kódolt decimális:(BCD)

A BCD (Binary-Coded Decimal) a számítástechnikában és az elektronikus rendszerekben a decimális számok kódolási formája. A számokat bitek segítségével ábrázolja. Ezzel lényegesen egyszerűbbé válik a számok megjelenítése. Ennek ellenére több áramkörre van szüksége az aritmetikai számításokhoz. Ezen kívül tárolóterületet is veszítünk a bináris számábrázoláshoz képest. Egyszerűsége ellenére nagyon fontos kódolási módszer. Ezt bizonyítja az is, hogy a mai napig használatos kódolási forma. Tárhelyet ugyan veszítünk használata közben, de a szükséges tárhely mérete minimálisnak tekinthető. Egy számjegy általában 4 bitnek felel meg.Mivel a legtöbb számítógép az adatokat 8 bites byte-okban tárolja, két megoldás használatos arra, hogy a 4 bites BCD számjegyeket byte-okon tárolják:
minden számjegyet egy byte-on tárolnak, a második négy bit ekkor minden esetben 0000 (az EBCDIC kódnál), vagy 0011 ( ASCII kódnál)
két számjegyet tárolnak minden byte-on.

A tiszta bináris ábrázolással szemben, nagy   számok esetében a megjelenítés  egyszerűen csak nibble-nként (nibble= 4   egymást követő bit, vagyis egy fél byte)  történhet, azonos logika felhasználásával. A  tiszta binárisból decimálisba való konverzió bonyolult, és a szorzási vagy osztási műveletek használatát igényli, és pontosság is kérdéses. Több PC BIOS-a a dátum- és idő értéket BCD formában tárolja és kezeli, valószínűleg történeti okokból, (hogy elkerüljék a ASCII konverziót.)
A decimális számokat a kettes számrendszer elvén alakítja át bináris számjegyekké. A BCD csak a 0-9-ig terjedő számokat kezeli. Tehát a 10-es vagy annál nagyobb számokat nem képes egy számjegyként kezelni. A 10-est például lebontja két számjegyre. Jelen esetben egy 1-esre és egy 0-ra.

 

 


 

 

Az ASCII kódrendszer a legelterjedtebb kódrendszerek egyike. Olyannyira elterjedt, hogy majdnem minden számítógépes alkalmazás erre épül. Az operációs rendszerek is erre a kódrendszerre épülnek. Az ASCII kódrendszer továbblépését akadályozza, hogy 1 byte 1 karakterből épül fel. Az USA Szabványügyi Hivatala (American Standard Codes for Information and Interchange) 128-féle karaktert kódol 7 bites bináris kóddal, minden karakternek egy kettes számrendszerbeli szám felel meg.

Az ASCII kódtábla tartalmazza a karakterek jelét és kódszámát több számrendszerben, általában kettes, tízes és tizenhatos számrendszerekben.
A 8 bites kiterjesztése (Extended ASCII) 256 karakter kódját tartalmazza. Ebbe az első 128 szám (0-127) az eredeti ASCII kódot, a többi 128 pedig az egyéb karaktereket tartalmazza, mint például az ékezetes karakterek kódjait tartalmazza. A 128-255 számok felhasználásával sokféle nyelvet, nemzeti betűkészletet is figyelembe vevő kódtábla készült. (A teljes magyar karakterkészlet például a 852-es jelű kódlap tartalmazza, illetve Windows-ban az 1250-es.)
Fontos megkülönböztetni a karakterek kódját a karakterek képétől. A karakterek képe bitsorokkal van kódolva. A számítógép adatokat kezel, melyekhez meghatározott megfeleltetési rend szerint karaktereket rendel. A felhasználó csak a karakterhez rendelt glyph ábrákat látja.


Az ASCII olyan elterjedt, hogy a legtöbb operációs rendszer belső adatkezelése így épül fel, így a fejlődés megszorult (1byte 1karakter). Két karaktert kivéve tartalmazza az összes magyar karaktert. Ez a 2 karakter az ű és az ő.


kodolas_asciiPersze nem minden ország karakterkészlete volt megtalálható, így különböző kódolások és kódlapok jelentek meg, A változtatás csupán annyi, hogy a karakterek glyph képét alakították át az országban használt karakter formájára.

 


 

 

Az unicode eredetileg arra lett kitalálva, hogy az ASCII kódolás újításait kiváltsa,megszüntesse. Az ASCII 7 bites verziója a Pc-en 8 biten jelent meg.Ez azt jelenti , hogy 128 hely kihasználatlan maradt. Ide kerültek a különböző nyelvekhez igazított karakterkiegészítések (magyarhoz a ISO8859-2). Így a világon teljesen eltérő karakterek jelentek meg, amiket nem lehetet egymással kompatibilisen használni.(más ország karakterkészletében értelmetlenné válik)
  • kódpont (code point): az összes definiált Unicode-karakter közül hányadik az adott karakter.
  • kódolási forma (encoding form): a kódpont hordozta információt hogyan képezik le a számítógép által kezelt bitekre. Jelenleg három kódolási formát definiál a szabvány: UTF-8, UTF-16, UTF-32.

Az Unicode elsőnek 16 bitre akart bezsúfolni minden karaktert, azonban ez kevésnek bizonyult. Rájöttek, hogy a sokféle távol-keleti nyelvet egyszerre nem lehet ennyi kódponttal kielégíteni.

Egy karakter nem feltétlenül csak egyféle kódponttal írható le. Vannak ugyanis ún. kombinálódó karakterek, melyek módosítják az előttük álló kódpont jelentését. Így például az "á" karakter leírható magával az "á"-nak megfelelő kódponttal, és leírható az "a" karakter kódpontjának valamint a kombinálódó egyes hosszú ékezet kódpontjának egymásutánjával.
Két különböző kódpont is hordozhatja ugyanazt az írásképet (glyph). Legismertebb példa erre a latin kis "c" és az orosz kis "sz" írásképének egybeesése. (Ebből már biztonsági hiba is volt: a Microsoft kénytelen volt kiadni egy biztonsági riasztást, hogy nem minden "microsoft.com"-ra hivatkozó digitális tanúsítványban szabad megbízni –a csaló tanúsítvány természetesen a két "c" reprezentációjában tért el.)

A hozzászólás csak a regisztrált és bejelentkezett tagok számára engedélyezett!

Kódolás

Oldalainkat 299 vendég böngészi
Látogatóink száma: 2010.07.10 -től