Magyar ékezetes karakterek az elektronikus levelezésben

Pásztor Miklós

E-mail: pasztor@sztaki.hu

Synopsis

Már MA van mód arra, hogy különböző operációs rendszerekben dolgozó emberek, INGYEN rendelkezésre álló eszközök használatával magyar ékezetes leveleket váltsanak egymással !

Kérem, ha bárkinek megjegyzése, kiegészítése van, - ha hibát talál akkor feltétlenül - írjon a fenti címre. Előre is köszönöm.

1.Bevezetés

A számítógépek az egyes betűket, írásjeleket binárisan kódolják. Rendszerint egy nyolcbites byte felel meg egy-egy írásjelnek. Sajnálatos módon nemcsak az egyes gyártók, hanem a szabványosítási szervezetek is többféle kódolást vezettek be. Számítanunk kell rá, hogy nem minden levelezőpartnerünkkel sikerül ékezetesen leveleznünk: lehet, hogy az üzenetben furcsán jelennek meg, vagy kimaradnak egyes részek, esetleg a terminálunk vagy levelezőprogramunk megbolondul egy levél olvasásakor. Van azonban szabványokon alapuló, egyre terjedő megoldás. Ez az írás azért készült, hogy segítsen az ilyen megoldások elterjesztésében, bevezetésében.

1.1. Karakterkód-készletek

Az angol ABC betűinek szokásos kódolása a hét bites ASCII kódolás. Nyolcbites változatban rendszerint úgy használatos, hogy a nyolcadik bit helyére nulla kerül. Ezt a kódolást a legtöbb számítógépes rendszer támogatja. Az ékezetes karakterek és speciális jelek azután olyan bitkombinációk lesznek, amelyekben a nyolcadik bit egyes. A legelterjedtebb ISO 8859 szabvány olyan karakterkészleteket tartalmaz, amelyekben a táblázat alsó fele, (vagyis a nyolcadik bitben nullát tartalmazó bitkombinációk) mind megegyeznek egymással, és a hétbites ASCII kódolással. A táblázat felső, nyolcadik bitében egyest tartalmazó részében különböző karakterkészleteket tartalmaznak, így különböző kultúrkörök igényét elégítik ki.

Az ISO 8859 által támogatott nyelvek, illetve ABC-k:

8859-1 Nyugateurópai, latin-amerikai nyelvek, szuahéli

8859-2 Keleteurópai nyelvek

8859-3 Délkeleteurópai nyelvek

8859-4 Skandináv nyelvek

8859-5 Cirill

8859-6 Arab

8859-7 Görög

8859-8 Héber

Az összes ékezetes magyar karaktert a 8859-2 kódkészlet tartalmazza, de legtöbbször a 8859-1 is megfelelő lehet (ld. 1.3).

1.2. MIME, az ékezetes karakterek átvitelének megoldása az Internet levelezésben

A nagy számítógéphálózatok kialakulásakor a levelezés angol nyelven folyt. Az angol ABC karakterkészlete a 7 bites ASCII, nem tartalmaz ékezetes betűket. Az ékezetes betűket olyan 8 bites kombinációval szokás jelölni, ahol a 8. bit egyes. A 7 bites kódkészlet 8 bites változata egyszerűen úgy áll elő, hogy a 8. bit 0-t, esetleg ellenőrző bitet tartalmaz. A levelek átvitelének Internet szabványa az RFC821 (SMTP) csak 7 bit átvitelét írja elő. Mint látható ez elegendő angol nyelvű szöveges információk átvitelére, de nem felel meg sem ékezetes - pl. magyar nyelvű - szövegeknél, sem bináris információknál, például programoknál, kódolt, formázott szövegeknél, táblázatoknál stb. Vannak ugyan olyan implementációk amik mind a 8 bitet átviszik, és az újabb szabvány, az ESMTP 8 bit átvitelét írja elő, de általában csak 7 bit vagyis az ékezetek nélküli ABC átvitelét várhatjuk el az Internet levelezésben.

Az Internet irányító testületei felismerték, hogy mennyi problémát okoz az, hogy nem lehet egyszerű, szabványos módon levélként átvinni ASCII szövegtől különböző információt. Ezért 1992-ben az IETF (Internet Engineering Task Force) egyik munkacsoportja megalkotta a MIME, (Multipurpose Internet Mail Extensions azaz Többcélú Internet Levelezési Kiegészítések) ajánlást. Ezzel megoldást adnak nem csak magyar vagy más ékezetes karakteres információk hanem pl. programok, kép, mozgókép, hang átvitelére is. Az RFC822/RFC821 keretein belül maradva, új borítékelemek és kódolási eljárás bevezetésével lehetővé válik több részes levelek átvitele, mely részek mindegyike különböző tartalmakat hordozhat. A szabványt úgy alkották meg, hogy minél egyszerűbb legyen a régi "buta" rendszerekkel való együttműködés, és hogy a felhasználó lehetőleg akkor is értelmes információhoz jusson, ha levelezőprogramja nem MIME kompatibilis. Ékezetes információk átvitelekor a MIME ajánlást követő levelezőprogramok a levél fejrészében közlik a kódkészletet, amiben a levelet írták (pl.ISO-8859-2). A szöveget magát a "quoted printable" nevű eljárással kódolják, ami csak az ékezetes karaktereket módosítja: a szöveg többi része változatlan marad, és így a levél olvasható lesz akkor is, ha a fogadó nem tudja dekódolni.

1.3. Néhány Magyarországon használatos kódkészletet preferálási sorrendben.

1.3.1. ISO 8859-2 más néven LATIN2

Jelenleg ez a kódkészlet, amit a legjobban ajánlhatunk. A legtöbb operációs rendszer támogatja. Közel áll több más ékezetes kódkészlethez. Nemzetközi, és magyar szabvány. Minden magyar ékezetes karaktert tartalmaz, és a kis és nagybetűk kódja közti távolság az egész kódtáblában megegyezik.

1.3.2. Microsoft 1250

A Microsoft Windows által használt kódkészlet. A magyar ABC betűit tekintve nem különbözik az ISO 8859-2 kódkészlettől. Ennek az a gyakorlati következménye, hogy pl. Microsoft Word-ben ékezetesen írt szöveg és ISO 8859-2 szöveg konverzió nélkül egymásba alakulhat.

1.3.3. ISO 8859-1 más néven LATIN1

Főleg Nyugateurópában használt, de lefed sok nyelvet. Szerencsés módon *majdnem* lehet használni magyar ékezetes karakterek ábrázolására, és azok a magyar ékezetes karaktek, amiket támogat *pontosan* ott helyezkednek el benne, ahol az ISO 8859-2 kódkészletben. A megegyező magyar ékezetes karakterek a következők: Á á É é Í í Ó ó Ö ö Ú ú Ü ü. A hosszú Ő-k helyett hullámos Ö-k, a hosszú Ü-k helyett kalapos Ü-k látszanak, tehát ezek a betűk is értelemzavar nélkül olvashatók ha LATIN2 kódolású szöveget LATIN1 berendezésen jelenítünk meg. Ha LATIN1 szöveget írunk, akkor érdemes arra figyelni, hogy ennek megfelelően adjuk meg hosszú Ö és Ü kódját, így szövegünket LATIN2 megjelenítés esetén konverzió nélkül, tökéletesen fogják tudni olvasni. Ez gyakorlatilag azt jelenti, hogy hosszú Ő gyanánt hullámos Ő-t (*nem* a kalapos Ő-t), hosszú Ű helyett kalapos Ű-t érdemes használni.

1.3.4. DEC MCS

Az ISO 8859-1 kódkészlet régebbi változata. A magyar ékezetes karakterek tekintetében pontosan megegyezik a LATIN1 kódkészlettel, tehát majdnem olyan kedvező mint a LATIN2.

1.3.5. ISO 10646 más néven Unicode kódkészlet

Az ISO és az Unicode konzorcium közösen 16 bites kódkészletet készített. A kódkészlet -legalább is az európai nyelveket érintő része könnyen származtatható az ISO 8859 kódkészletből. Ha az első byte 0,1,...,8, akkor sorrendben az ISO 8859-1, ISO 8859-2,...,ISO 8859-8 kódkészletnek megfelelő a második byte. Tehát LATIN2-ben írt szöveget egyszerűen úgy lehet ISO 10646-ra alakítani, hogy a 8 bites kódokat kiegészítjük 16 bitesekké, mindig egy 2-t tartalmazó byte-tal.

1.3.6. IBM PC 852 codepage

Az MS-DOS operációs rendszer által támogatott kódkészlet. Tartalmazza a magyar ékezetes karaktereket, de egészen más helyen. Az MS-DOS 6.22-től kezdődően az olvasható a leírásokban, hogy az MS-DOS támogatja az ISO 8859 *fontokat*. Ez csak annyit jelent, hogy a karakterek képe egyezik, de maga a kódolás nem. A 852 kódolásnál a kis és nagy ékezetes betűpárok között nem konstans a távolság, előnye viszont, hogy a kódkészlet tartalmazza az MS-DOS alatt megszokott téglalaprajzoló karakterek legnagyobb részét, a szokásos helyén. Az ilyen kódkészlet és LATIN2, LATIN1 DEC-MCS, Unicode között valamilyen programmal konvertálni kell. Ilyen konvertáló programot tartalmaz például Kosta Kostis PC-s ISO 8859 kódokat támogató programcsomagja (ibmxiso és isoxibm), és a SUNOS (dos2unix és unix2dos).

1.3.7. CWI és IBM PC 437 codepage

A 437 kódolás az MS-DOS eredeti, amerikai igények szerint készült kódkészlete. Ez is tartalmaz néhány magyar ékezetes karaktert:

á É é í ó ú Ö ö Ü ü.

Ezek a karakterek megegyeznek a CWI, 852 és 437 kódkészletben. A CWI kódolás az 852 kódolás előtt készült, hogy a mutatkozó hiányt pótolja. Igyekeztek a 437-hez észszerűen alkalmazkodni: néhány 437 kódkészletű karakter közel álló más ékezetes karakternek feleltethető meg, így kézenfekvő a kódolásuk. Ezek:

A' = A + angström I' = i + kalap /i + hátravessző O' = o + hátravessző

U' = u + hátravessző o" = o + kalap u" = u + kalap.

A hosszú nagy Ö és a hosszú nagy Ü esetén nincs kézenfekvő megfeleltetés, ezeket önkényesen választották. A hosszú nagy I-nek két megfeleltetése is kínálkozik, a kalapost a régebbi, a másikat az újabb CWI ajánlás követte. A hagyományos IIF programok (ELLA,PETRA,ELF) CWI kódolást használnak, de az ELLA konfigurálható más, pl. LATIN2 kódkészlet szerint is.

1.3.8. 7 bites ASCII

Kényszerűségből szorítkozhatunk az angol ABC betűire. Ekkor használhatunk u.n. repülő ékezetes kódolást. Ilyenkor az ékezetes betűket az ékezet nélküli változat után írt jellel egészítjük ki. Sajnos erre vonatkozóan többféle szokás is elterjedt. Az IIF körben leggyakrabban használt Huninet ajánlás a következő 3 jelet használja:

' : "

Tehát a 18 magyar ékezetes karakter Huninet ajánlás szerinti repülőékezetes alakja:

A' a' E' e' I' i' O' o' O: o: O" o" U' u' U: u: U" u"

2. Ékezetes karakterek kezelése egyes platformokon

A következőkben sorravesszük az elterjedtebb operációs rendszereket,platformokat. Gyakorlatilag az összes elterjedt platformon van lehetőség arra, hogy LATIN2 karakterkészlettel és MIME kódolással levelezzünk.

2.1. Ékezetek az MS-DOS operációs rendszerben

Megjelenítés:

Ahogy az 1. fejezetben már említettük, számunkra az 437 codepage és a 852 codepage érdekes. A 437 codepage az alapértelmezés MS-DOS környezetben. Ez nem tartalmazza az összes magyar ékezetes karaktert, de tartalmazza a téglalprajzoló karaktereket. A 852 codepage az összes magyar ékezetes karaktert tartalmazza, de "egzotikus" helyen, tartalmazza ezenkívül téglalaprajzoló karakterek jelentős részét is. Minden esetre ha 852 codepage van beállítva a gépünkön, akkor pl. a norton commander keret részei helyenként szokatlan képet mutatnak. Mint látható a LATIN2 kódkészletet, általában az ISO 8859 vagy az Unicode szabványt az MS-DOS nem támogatja "helyből". Ezért fejlesztette ki és bocsátotta nagylelkűen rendelkezésre Kosta Kostis a CPI nevű csomagot. Ennek kurrens változata e sorok írásakor 1.12, vagyis a csomagot a CPI112.ZIP fájl tartalmazza. A csomag lehetővé teszi, hogy az ISO-8859 szabványnak megfelelően jelenjenek meg a karakterek MS-DOS alatt, tehát nem csak a számunkra érdekes LATIN2 hanem pl. a cirill vagy a görög betűs szövegek megjelenítésére is módot ad. A csomag elérhető anonymous FTP-vel a helka.iif.hu gépen.

Terminál input:

MS-DOS alatt használhatunk magyar szabvány szerinti klaviatúrát, CP852 kódkészlettel. Ehhez a következőknek megfelelően kell megeditálni a CONFIG.SYS file-t:

COUNTRY=036, 852, C:COUNTRY.SYS

INSTALL=C:\DOS\NLSFUNC.EXE

INSTALL=C:\DOS\KEYB.COM

Az AUTOEXEC.BAT-ban pedig:

KEYB HU,852

Kosta Kostis programcsomagja tartalmaz olyan programot, (ISOKB852), amely a begépelt 852 kódokat LATIN2 karakterekké konvertálja.

Számos rezidens program áll rendelkezésre MS-DOS alatt, amelyek módot adnak arra, hogy átdefiniáljuk a klaviatúrát, és két vagy akár több klaviatúrakiosztás között váltsunk. Ilyen program pl. a KEYBGEN.

Ha nincs más megoldás, akkor az ALT gombot lenyomva és a numerikus keypad-on a karakter kódját begépelve mindig bevihetünk ékezetes karaktert.

2.2. Ékezetek Unix operációs rendszerekben

Ahhoz, hogy ékezetes karaktereket tudjunk Unix terminálunkon megjeleníteni, szükség van arra, hogy a teminál driver-nek megmondjuk, hogy 8 bites módon kezelje terminálunkat. Ezt az

stty cs8 -istrip -parenb

paranccsal tehetjük meg. Hogy ezt a parancsot ne kelljen minden egyes logonkor kiadni, célszerű a következő sorokat betenni pl. a .cshrc file-ba, (feltéve, hogy csh-t, vagy tcsh-t használunk):

.cshrc:

----------------------------------

tty -s

if ($status == 0) stty cs8 -istrip -parenb

----------------------------------

A különböző terminálok, X terminálok változatos módokat kínálnak arra, hogy hogyan adjunk meg a terminálról ékezetes karaktereket. Szerepe lehet a Compose és az Alt esetleg a Ctrl billentyűnek. A compose billentyű használatakor 3 karakter egymás utáni leütésével vihetünk be különleges karaktert. Pl. a nagy Á betűt így (idézőjelek közt a billentyű neve):

"Compose" + "A" + "'"

Az Alt gomb használatakor vele együtt kell megnyomnunk egy másik billentyűt. Rendszerint a nem alfanumerikus billentyűk (pl. a pont, kettőspont) azok, amik ékezetes karaktert adnak ilyen módon.

X terminálokon mód van arra, hogy a klaviatúra egyes gombjait, illetve annak Alt és Control billentyűs változatait újra definiáljuk. Erre használható segédeszköz az Xmodmap.

Ha PC-ről, kermit programot használva kapcsolódunk Unix rendszerhez, akkor a SET KEY parancs módot ad arra, hogy bármilyen billentyűt illetve Alt, Shift, és Ctrl kombinációt tetszőleges módon definiáljunk, és így egy vagy több karakter beadását érjük el. Tehát speciálisa ékezetes karaktereink is tetszés szerinti helyen lehetnek. Érdemes ezeket a definiciókat az MSKERMIT.INI file-ba betenni, hog automatikusan érvényre jussanak.

A PC-s karakterkészletek konvertálásához használatos program Unix környezetben a

dos2unix (MS-DOS kódkészlet ->ISO irány) és a unix2dos (ISO -> MS-DOS irány).

2.3. Ékezetek OpenVMS operációs rendszerben

A VMS "anyanyelve" a DEC-MCS karakterkészlet, ami - amint arról már szó volt -, az ISO-8859-1 egy másik neve. Ha ezt használjuk, akkor érdemes arra figyelni, hogy a hosszú ő gyanánt hullámos (tilde) o-t írjunk. Hosszú ű helyett pedig kalapos (circumflex) u-t.

A VMS rendszerekkel gyakran együtt használt VT sorozatú terminálokon az F3 (setup) gomb leütésével egy menüt kapunk, ahol számos tulajdonságot beállíthatunk. Itt állíthatjuk be a klaviatúra kiosztást is.

A VMS rendszereken gyakran használt az MX szabadon terjeszthető levelezőprogram. Ennek egy kellemes tulajdonsága, hogy a MIME kódolású ékezetes leveleket automatikusan dekódolja.

3. Ékezetes karaktereket támogató levelezőprogramok

Az itt felsorolt programok mind egymással és a nemzetközi szabványokkal kompatibilis módon támogatják a levelek TÖRZSÉBEN az ékezetes szövegek küldését. Megjegyzendő, hogy a levelek fejrészében, tehát pl. a Subject mezőben és a felhasználók nevének megadásakor, általában NEM használhatók csak a 7 bites ASCII karakterek.

3.1. Pegazus Mail, és WinPmail

A Pegazus más néven Pmail Ausztráliából származó szabadon terjeszthető PC-s levelezőprogram, alkotója David Harris. Az MTA SZTAKI-ban elkészült a program magyar nyelvű változata. Az angolul beszélő és a magyarul beszélő változat is elérhető anonymous ftp-vel a helka.iif.hu gépről. A programnak van MS Windows változata is (WinPmail). Használható NOVELL környezetben, vagy egy Unix/VMS géphez kapcsolódva, ahonnan POP (Post Office Protocol) segítségével olvashatja a leveleket. A Pegazus támogatja a MIME átvitelt, és a LATIN2 kódolást. Amikor levelet küldünk az F9 gomb megnyomásával a olyan menüt kapunk, ahol különböző paramétereket állíthatunk be. Itt állítsuk be a MIME atttribútumot. Erre a Pegazus MIME kódolással küldi a levelet. Megjegyzendő, hogy legközelebb nem lesz szükségünk újra beállítani ezt az attribútumot, mert a Pegazus megjegyzi a választásunkat, és legközelebb ez lesz az alapértelmezés. A konverziót a Pegazus konfigurációja határozza meg. Alapértelmezésben olyan konverziós táblát használ, ami a MIME karakterkészlet (pl. a LATIN2) és az amerikában használt PC kódkészlet, a CP437 között konvertál. Mivel nem minden karakternek van pontos mása, a konverzió nem lehet tökéletes. Ha PC-nken nem a CP437-es karaktrekészletet használjuk, hanem a CP852-t, vagy a LATIN2-t (pl. a Kostos féle csomag segítségével), akkor célszerű módosítani a konverziót. Ezt nem bonyolult megtenni. A Pegazus kezel egy sor u.n. resource fájlt. Ezekkel lehet módosítani a működését. Pl. meg lehet tenni, hogy egy véletlenszerű bölcs/vicces mondást illesszen minden kimenő levelünk végére, és a készletet, amiből választ magunk szerkeszthetjük. Hasonlóan meghatározhatjuk a MIME üzenetek dekódolásának táblázatát. A táblázatot azután két irányba fogja használni a program, vagyis a kimenő levelekben a helyi karakterkészletet a táblázatnak megfelelően ISO megfelelőjükre konvertálja. A fájl, amit módosítanunk kell a PM-LMTT.R

Miután elkészítettük egy új változatát, a

RESCOM PM-LMTT.R

paranccsal egy bináris, a Pegazus által olvasott PM-LMTT.RSC file keletkezik. Másoljuk a fájl oda, ahol a PMAIL.EXE fájl van. Ha ez egy többek által használt hálózati direktori, akkor minden felhasználó számára ez lesz érvényes. A felhasználók - ha szükséges - felülbírálhatják egy másik PM-LMTT.RSC fájl segítségével, amit a leveleik direktoriába (home mailbox) kell másolniuk.

A CP852-nek és a LATIN2-nek megfelelő PM-LMTT.R fájl elérhető anonymous ftp-vel a helka.iif.hu gépen.

3.2. ELLA

Az ELLA magyar fejlesztésű levelezőrendszer. Kliens-szerver modell szerint működik. A szerver eredetileg egy IBM nagygépen VM operációs rendszer alatt futó program volt, ma a helka.iif.hu gépen fut Unix alatt. A kliensek PC-n, MS-DOS alatt működnek. Az ELLA módot ad ékezetes levelezésre. Alapértelmezésben a CWI kódolást támogatja, de minden felhasználó definiálhat konverziós táblázatot, ami azt eredményezi, hogy a helyi gépen lehet például LATIN2 vagy CP852 kódban is dolgozni. Az ELLA esetén is - a Pegazushoz hasonlóan - csak a felhasználó felé konvertáló táblázatot kell megszerkeszteni, fordított irányban a program automatikusan konvertál, elkészítve a megadott táblázat inverzét. A konverziós táblázat szerkesztését az ELLA "Konfiguráció" menüpontjának "LocTab" alpontja alatt tehetjük meg.

A HELKA.IIF.HU-n futó ELLA központ segítségével az ELLA felhasználók MIME kompatibilis módon levelezhetnek Internet partnereikkel LATIN2 karakterkészlettel, mert a központ az ELLA kliensektől CWI kódban kapott üzeneteket LATIN2-be konvertálja, és MIME szabvány szerint továbbítja. A MIME üzeneteket pedig dekódolva és CWI szerint továbbítja a kliens programoknak.

3.3. Eudora

Az Eudora Macintoshon és MS-Windows alatt működő levelezőprogram. Van pénzért kapható, és szabadon terjeszthető változata is. Az ékezetes levelek MIME szabvány szerinti forgalmazását támogatja.

3.4. PINE

A PINE az Egyesült Államokból származó szabadon terjesztehető levelezőprogram és NEWS kliens. Van Unix, VMS sőt MS-DOS alatt működő változata is bár ez utóbbi még nem elég kiforrott. Mind támogatja a MIME szabvány szerinti átvitelt. A Pegazusnál a felhasználónak kell dönteni, hogy ékezetes levelét MIME kódolással akarje e küldeni, itt nincs is más lehetőség. A PINE a felhasználó bejelentkezési (login) könyvtárában található .pinerc inicializáló fájlt használja. Itt kell megadnunk a kódkészletet (ISO-8859-2), amit használunk. A PINE kellemes tulajdonsága, hogy menüvezérelt, használat közben kézikönyv nélkül tanulható a használata. Megjegyzendő , hogy a PINE alkalmas arra is, hogy távoli számítógépekről is olvashassunk leveleket TCP/IP fölött, IMAP protokoll segítségével.

4. Magyar ékezetek használatát elősegítő segédprogramok

4.1. Kermit

A Kermit népszerű fájlátviteli és terminál emulációs program. Az MS-DOS alatt működő változata sokféleképpen támogatja a különböző karakterkészletek közötti konverziót. Beállíthatjuk, hogy a helyi és a távoli karakterkészletet, mégpedig egymástól függetlenül fájlátvitel és terminál emuláció dolgában. A Kermit azután az egymásnak megfelelő karaktereket automatikusan konvertálja. Ha nincs pontos megfelelés, akkor a közelálló karakterrel helyettesít, például a karakter ékezet nélküli változatával. Íme két példa arra, hogy hogyan kell beállítani a Kermit paramétereket. Célszerű ezeket a beállításokat az MSKERMIT.INI fájlba beírni.

A PC-n IBM852 karakterkészlet, a távoli gépen LATIN2:

SET TER CHAR LATIN2

SET TRANSFER CP852

SET TER CODEPAGE 852

A PC-n LATIN2 karakterkészlet, a távoli gépen is LATIN2:

SET TER CHAR TRANSPARENT

SET TRANSFER CHAR TRANSPARENT

SET TER CODEPAGE 852

4.2. Kosta Kostis programcsomagja

Egy Németországban élő görög fiatalember készített egy programcsomagot, amely alkalmas arra, hogy ISO szabvány szerinti karakterkészletet használjunk MS-DOS alatt. A következőket valósította meg: ISO kompatibilis fontkészletek,

... mind a 8 ! Ezek a fontkészletek értelemszerűen nem tartalmazzák a téglalaprajzoló karakterket, de a csomag tartalmaz olyan parancsfile-t, amivel egyszerűen, gyorsan lehet váltani pl. CP852 és LATIN2 fontkészlet között, akár pl. egy editálás megszakítása nélkül.

Klaviatúra átdefiniáló programok:

Ezek lehetővé teszik, hogy ha pl. MS-DOS szerinti magyar klaviatúrát állítottunk be PC-nken, akkor a szabványos helyen beadott ékezetes karakter ne a CP852, hanem a LATIN2 szabvány szerinti legyen.

File konverziós programok:

Az ISO és az IBM kódkészletek közt lehet segítségükkel file-okat konvertálni.

5. Kódkészlet táblázat

              CWI         CP 852,       ISO-8859-2,    Huninet repülő  
                         MSZ 7795-3     MSZ 7795-3         ékezet
      
    Á          8f            b5             c1               A'        
    á          a0            a0             e1               a'        
    É          90            90             c9               E'        
    é          82            82             e9               e'        
    Í        8c/8d           d6             cd               I'        
    í          a1            a1             ed               i'        
    Ó          95            e0             d3               O'        
    ó          a2            a2             f3               o'        
    Ö          99            99             d6               O:        
    ö          94            94             f6               o:        
    Ő          a7            8a             d5               O"        
    ő          93            8b             f5               o"        
    Ú          97            e9             da               U'        
    ú          a3            a3             fa               u'        
    Ü          9a            9a             dc               U:        
    ü          81            81             fc               u:        
    Ű          98            eb             db               U"        
    ű          96            fb             fb               u"