Messze még az arab nyelvű Internet

Messze még az arab nyelvű Internet

2004. május 26. 22:25, Szerda
Az elmúlt évtizedben technikusok és nyelvészek egész sora dolgozott azon, hogy az arabok számára idegen latin írás helyett az arab webhelyek arabul jelenjenek meg, de még messze a munka vége.

Mindezidáig a webhelyek nyelve az angol és az általa felhasznált latin karakterek voltak használatosak. A legújabb adalék, a német umlaut is csak a német nyelvben használatos. Szakértők véleménye szerint az internet csak akkor lesz a kommunikáció valódi globális eszköze, ha ez a helyzet megváltozik.

Többnyelvű internetet kétféleképpen lehet létrehozni. Vagy megtanítunk angolul 4,5 milliárd embert szerte a világon, vagy integráljuk a világ nyelveit és nyelvjárásait az internet infrastruktúrájába. Az arab nyelv esetén ez forradalmasítaná az internet közel-keleti felhasználását és gombamód elkezdenének szaporodni az arab webhelyek. Az arab írást négy nagy nyelv használja, és több mint 30 országban ez a hivatalos írásforma. Az internetre átültetéséhez még legalább öt évre lenne szükség, de már így is sok időt elvesztegettek azzal, hogy nem jutottak egyezségre arról, melyik karakter lényeges és a megmaradtakat hogyan lehet leképezni számítógépes kódokkal.


Az Al-Jazeera weblapja - elsőnek a jobbra rendezés tűnhet fel

A dolog bonyolultabb, mint első pillantásra látszik, mert az alapvető karaktereken túl az arab írás opcionális mellékjeleket is használ, amelyek fontosak lehetnek. A qran nevű webhely jelenthet egyrészt házasságot, de magát a Koránt is attól függően, hogy az "a" betű felett van vagy nincs vonal. Tehát problémát jelenthet, ha valaki qran.com címmel nyit egy weboldalt, felrakja a netre házassági tanácsadással foglalkozó anyagait (köztük például a Káma Szutrát), majd ezután egy Koránt olvasni kivánó ember szent szövegek helyett szexuális poziturákat tartalmazó oldalakkal találkozik.

Az arab kormányok és a szakmai szervezetek még mindig nem tudják eldönteni, hogy melyek legyenek a megfelelő arab betűk. Mivel sok szereplő ül a tárgyalóasztalnál, nem tudnak közös szabványban megállapodni, és ráadásul több kereskedelmi vállalkozás a saját rendszerét szeretné érvényesíteni. "22 arab ország van és emellett más népek is (fárszi, urdu, pastu) az arab írást használják ezért éppen ideje, hogy megegyezzenek egymással." - nyilatkozta David Maher, a Public Interest Registry elnöke. "A magánvállalatok saját technológiáikat nyomják, amivel megzavarják az embereket, ezért késik a megegyezés."

Nagyobb probléma a többi ország vonakodása attól, hogy felülvizsgálják az egész Internet címzési rendszerét, hogy a több ezer nem angol karaktert használni tudja. A jelenlegi adatkezelő rendszer az ASCII kódot használja, ami elég kis karakterkészletet jelent. Időleges megoldást jelent a számítógép termináljait úgy beprogramozni, hogy a webhelyek címet a globális internet számára érthetően lefordítsák, ezzel azonban gyakorlati problémák vannak.

Charles Sha'ban, a Multilingual Internet Names Consortium tagja szerint ezek a problémák néhány millió dollár ráfordításával egy éven belül megoldhatók lennének, de a folytatásban közel sem volt enynire optimista: "A valódi megoldás azonban az lenne, ha a karakterek az IETF szabvány szerint közvetlenül bekerülnének az adatfolyamba, ez azonban még öt évet jelentene."

Listázás a fórumban 
Adatvédelmi beállítások