Thursday, September 06, 2007

യൂണിക്കോഡ് മലയാളവും പൈഡ്പൈപ്പറും - 4

നിങ്ങളുടെ bête noire (ഇതിന്റെ മലയാളം-വെറുക്കപ്പെട്ടവ-ഇപ്പോള്‍
മലയാളത്തില്‍ വളരെ പോപ്പുലര്‍ ആണ്!:) ആയ (നോണ്‍)ജോയ്നറുകളെക്കുറിച്ച്
സംസാരിക്കാം അല്ലേ?

വെറുക്കപ്പെട്ടവ തന്നെ. മലയാളത്തില്‍ ഇവയ്ക്ക് യാതൊരു കാര്യവുമില്ല.

ഇനി ആണവചില്ല് നടപ്പായാല്‍ത്തന്നെ ZWNJ ആവശ്യമായി
വരില്ലേ, കൂട്ടക്ഷരങ്ങളെ പിരിക്കേണ്ട സന്ദര്‍ഭങ്ങളില്‍. 'കര്‍ട്ടണ്‍
വാക്കുകളു'ടേതിനു സമാനമായ പ്രശ്നം അവിടേയും വരുന്നില്ലേ.

വരുന്നുണ്ട്. എന്നാല്‍ ഇപ്പോള്‍ അവ പരിഹരിക്കാനുള്ള മാര്‍ഗ്ഗങ്ങളില്ല.

പക്ഷെ അവയല്ലേ അടിയന്തിരമായി പരിഹരിക്കേണ്ടത്.
പ്രത്യേകിച്ചു് അവ നാമങ്ങളെയാണ് കൂടുതല്‍ നാനാവിധമാക്കുന്നത് എന്ന കാര്യം
പരിഗണിക്കുമ്പോള്‍.

നിങ്ങള്‍ക്ക് പറഞ്ഞാല്‍ മനസ്സിലാവില്ലേ. എല്ലാം കൂടി ഒരുമിച്ച് പരിഹരിക്കാന്‍ കഴിയില്ല. എനിക്ക് ഒരു ഉപമയാണു നാവില്‍ വരുന്നത്.

ഉപമ എനിക്കും തോന്നുന്നുണ്ട്. നമുക്ക് കാര്യത്തിലേയ്ക്ക് കടക്കാം. പരിമിതമായി ഇവയെ ഉപയോഗിക്കുന്നതില്‍ എന്താണു കുഴപ്പം?

നിങ്ങള്‍ എന്ത്
അബദ്ധമാണ് പറയുന്നത്? പരിമിതമായി എങ്ങനെ? ഇവയെ ഇടയ്ക്ക് വിതറിക്കൊണ്ട്
ഒരേപോലുള്ള സ്റ്റ്രിങ്ങുകള്‍ എത്രവേണമെങ്കിലും ഉണ്ടാക്കാമല്ലോ. IDNല്‍ ഇത്
വന്‍പ്രശ്നമാവില്ലേ?

IDN കാര്യത്തില്‍ തല്ക്കാലം യോജിക്കുന്നു. അത്
സുരക്ഷിതത്വത്തിനുവേണ്ടിയുള്ള ഒരു കോംപ്രമൈസ് ആയി കാണാവുന്നതാണ്. ലാറ്റിനെ
യൂണികെയ്സ് ആക്കുന്ന പോലെ.

നിങ്ങള്‍ ആളുകൊള്ളാമല്ലോ. അപ്പോള്‍ എന്റെ 'കര്‍ട്ടണ്‍ വാക്കു'കളുടെ കാര്യമോ? അവയെ വരയിട്ട് പിരിക്കാനോ? നടപ്പില്ല.

ഇവയെല്ലാം എത്രയെണ്ണം കാണും? അതും കൃത്രിമമായി
വാക്കുകള്‍ കൂട്ടിച്ചര്‍ത്ത് ഉണ്ടാക്കുന്നവ. മാത്രമല്ല 'കര്‍ട്ടണ്‍
വാക്കു'കള്‍ക്ക് സമാനമായി 'സദ്‌വാരം/സദ്വാരം' ഉണ്ടല്ലോ?

എന്നെ കുറ്റം
പറഞ്ഞിട്ട് ഇപ്പോള്‍ നിങ്ങളും വാക്കുകള്‍ക്കുവേണ്ടി റിസര്‍ച്ച്
നടത്തുകയാണല്ലോ. ഞാന്‍ ഇവയെ 'ദ്വാരവാക്കുകള്‍' എന്നു വിളിക്കും. Unicode
continuumത്തില്‍ വിള്ളല്‍ ഉണ്ടാക്കാന്‍ നോക്കുന്നതുകൊണ്ട്. എന്നിട്ട് ആകെ
എത്രയെണ്ണം കിട്ടി?

അതു ശരി. ഇതെന്താ മാഞ്ചെസ്റ്റര്‍ യുണൈറ്റഡും ചെല്‍സിയും തമ്മിലുള്ള
എറ്റുമുട്ടലോ? ഗോള്‍ അടിസ്ഥാനത്തില്‍ ഫലം നിര്‍ണ്ണയിക്കാന്‍?
അങ്ങനേയെങ്കില്‍ തോറ്റു മാഷേ, തോറ്റു. നമസ്കാരം.

നിങ്ങള്‍ക്ക് നല്ല നമസ്കാരം.