Tuesday, December 18, 2007

Malayalam Rendering in GNU systems: My take - Part 1

There exist some issues regarding the rendering of Unicode Malayalam in GNU systems.Providing support for traditional and reformed scripts is one such issue.The problem compounds with numerous rendering mechanism in use for different toolkits and applications.It is heard that a unified method for rendering is in the offing.That would be a nice thing to happen.

Normally fonts are made either for the traditional script or for the reformed one.The shaping work done by the rendering engine goes haywire when we change from one script to another because the engine does not use the script variance information from the font metadata.So we can have a properly laid out Malayalam text for one script only; not for both.One can not see how uniscribe has solved this issue because it is not open.It even seems that MS doesn't care for Malayalam as there is no script-specific OT spec for it.And again! there is no details available about the version 2 of indic opentype spec used by Vista, yet.

Next, I will put forward my views regarding the OT features which can be used and are appropriate for Malayalam.

Thursday, November 22, 2007

'മീര' - 'രചന' ഫോണ്ട് വലുപ്പവ്യത്യാസം പരിഹരിക്കാന്‍

'രചന'യുടേയും 'മീര'യിടേയും അക്ഷരരൂപങ്ങളുടെ ഒരേ സൈസ് തെരെഞ്ഞെടുക്കമ്പോള്‍ പ്രകടമാകുന്ന വലുപ്പവ്യത്യാസം നേരത്തെ പരാമര്‍ശിച്ചിരുന്നല്ലോ.ഇത് പരിഹരിക്കാന്‍ Fontconfig-ന്റെ സജ്ജീകരണ ഫയലില്‍(ഓരോ യൂസര്‍ക്കും, ഹോമിലുള്ള .fonts.conf എന്ന ഫയല്‍) താഴെപ്പറയുന്നത് കൂട്ടിച്ചേര്‍ത്താല്‍ മതി.നേരത്തെത്തന്നെ ഇങ്ങനെയൊരു ഫയല്‍ ഉണ്ടെങ്കില്‍ പച്ചയില്‍ എഴുതിയ ഭാഗം ഒഴിവാക്കി ബാക്കി മാത്രം യഥാസ്ഥാനം ചേര്‍ത്താല്‍ മതിയാകും.

================ .fonts.conf ==================
<?xml version="1.0"?>
<!DOCTYPE fontconfig SYSTEM "fonts.dtd">
<fontconfig>
<!-- multiply the matrix of Meera font for solving size mismatch with Rachana-->
<match target="font">
<test name="family">
<string>Meera_g02</string>
</test>
<edit name="matrix" mode="assign">
<times>
<name>matrix</name>
<matrix><double>1.2</double><double>0</double>
<double>0</double><double>1.2</double>
</matrix>
</times>
</edit>
</match>
</fontconfig>
============================================

ഇപ്പോള്‍ വലുപ്പവ്യത്യാസം നന്നെ കുറവായിരിക്കും, ഇങ്ങനെ:


ഈ പോസ്റ്റിലെ പഴയ കമന്റുകള്‍ ഇവിടെ കാണാം

Sunday, November 18, 2007

Hinting of Anjali font with Fontforge

I tried to add some duplicate tags to the Kevin's AnjaliOldLipi font so that it can work with suruma patch.I was not completely successful with the previous version of fontforge but, could complete it with the new avatar of fontforge.In the process I found that fontforge was unable to read the hinting instructions.

The autohinting done by fontforge now gives a reasonably good appearance for the glyphs if antialiasing is enabled.The freetype rasterizer can work with this autohinted glyphs,too.The hand-hinted glyphs are better,anyway.

The first scrot shows Anjali with no auto hinting and the other shows Anjali autohinted using fontforge.






Wednesday, October 10, 2007

ഓപ്പണ്‍ ഓഫീസില്‍ മെച്ചപ്പെട്ട മലയാളം(ഡെബിയന്‍ എച്ച്)

ഓപ്പണ്‍ ഓഫീസ് ഇപ്പോള്‍ സിസ്റ്റത്തില്‍ നിന്നുള്ള icu ലൈബ്രറിയാണ് ഉപയോഗിക്കുന്നത്.പാന്‍ഗോയില്‍ ചെയ്തതുപോലെയുള്ള പാച്ച് icu-വിലും ചെയ്തപ്പോള്‍ മലയാളം കാഴ്ചയ്ക്ക് മെച്ചപ്പെട്ടിട്ടുണ്ട്.പാച്ച് ചെയ്ത icu-ലൈബ്രറി(ഡെബിയന്‍ എച്ചിനുള്ളത്), libicu36 പാക്കേജ് ഇവിടെ നിന്ന് ഡൌണ്‍ലോഡ് ചെയ്യാം.

ഇത് icu പാച്ച് ചെയ്തതിനുശേഷമുള്ള സ്ക്രീന്‍ഷോട്ട്.


Powered by ScribeFire.

Friday, September 21, 2007

രചന-മീര ഫോണ്ട് താരതമ്യം

രചനയുടേയും മീരയുടേയും ഒരു വെബ് താരതമ്യച്ചിത്രം ആണ് വലത്ത്.ബേസ് ലൈനിന് താഴെ വരുന്ന അക്ഷരങ്ങള്‍ മുറിഞ്ഞുപോകാതിരിക്കാനായി Ascent/Descent ല്‍ വ്യത്യാസം വരുത്തിയതുകൊണ്ട് അക്ഷരങ്ങള്‍ പൊതുവെ ചെറുതായിരിക്കും.

മീര:
Ascent = 560, Descent = 440, for Em size 1000

രചന:
Ascent = 800, Descent = 200, for Em size 1000

അഞ്ജലി:
Ascent = 800, Descent = 200, for Em size 1000

അതിനാല്‍ മീര ഉപയോഗിക്കുമ്പോള്‍ യോജിച്ച വലുപ്പത്തിലേയ്ക്ക് scale ചെയ്യേണ്ടതായുണ്ട്.മുകളിലത്തെ താരതമ്യത്തില്‍ നിന്ന് വലുപ്പം എതാണ്ട് 20% വര്‍ദ്ധിപ്പിക്കേണ്ടിവരുമെന്ന് മനസ്സിലാക്കാം.വരികള്‍ തമ്മിലുള്ള അകലം എതാണ്ടത്രയും തന്നെ കുറയ്ക്കുന്നതും നന്ന്.

Meera_g01.ttf ഉം Meera_g02.ttf ഉം ഇവിടെ നിന്ന് കിട്ടും.Meera_w01 smcയുടെ savanna താളില്‍ പ്രതീക്ഷിക്കാം.

Wednesday, September 12, 2007

സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്യദിനാഘോഷം തൃശൂരില്‍

സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറും മലയാളം കമ്പ്യൂട്ടിങ്ങും: സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്യ ദിനാഘോഷം

സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറും മലയാളം കമ്പ്യൂട്ടിങ്ങും
സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്യ ദിനാഘോഷം
സെപ്റ്റംബര്‍ 14-15, ചേംബര്‍ ഓഫ് കൊമേഴ്‌സ് ഹാള്‍, തൃശ്ശൂര്‍

പ്രിയ സുഹൃത്തുക്കളെ,

നമ്മുടെ നിത്യജീവിതത്തിന്റെ ഭാഗമായിക്കൊണ്ടിരിക്കുന്ന വിവരസാങ്കേതിക
വിദ്യയുടെ മാനുഷികവും ജനാധിപത്യപരവുമായ മുഖവും മനുഷ്യധിഷണയുടെ
പ്രതീകവുമാണ് സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറുകള്‍. വിജ്ഞാനത്തിന്റെ സ്വതന്ത്ര
കൈമാറ്റത്തിലൂടെ പരമ്പരകളായി നാം ആര്‍ജ്ജിച്ച കഴിവുകള്‍ ഡിജിറ്റല്‍
യുഗത്തില്‍ ചങ്ങലകളും മതിലുകളും ഇല്ലാതെ ഏവര്‍ക്കും ലഭ്യമാക്കുന്നതിനും
അത് ലോകപുരോഗതിയ്ക്ക് വേണ്ടി ഉപകാരപ്പെടുത്താനും സ്വതന്ത്ര
സോഫ്റ്റ്‌വെയറുകള്‍ നിലകൊള്ളുന്നു. സ്വതന്ത്രമായ ഈ വിവര വികസന
സമ്പ്രദായത്തിന്റെ അടിത്തറ, ഓരോ സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറുകളും വാഗ്ദാനം
ചെയ്യുന്ന മനസ്സിലാക്കാനും, പകര്‍ത്താനും നവീകരിയ്ക്കാനും, പങ്കു
വെയ്ക്കാനുമുള്ള സ്വാതന്ത്യമാണ്. ഈ സ്വാതന്ത്ര്യങ്ങളെ
ജനമദ്ധ്യത്തിലേയ്ക്ക് കൊണ്ടുവരാനും പ്രചരിപ്പിക്കാനും ഓരോ വര്‍ഷവും
സെപ്റ്റംബര്‍ 15 സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്ര്യ ദിനമായി ലോകമെങ്ങും
ആഘോഷിയ്ക്കപ്പെടുന്നു.

ഈ വര്‍ഷത്തെ സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്ര്യ
ദിനം നാം സ്വതന്ത്ര മലയാള ഭാഷാ കമ്പ്യൂട്ടിങ്ങ് എന്ന പ്രമേയത്തെ
ആസ്പദമാക്കി കൊണ്ടാടുന്നു. മലയാള ഭാഷയെ അതിന്റെ തനിമയും സൌന്ദര്യവും
ചോരാതെ അതിന്റെ ഡിജിറ്റല്‍ ഭാവിയിലേക്കു നയിയ്ക്കുവാന്‍ വേണ്ടി
വികസിപ്പിക്കപ്പെട്ട സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറുകള്‍ പരിചയപ്പെടുന്നതിനും,
ഭാഷാ കമ്പ്യൂട്ടിങ്ങിന്റെ ഭാവി, അതു നേരിടുന്ന വെല്ലുവിളികള്‍ എന്നിവ
ചര്‍ച്ച ചെയ്യുന്നതിനുമായി ഈ വരുന്ന സെപ്റ്റംബര്‍ 14-15 തിയ്യതികളില്‍
തൃശ്ശൂര്‍ ചേംബര്‍ ഓഫ് കൊമേഴ്‌സ് ഹാളില്‍ നാം സമ്മേളിക്കുന്നു.


നിരവധി സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറുകള്‍ മലയാളഭാഷയ്ക്കു സമ്മാനിച്ച
സന്നദ്ധപ്രവര്‍ത്തകരുടെ കൂട്ടായ്മയായ സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ് ആ
സോഫ്റ്റ്‌വെയറുകള്‍ മലയാളികള്‍ക്കു മുന്നില്‍ അവതരിപ്പിക്കുന്നു. കൂടാതെ
സെപ്റ്റംബര്‍ 15 -നു മലയാളം കമ്പ്യൂട്ടിങ്ങ് എക്സിബിഷനും ഭാഷ വിദഗ്ധര്‍
പങ്കെടുക്കുന്ന മലയാള ഭാഷയുടെ കമ്പ്യൂട്ടിങ്ങ് ഭാവിയെ പറ്റിയുള്ള വിവിധ
ചര്‍ച്ചകളും ഉണ്ടായിരിയ്ക്കും.

പങ്കെടുക്കുക, വിജയിപ്പിക്കുക... ഏവര്‍ക്കും സ്വാഗതം

സെപ്റ്റംബര്‍ 14 വെള്ളിയാഴ്ച
വൈകീട്ട് 3 മണിമുതല്‍.
സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്ര്യദിന പരിപാടികളുടെ ഉദ്ഘാടനവും മലയാളം പാക്കേജുകളുടെ പ്രകാശനവും

സെപ്റ്റംബര്‍ 15 ശനി
9.30 മുതല്‍
മലയാളം കമ്പ്യൂട്ടിങ്ങ് എക്സിബിഷനും ചര്‍ച്ചകളും

പുറത്തിറക്കുന്ന സോഫ്റ്റ്‌വെയര്‍ പാക്കേജുകള്‍

1. മീര മലയാളം യൂണിക്കോഡ് ഫോണ്ട്
2. ഗ്നു ആസ്പെല്‍ സ്പെല്‍ ചെക്കര്‍
3. ടക്സ് ടൈപ്പ് മലയാളം ടൈപ്പിങ്ങ് പഠനസഹായി
4. സ്വനലേഖ മലയാളം ശബ്ദാത്മക നിവേശക രീതി
5. ധ്വനി - മലയാളം ടെക്സ്റ്റ് ടു സ്പീച്ച്
6. ശാരിക - മലയാളം സ്പീച്ച് ടു ടെക്സ്റ്റ്
7. ലളിത - നിവേശക രീതി



Powered by ScribeFire.

Saturday, September 08, 2007

കാല്, ചെരിപ്പു്, ചില്ലു്

കാലില്‍ ആകെ അഞ്ചു വിരലുകള്‍
ഒരു വിരല്‍ വലുത്,
കണ്ടാല്‍ രണ്ടുചേര്‍ന്നൊന്നായപോലെ
ഈ വൃത്തികേട് ഞാനെങ്ങനെ മാറ്റും, ശിവനേ!

മാറ്റി ഞാന്‍ മാറ്റി, അവയെ.
ഒന്നാന്തരമൊരു ഷൂ വാങ്ങിക്കേറ്റി
ഒന്നായ്‌മറച്ചൂ ഞാനവയെ.
ഹായ്! ഇപ്പോഴെന്തു ഭംഗി കാണാന്‍!

'ര്‍' ചില്ല്, രേഫത്തിനും റകാരത്തിനും ഉപയോഗിക്കുന്നു എന്ന് പറഞ്ഞാണ് ആണവചില്ലുവാദികള്‍ അതിനെ ഒരു കോഡ് പോയിന്റില്‍ ഒതുക്കാന്‍ ശ്രമിക്കുന്നത്. ഇപ്പോള്‍ പറയുന്ന ന്യായം Ambivalence ആണെന്ന്.

അപ്പോള്‍ സോര്‍ട്ടിങ്ങിലോ? അവിടെ അതേ Ambivalence വെച്ച് 'ര്‍'നെ എവിടെ ഉറപ്പിക്കും?

അതായത് തല്ക്കാലം ഇത് കാര്‍പ്പറ്റിനടിയിലേയ്ക്ക് തള്ളുക. സോര്‍ട്ടിങ്ങിന് ആരെങ്കിലും പൊക്കിനോക്കുമ്പോള്‍ അവര്‍ നേരിട്ടോട്ടെ എന്നായിരിക്കും പിന്നെ പറയുന്ന ന്യായം.

Thursday, September 06, 2007

യൂണിക്കോഡ് മലയാളവും പൈഡ്പൈപ്പറും - 4

നിങ്ങളുടെ bête noire (ഇതിന്റെ മലയാളം-വെറുക്കപ്പെട്ടവ-ഇപ്പോള്‍
മലയാളത്തില്‍ വളരെ പോപ്പുലര്‍ ആണ്!:) ആയ (നോണ്‍)ജോയ്നറുകളെക്കുറിച്ച്
സംസാരിക്കാം അല്ലേ?

വെറുക്കപ്പെട്ടവ തന്നെ. മലയാളത്തില്‍ ഇവയ്ക്ക് യാതൊരു കാര്യവുമില്ല.

ഇനി ആണവചില്ല് നടപ്പായാല്‍ത്തന്നെ ZWNJ ആവശ്യമായി
വരില്ലേ, കൂട്ടക്ഷരങ്ങളെ പിരിക്കേണ്ട സന്ദര്‍ഭങ്ങളില്‍. 'കര്‍ട്ടണ്‍
വാക്കുകളു'ടേതിനു സമാനമായ പ്രശ്നം അവിടേയും വരുന്നില്ലേ.

വരുന്നുണ്ട്. എന്നാല്‍ ഇപ്പോള്‍ അവ പരിഹരിക്കാനുള്ള മാര്‍ഗ്ഗങ്ങളില്ല.

പക്ഷെ അവയല്ലേ അടിയന്തിരമായി പരിഹരിക്കേണ്ടത്.
പ്രത്യേകിച്ചു് അവ നാമങ്ങളെയാണ് കൂടുതല്‍ നാനാവിധമാക്കുന്നത് എന്ന കാര്യം
പരിഗണിക്കുമ്പോള്‍.

നിങ്ങള്‍ക്ക് പറഞ്ഞാല്‍ മനസ്സിലാവില്ലേ. എല്ലാം കൂടി ഒരുമിച്ച് പരിഹരിക്കാന്‍ കഴിയില്ല. എനിക്ക് ഒരു ഉപമയാണു നാവില്‍ വരുന്നത്.

ഉപമ എനിക്കും തോന്നുന്നുണ്ട്. നമുക്ക് കാര്യത്തിലേയ്ക്ക് കടക്കാം. പരിമിതമായി ഇവയെ ഉപയോഗിക്കുന്നതില്‍ എന്താണു കുഴപ്പം?

നിങ്ങള്‍ എന്ത്
അബദ്ധമാണ് പറയുന്നത്? പരിമിതമായി എങ്ങനെ? ഇവയെ ഇടയ്ക്ക് വിതറിക്കൊണ്ട്
ഒരേപോലുള്ള സ്റ്റ്രിങ്ങുകള്‍ എത്രവേണമെങ്കിലും ഉണ്ടാക്കാമല്ലോ. IDNല്‍ ഇത്
വന്‍പ്രശ്നമാവില്ലേ?

IDN കാര്യത്തില്‍ തല്ക്കാലം യോജിക്കുന്നു. അത്
സുരക്ഷിതത്വത്തിനുവേണ്ടിയുള്ള ഒരു കോംപ്രമൈസ് ആയി കാണാവുന്നതാണ്. ലാറ്റിനെ
യൂണികെയ്സ് ആക്കുന്ന പോലെ.

നിങ്ങള്‍ ആളുകൊള്ളാമല്ലോ. അപ്പോള്‍ എന്റെ 'കര്‍ട്ടണ്‍ വാക്കു'കളുടെ കാര്യമോ? അവയെ വരയിട്ട് പിരിക്കാനോ? നടപ്പില്ല.

ഇവയെല്ലാം എത്രയെണ്ണം കാണും? അതും കൃത്രിമമായി
വാക്കുകള്‍ കൂട്ടിച്ചര്‍ത്ത് ഉണ്ടാക്കുന്നവ. മാത്രമല്ല 'കര്‍ട്ടണ്‍
വാക്കു'കള്‍ക്ക് സമാനമായി 'സദ്‌വാരം/സദ്വാരം' ഉണ്ടല്ലോ?

എന്നെ കുറ്റം
പറഞ്ഞിട്ട് ഇപ്പോള്‍ നിങ്ങളും വാക്കുകള്‍ക്കുവേണ്ടി റിസര്‍ച്ച്
നടത്തുകയാണല്ലോ. ഞാന്‍ ഇവയെ 'ദ്വാരവാക്കുകള്‍' എന്നു വിളിക്കും. Unicode
continuumത്തില്‍ വിള്ളല്‍ ഉണ്ടാക്കാന്‍ നോക്കുന്നതുകൊണ്ട്. എന്നിട്ട് ആകെ
എത്രയെണ്ണം കിട്ടി?

അതു ശരി. ഇതെന്താ മാഞ്ചെസ്റ്റര്‍ യുണൈറ്റഡും ചെല്‍സിയും തമ്മിലുള്ള
എറ്റുമുട്ടലോ? ഗോള്‍ അടിസ്ഥാനത്തില്‍ ഫലം നിര്‍ണ്ണയിക്കാന്‍?
അങ്ങനേയെങ്കില്‍ തോറ്റു മാഷേ, തോറ്റു. നമസ്കാരം.

നിങ്ങള്‍ക്ക് നല്ല നമസ്കാരം.

Tuesday, September 04, 2007

യൂണിക്കോഡ് മലയാളവും പൈഡ്പൈപ്പറും - 3

ചില്ലുകളെപ്പറ്റി എന്റെ അഭിപ്രായം പറയട്ടെ. പ്രധാനപ്രശ്നം 'ര/റ'യുടെ ചില്ലിന്റെ കാര്യമല്ലേ? ('കര്‍ട്ടണ്‍ വാക്കു'കളുടെ കാര്യം ജോയ്നര്‍ കുരിശുകളെപ്പറ്റി പറയുമ്പോള്‍ പറയാം). രേഫവും
റകാരവും ചില്ലിന്റെ കാര്യത്തില്‍ മാത്രമല്ല സന്ദിഗ്ദത ഉണ്ടാക്കുന്നത്.
കൂട്ടക്ഷരങ്ങളില്‍ അവ മുന്‍പും പിന്‍പും വരുമ്പോഴും അവയെ എങ്ങനെ
സമീപിക്കണം എന്ന കാര്യത്തിലും വ്യക്തത ഉണ്ടാക്കേണ്ടതല്ലേ. കേരളപാണിനി
പറയുന്നതു പോലെ പിരിച്ചെഴുതുമ്പോള്‍ മാത്രം അവയെ വേറെയായി കണ്ടാല്‍
പോരേ. ഇതില്‍ 'ര ' ആണ് 'राष्ट्र' എന്നെല്ലാം എഴുതുമ്പോള്‍
ഉപയോഗിക്കുന്നത്. അതു തന്നെ മലയാളത്തിലും സ്വീകരിച്ചാല്‍ പോരേ.
പരിഹരിക്കുയാണെങ്കില്‍ ഇവരണ്ടും ഒരുമിച്ച് പരിഹരിക്കുന്നായിരിക്കും ഭംഗി.
ഇതിനെപ്പറ്റി ഞാന്‍ വിക്കിയില്‍ വിശദമായി ദാ അവിടെ പറഞ്ഞിട്ടുണ്ട്. കൂടാതെ മറ്റു ചില്ലുകളും പ്രശ്നമുണ്ടാക്കുന്നുണ്ട്.
അതു പറഞ്ഞപ്പോള്‍ വിക്കി. നിങ്ങള്‍ ആളു കൊള്ളാം! മറ്റു ചില്ല് എന്നു പറഞ്ഞപ്പോള്‍ 'ല്‍'ന്റെ കാര്യമാകും ഉദ്ദേശിച്ചത്.
അതെ. അതുമൊരു പ്രധാന പ്രശ്നമാണ്.
തകാരത്തിന്റയും കൂടി ചില്ലാണ് 'ല്‍' എങ്കില്‍ 'ക്യാ ബാത് ഹെ ഭായ്' എന്നത് 'ക്യാ ബാല്‍ ഹെ ഭായ്' ആകും. കാര്യം മുടിയാകും. കേരളപാണിനി
പറയുന്നത് ഇങ്ങനെ: "സംസ്കൃതത്തിലെ തകാരത്തെ സ്വരം പരമാകാതെ ഇരിക്കുമ്പേള്‍
ലകാരമായിട്ടാണ് ഭാഷയില്‍ ഉച്ചരിക്കുക പതിവ്. അതിനാലാണ് ലകാരചില്ലിന്റെ
ചിഹ്നം തകാരത്തില്‍ നിന്ന് ഉണ്ടായതായിട്ടു കാണുന്നത്"(NBS, 1991, pp. 115). ഇന്‍ഡിക് ലിസ്റ്റില്‍ ഒരു ചേച്ചി പറഞ്ഞത് 'ത' യുടേയും ചില്ലു കിട്ടാന്‍ വേണ്ടി Input Method ലെ സീക്വെന്‍സ് തേടി അലഞ്ഞു എന്നാണ്.('ത' + ചന്ദ്രക്കല + 'ധ' ടൈപ്‌ചെയ്തിട്ട് 'ഝ' കിട്ടുന്നില്ല എന്നു പറയാത്തത് ഭാഗ്യം!)
അവരുടെ വാദങ്ങള്‍ അംഗികരിക്കപ്പെട്ടു.
അതെ. ഇത്തരക്കാരുടെ വാക്കുളാണ് Unicode മുഖവിലയ്ക്കെടുക്കുന്നത്. അടുത്തത് ജോയ്നര്‍ കുരിശുകളെപ്പറ്റിയായാലോ?
ആവാം. നിങ്ങള്‍ക്ക് നല്ല നമസ്കാരം.

Sunday, September 02, 2007

യൂണിക്കോഡ് മലയാളവും പൈഡ്പൈപ്പറും - 2

അതായത് ഈ 'നന്മ'യും 'നന്‍മ'യും ഒരേ വാക്കിന്റെ വ്യത്യസ്ത സ്പെല്ലിങ്ങ് ആണെന്നു പറയുന്നുണ്ടല്ലോ?
അതേയതേ
ഇവ രണ്ടും തമ്മില്‍ സ്പെല്ലിങ്ങില്‍ മാത്രമാണ് വ്യത്യാസം. 'color' ഉം
'colour'ഉം പോലെ. അതായത് A color is a colour is a color is a colour.
ഓ! അത്രയ്ക്കു കളര്‍ വേണ്ട. പക്ഷെ,
ഞാന്‍ ധരിച്ചിരിക്കുന്നത് മലയാളം എഴുതുന്നതുപോലെ വായിക്കപ്പെടുന്നതിനാല്‍
('ഹ്മ', 'ഹ്ന' എന്നീ അപവാദങ്ങള്‍ ഒഴിവാക്കിയാല്‍) സ്പെല്ലിങ്ങ് എന്ന സംഗതി
അപ്രസക്തമാണെന്നാണ്. അക്ഷരമറിയുന്ന, ഉച്ചാരണശുദ്ധി പാലിക്കുന്ന ആര്‍ക്കും
മലയാളത്തിന്റെ സ്പെല്ലിങ്ങിനെ ചൊല്ലി വേവലാതിപ്പെടേണ്ട എന്നും.
കഷ്ടം! ഈ ഓണക്കാലത്തെങ്കിലും നിങ്ങള്‍ക്ക് നല്ലതുവല്ലതും ധരിച്ചുകൂടേ :) നിങ്ങള്‍ക്ക്
വിവരമില്ലെന്ന് എപ്പോഴും എന്നെക്കൊണ്ട് പറയിക്കല്ലേ. 'color'ഉം 'colour'ഉം
പോലെത്തന്നെയാണ് 'നന്മ'യും 'നന്‍മ'യും. ഇവയെ ഇപ്പോള്‍ വേര്‍തിരിക്കുന്നത്
ആ കുരിശ് വെച്ചാണ്; ZWJ. അതിനി നടപ്പില്ല.
ഹഹ. ആ കുരിശു പ്രയോഗം കലക്കി. അതാണല്ലേ അതിന്റെ മുകളറ്റത്ത് 'x' എന്നു കാണുന്നത്. പറഞ്ഞു
വരുന്നത് 'color' എന്ന വാക്ക് തിരഞ്ഞാല്‍ 'colour' വരില്ല; മറിച്ചും.
അതുപോലെ ആണവചില്ലിനുശേഷം 'നന്മ' തിരഞ്ഞാല്‍ 'നന്‍മ' വരില്ല; മറിച്ചും
അല്ലേ. അതായത് ഇതില്‍ ഒരെണ്ണം എപ്പോഴും തിന്മയായി നില്ക്കും എന്ന്.
അതു തന്നെ.
പക്ഷെ
'colour' ബ്രിട്ടീഷ് ഇംഗ്ലിഷും 'color'‍ അമേരിക്കന്‍ ഇംഗ്ലിഷുമല്ലേ. അതു
കൊണ്ടു തന്നെ ഒരു സ്പെല്‍ ചെക്കര്‍ ഉപയോഗിക്കുമ്പോള്‍ അതിനനുസരിച്ച്
ഇതില്‍ ഒരെണ്ണെം തെറ്റായി കാണിക്കുകയും ചെയ്യും. ml_IN പോലെ ഒരു ml_US
ലൊക്കാലിന് സ്കോപ്പുണ്ടോ? മലയാളം, പുതിയ ലിപി മലയാളം, ടൈപ്‌റൈറ്റര്‍
മലയാളം കൂടാതെ അമേരിക്കന്‍ മലയാളവും.
അതിന്റെ ആവശ്യമുണ്ടെന്നു തോന്നുന്നില്ല. സ്പെല്‍ ചെക്കറില്‍ കൂടുതല്‍ വാക്കുകള്‍ ചേര്‍ത്താല്‍ മതി.
ഇപ്രകാരം
അനേകം കേസുകള്‍ ഉണ്ടാകുമ്പോള്‍ അതൊരു അനാവശ്യ വ്യായാമമായി മാറില്ലേ.
കൂടാതെ ഇവയുടെ ഒക്കെ ബഹുവചനരൂപങ്ങള്‍ പോലുള്ള derived forms
കൂടിയാകുമ്പോള്‍ ആലോചിക്കാനേ വയ്യ. അതും കുറെ 'കര്‍ട്ടണ്‍ വാക്കുകള്‍ക്കു'
('വന്യവനി....', ഇവ കേട്ടു കേട്ടു മടുത്തു) വേണ്ടി.
വേണ്ടി
വരും. അല്ലെങ്കില്‍ തന്നെ മലയാളം സ്പെല്‍ചെക്കറൊക്കെ ആരെങ്കിലും
ഉപയോഗിക്കുമോ? ഇപ്പോള്‍ എല്ലാം ഇംഗ്ലിഷ് രീതിയിലേക്കു മാറുകയല്ലേ.
ഞങ്ങളുടെ കമ്പനി പേരിനൊരെണ്ണം ഇറക്കും. അത്രതന്നെ.
അതേയതേ ഇപ്പോള്‍ മലയാളം അക്ഷരം അറിയണമെന്നു തന്നെയില്ല, മലയാളത്തില്‍ ടൈപ്പുചെയ്യാന്‍. മുഴുവന്‍ അക്ഷരത്തെറ്റുകളും.
അത് ടൈപ്പിങ്ങ് നിയമങ്ങള്‍ ശരിക്ക് പഠിക്കാത്തതുകൊണ്ടാണ്. അടുത്ത തവണ നമുക്ക് ചില്ലിങ്ങ് ചില്ലുകളെപ്പറ്റി സംസാരിക്കാം. നിങ്ങള്‍ക്ക് നല്ല നമസ്കാരം.

Saturday, September 01, 2007

യൂണിക്കോഡ് മലയാളവും പൈഡ്പൈപ്പറും - 1

ചില്ല് എന്‍കോഡിങ്ങിനു ശേഷം മുന്‍പുണ്ടായിരുന്ന ഉള്ളടക്കത്തിന് എന്തു സംഭവിക്കും?
കുറച്ചുകാലം അതൊക്കെ വായിക്കാം. പിന്നീട് അതിനുള്ള മരുന്ന് ഞങ്ങള്‍ തരുന്നതാണ്.
എന്താണ് ആ മരുന്ന്?
അതിന് ബോട്ട് എന്നു പറയും. അത് intelligent ആയതുകൊണ്ട് ZWJനെ തെരെഞ്ഞുപിടിച്ച് തുരത്തും. പകരം എന്‍കോഡ് ചെയ്ത ചില്ലുകള്‍ നിരത്തും.
അപ്പോള്‍ ZWNJ എന്നു പറയുന്ന സാധനത്തേയോ?
ഹഹ. അതിനെയെല്ലാം ഞങ്ങളുടെ വളരെ സ്മാര്‍ട്ട് ആയ അപ്ലിക്കേഷന്‍സ് പണ്ടേ നാടുകടത്തിയില്ലേ. Wow! ഇത് അത്ഭുതകരമായി തോന്നുന്നില്ല?
അതേയതേ. പക്ഷേ ഈ ബോട്ടുകളെയെല്ലാം ഇങ്ങനെ നിരങ്ങാന്‍ അനുവദിക്കാമോ? അവ മേധാശക്തിയുള്ളവയല്ലേ?
തീര്‍ച്ചയായും. ഇവ യാതൊരു കഴപ്പവും ഉണ്ടാക്കില്ല. ഞാന്‍ ഗ്യാരണ്ടി.
ഗ്യാരണ്ടി അവിടെ നില്ക്കട്ടെ. ഇവയെയെല്ലാം ഒഴിവാക്കുന്നതുകൊണ്ട് എന്തു വിശേഷമാണ് ഉണ്ടാവുക?
ഇവ
അദൃശ്യമായി നിന്ന് കൂട്ടക്ഷരങ്ങളെ ചേര്‍ക്കുകയും പിരിക്കുകയും ആണ്
ചെയ്യുന്നത്. ഇനി നിങ്ങള്‍ അങ്ങനെ അവയെ പിരിക്കേണ്ട. അല്ലെങ്കില്‍ തന്നെ
അക്ഷരങ്ങളെ പിരിക്കാന്‍ നിങ്ങളാര്? പിരിക്കുകയും ചേര്‍ക്കുകയും
ചെയ്യുന്നത് ദൈവമാണ് എന്നൊക്കെ പറയുന്ന കേട്ടിട്ടില്ലേ? അതു പോലെ ഞങ്ങളുടെ
വളരെ സ്മാര്‍ട്ട് ആയ അപ്ലിക്കേഷനുകളും ഫോണ്ടുകളും അത്തരം കാര്യങ്ങള്‍
നോക്കിക്കോളും.
പക്ഷേ, എഴുതുന്ന ആള്‍ക്ക് അവിടെ കാര്യമില്ലേ?
നിങ്ങള്‍ തീരെ intelligent അല്ല. ഉണ്ടല്ലോ.
നിങ്ങള്‍ക്ക് എങ്ങനെ വേണമെങ്കിലും എഴുതാം. പേനകൊണ്ടോ മറ്റോ എഴുതി
സൂക്ഷിച്ചു വെച്ചുകൊള്ളൂ. പക്ഷെ യൂണിക്കോഡ് നിയമങ്ങള്‍ കര്‍ശനമായി പലിച്ചേ
നിങ്ങള്‍ക്ക് ഇവയെ UTF ആയി സൂക്ഷിക്കാനാവൂ.
ശരി ശരി. ഇനി സ്പെല്ലിങ്ങിനെപ്പറ്റി ചില സംശയങ്ങള്‍ ഉണ്ട്.
സ്പെല്ലിങ്ങിന്റെ കാര്യങ്ങള്‍ അടുത്ത ഭാഗത്തില്‍ പറയാം.
നന്ദി.
നിങ്ങള്‍ക്ക് നല്ല നമസ്കാരം.
തുടരും...

Friday, August 31, 2007

മലയാളത്തിനു മാതൃക ജീമെയിലാണോ?

മലയാളികള്‍ എറ്റവും കൂടുതലായി ഉപയോഗപ്പെടുത്തുന്ന ബ്ലോഗിങ്ങ് പ്ലാറ്റ്ഫോം
ബ്ലോഗര്‍ ആണ്. അവരുടെ ഈ മെയില്‍ എക്കൌണ്ട് മിക്കതും ജീമെയിലില്‍ ആകാനും
ആണ് സാധ്യത. ജീമെയില്‍ ZWJനേയും ZWNJനേയും നിഷ്കരുണം തള്ളുന്ന കാര്യം
എവരും ശ്രദ്ധിച്ചിരിക്കുമെന്നും കരുതുന്നു. അറ്റോമിക്‍ ചില്ലുവാദികള്‍
ഇവരില്‍ പലരേയും പറഞ്ഞുധരിപ്പിച്ചിരിക്കുന്നത് ചില്ല് എന്‍കോഡിങ്ങ്
വന്നുകഴിഞ്ഞാല്‍ എല്ലാം ശരിയാകും എന്നാണ്. എന്നാല്‍ ZWNJ
തള്ളുന്നതുകൊണ്ടുള്ള പ്രശ്നം അതേപടി നിലനില്ക്കും എന്ന് ജീമെയില്‍
ഉപയോഗിക്കുന്നവര്‍ ഓര്‍ക്കുക. പേരുകള്‍ കൂടിക്കുഴയാതെ ശരിയായി
കാണിക്കുവാന്‍ ZWNJനെ നിലനിര്‍ത്തേണ്ടത് അത്യാവശ്യമാണ്.



അപ്പോള്‍ ഏതു കാര്യത്തിനാണ് പ്രാമുഖ്യം നല്‍കേണ്ടത്? ZWJനേയും ZWNJനേയും
ജീമെയില്‍ തള്ളുന്നത് ഒഴിവാക്കുന്നതിനാണോ അതോ ധൃതിപിടിച്ച് ചില്ല്
എന്‍കോഡിങ്ങ് നടപ്പാക്കുന്നതിനാണോ? ജീമെയില്‍ ഉപയോഗിക്കുന്നവര്‍ ദയവായി
ഉത്തരം നല്കുക.



Thursday, August 30, 2007

ടൈപ്‌റൈറ്റര്‍ ലിപി കൊണ്ടുവരുന്നു എന്നു പറയാന്‍ കാരണമെന്ത്?

  1. ZWJ/ZWNJ മലയാളത്തിനും മറ്റു പല ഭാഷകള്‍ക്കും അവശ്യം വേണ്ടവയാണ്.ISCII സമ്പ്രദായത്തില്‍ ഇവയ്ക്കു സമാനമായി nukta ഉണ്ടായിരുന്നു. formattingനു വേണ്ടി മാത്രമാണ് ഇവ എന്ന കാര്യം പലഭാഷകളും അംഗീകരിക്കുന്നില്ല. അതിനാല്‍ ഭാവിയില്‍ ഇവയുടെ നില ഉയര്‍ത്തപ്പെടും എന്ന കാര്യം നിശ്ചയമാണ്. അതിനാല്‍ ZWJന്റെ പേരില്‍ ചില്ല് എന്‍കോഡ് ചെയ്യുന്നതിന് ന്യായീകരണമില്ല. (എല്ലാ വ്യഞ്ജനങ്ങള്‍ക്കും ചില്ലുരൂപം ഉണ്ട് എന്ന് സങ്കല്പിക്കുയാണെങ്കില്‍ അവയുടെയെല്ലാം ചില്ലുരൂപം എന്‍കോഡ് ചെയ്യപ്പെടാന്‍ സാധ്യതയില്ല. അതുകൊണ്ട് എണ്ണത്തില്‍ കുറവായതുകൊണ്ട് ചില്ല് എന്‍കോഡിങ് ആവാം എന്നു പറഞ്ഞാല്‍ അത് യുക്തിസഹമാവില്ല.) ചില്ല് എന്‍കോഡിങ് നടന്നു കഴിഞ്ഞാല്‍ Application നുകള്‍ ZWJ തള്ളുന്നതുകൊണ്ടുള്ള പ്രശ്നം ഒഴിവായേക്കും; പക്ഷെ ZWNJ നെ തള്ളുന്നതുകൊണ്ടള്ള പ്രശ്നങ്ങള്‍ നിലനില്ക്കും. അതായത് നിങ്ങള്‍ ഒരിക്കലും കൂടിച്ചരരുത് എന്നു കരുതി, ZWNJ ഉപയോഗിച്ച് വേര്‍പിരിച്ചെഴുതിയ അക്ഷരങ്ങള്‍ കൂടിച്ചര്‍ന്ന് കൂട്ടക്ഷരം ഉണ്ടവുകയും എഴുതിയത് വികലമായി കാണുകയും ചെയ്യും.(ഇതിന് ധാരാളം ഉദാഹരണങ്ങള്‍ റാല്‍മിനോവ് ചൂണ്ടിക്കാട്ടിയിട്ടുണ്ട്.) അപ്പോള്‍ നിങ്ങള്‍ എഴുതിയതിന് അനന്യസ്വഭാവം ഉണ്ടാകണമെങ്കില്‍ ഒരേ ഒരു മാര്‍ഗ്ഗമേയുള്ളു. എഴുതാനും വായിക്കാനും കൂട്ടക്ഷരങ്ങള്‍ ഒഴിവാക്കിയ ഫോണ്ട് ഉപയോഗിക്കുക. അതുതന്നെയാണ് ടൈപ്‌റൈറ്റര്‍ ലിപി!
  2. ചില്ല് എന്‍കോഡിങ്ങിനു വേണ്ടി ശ്രമിക്കുന്ന അതേ കൂട്ടരില്‍ നിന്നുണ്ടായ മറ്റൊരു വാദമാണ് മലയാളത്തില്‍ ലംബമായി രൂപപ്പെടുന്ന കൂട്ടക്ഷരങ്ങള്‍ പലതും കാഴ്ചയ്ക്ക് ബുദ്ധിമുട്ടുണ്ടാക്കുന്നു എന്നും അതിനാല്‍ അവയെ ഒഴിവാക്കണമെന്നത്. ഇത് യഥാര്‍ത്ഥത്തില്‍ latin അക്ഷരങ്ങളുടെ point size ആയി താരതമ്യം ചെയ്യുന്നതുകൊണ്ടുള്ള പ്രശ്നമാണ്. മലയാളത്തില്‍ ഫോണ്ട് സൈസ് ആവശ്യാനുസൃതം ഉപയോഗിക്കേണ്ടതാണ്. അതുപോലെ ഫോണ്ട് മെട്രിക്സും യോജിച്ചരീതിയില്‍ ആയിരിക്കണം. (ഈ പ്രശ്നങ്ങള്‍ പരിഹരിച്ച്, ഹൂസൈന്റെ നേതൃത്വത്തില്‍ രൂപപ്പെടുത്തിയ സ്വതന്ത്ര സോഫ്റ്റ്‌വെയര്‍ ആയ ഒരു ഫോണ്ട് ഉടന്‍ പുറത്തിറങ്ങുന്നുണ്ട്).
  3. മലയാളം എഴുത്തില്‍ അവശ്യം ഉണ്ടായിരിക്കേണ്ട കൂട്ടക്ഷരങ്ങളുടെ ഒരു സ്റ്റാന്‍ഡേര്‍ഡ് വേണമെന്ന വാദം ഇക്കൂട്ടര്‍ തള്ളിക്കളഞ്ഞു.(ബൂലോക ക്ലബ്ബിലെ പോസ്റ്റില്‍ കാണാം ഇത്). ഫോണ്ട് നിര്‍മ്മിതി എളുപ്പമാവില്ല എന്നാണ് ഇതിനു പറഞ്ഞ ന്യായം. എറ്റവും എളുപ്പം നിര്‍മ്മിക്കാവുന്നത് ടൈപ്‌റൈറ്റര്‍ ലിപി അനുസരിക്കുന്ന ഫോണ്ട് ആണ് എന്നതാണ് വസ്തുത.

Sunday, August 26, 2007

മലയാളിക്കു വേണ്ടാത്തതും വെണ്ടര്‍ക്കു വേണ്ടതും

യൂണിക്കോഡില്‍ ടൈപ്‌റൈറ്റര്‍ ലിപി വരുന്നതിന് ന്യായീകരണമായി ZWJ/ZWNJ വിരോധികള്‍ പറയുന്നതാണ് സോഫ്റ്റ്‌വെയര്‍ വെണ്ടര്‍മാര്‍ക്കുവേണ്ടിയാണ് ഇത് ചെയ്യുന്നത് എന്ന്. പ്രധാനമായും കുത്തകകളായ ചില സോഫ്റ്റ് വെയര്‍ കമ്പനികള്‍ക്കുവേണ്ടിയാണ് മലയാളത്തെ വെട്ടിമുറിക്കുന്നത് (ഇതിനു ശ്രമിക്കുന്നവരില്‍ പലരും ഇത്തരം കുത്തകകള്‍ക്കു വേണ്ടി ജോലിചെയ്യുന്നവരാണ് എന്നും ഓര്‍ക്കാം). അതായത് മലയാളം എങ്ങനെ എഴുതണം, സൂക്ഷിക്കണം, വായിക്കണം എന്ന് ഇനി ചില കുത്തക സോഫ്റ്റ്‌വെയര്‍ കമ്പനിക്കാര്‍ തീരുമാനിക്കും എന്നു ചുരുക്കം. മൈക്രോസോഫ്റ്റ് പോലുള്ള കുത്തകകള്‍ എപ്പോഴും ശ്രമിക്കുന്ന കാര്യമാണ്, തങ്ങള്‍ ഉണ്ടാക്കുന്ന സ്റ്റാന്‍ഡേര്‍ഡ് ഔദ്യോഗിക സ്റ്റാന്‍ഡേര്‍ഡ് ആക്കുക എന്നത്.

സ്വതന്ത്രസോഫ്റ്റ്‌വെയര്‍ രംഗത്ത് മലയാളം യൂണിക്കോഡ് വളരെ മുന്‍പ് തന്നെ പ്രയോഗത്തില്‍ വന്നുകഴിഞ്ഞതാണ്.യൂണിക്കോഡ് അധിഷ്ടിതമായ സോഫ്റ്റ്‌വെയറുകളും വന്നുകൊണ്ടിരിക്കുന്നു.(ഉദാ: സന്തോഷ് തോട്ടിങ്ങല്‍ സ്പെല്‍ചെക്കറും അലെക്സ് ടൈപ്‌സെറ്റിങ്ങിനായി Malayalam-omegaയും ഉണ്ടാക്കിയിട്ടുണ്ട്) ZWJ/ZWNJഇവയില്ലാം ഉപയോഗിച്ചിട്ടുണ്ട്, പ്രശ്നങ്ങള്‍ പരിഹരിച്ചുകൊണ്ട്. എന്നാലും
ZWJ/ZWNJ വിരുദ്ധര്‍ മുന്നോട്ടു തന്നെ പോകുന്നു, ലിപിയെവെട്ടിമുറിക്കാന്‍. സ്വതന്ത്രസോഫ്റ്റ്‌വെയറിന്റെ പ്രത്യേകത എതുതരം പ്രശ്നവും പരിഹരിക്കാന്‍ വെണ്ടറെ ആശ്രയിക്കേണ്ടതില്ല എന്നതാണ്.
മലയാളത്തിന്റെയും മലയാളികളുടേയും താല്പര്യങ്ങള്‍ക്കും അഭിരുചിക്കും പ്രത്യേകതകള്‍ക്കും അനുസരിച്ചാണ് അവയുടെ വികസനവും മുന്നേറ്റവും കൂട്ടിച്ചേര്‍ക്കലും എല്ലാം; വെണ്ടറുടെ താല്പര്യങ്ങള്‍ക്കനുസരിച്ചല്ല.

മലയാളം ബ്ലോഗുകളില്‍ ഇത്രകാലവും ZWJ/ZWNJ ഉപയോഗിച്ച് പ്രശ്നമില്ലാതെ മലയാളംഉപയോഗിച്ചുപോരുന്നണ്ട്. ഉള്ളടക്കത്തിലും മലയാളം വളരെയേറെ മുന്നേറിയിരിക്കുന്നു. ഇനിയിപ്പോള്‍ അതെല്ലാം മാറ്റിമറിക്കുന്നത് ദൂരവ്യാപകമായ പ്രത്യാഘാതങ്ങള്‍ ഉണ്ടാക്കും.



Wednesday, August 22, 2007

ടൈപ്‌റൈറ്റര്‍ മലയാള ഭീഷണി കംപ്യൂട്ടര്‍ ലോകത്തും

യൂണിക്കോഡിന്റെ വരവോടെ എല്ലാവര്‍ക്കും ഒരേ രീതിയില്‍, ലിപികളുടേയും അക്ഷരങ്ങളുടേയും തനിമ നഷ്ടപ്പെടാതെ മലയാളം എഴുതാനും വായിക്കാനും സൂക്ഷിച്ചുവയ്ക്കാനും കഴിയുമെന്നായിരുന്നു ധാരണ. എന്നാല്‍ ചിലരുടെ പിടിവാശിമൂലം ഇതു നടക്കാതിരിക്കാനാണ് സാധ്യത. അല്ലെങ്കില്‍ എല്ലാവരും ടൈപ്‌റൈറ്റര്‍ ലിപിയില്‍ എഴുതുകയും വായിക്കുകയും വേണ്ടിവന്നേക്കും.

മലയാളത്തില്‍ കൂട്ടക്ഷരങ്ങള്‍ പ്രധാനമാണ്. അതു പോലെത്തന്നെയാണ് ആവശ്യമെങ്കില്‍
ചന്ദ്രക്കലയിട്ട് പിരിച്ചെഴുതുന്നതും. മലയാളത്തിന് പ്രത്യേകമായി ചില്ലുകളുമുണ്ട്. ഇവയ്ക്കെല്ലാം വേണ്ടി ചന്ദ്രക്കലയുടെ പെരുമാറ്റരീതിയില്‍ വ്യത്യാസം വരുത്തേണ്ടതുണ്ട്. ഇതിനായി യൂണിക്കോഡ് നിര്‍ദ്ദേശിച്ചിട്ടുള്ളത് ZWJ,ZWNJ എന്നിവയാണ്. ZWJ ചില്ലുകള്‍ കാണിക്കുന്നതിനും ZWNJ
കൂട്ടക്ഷരങ്ങളെ വേര്‍പിരിക്കുന്നതിനും ഉപയോഗിക്കുന്നു. പല അപ്ലിക്കേഷനുകളും ഇവയെ നിലനിര്‍ത്തുകയും ശരിയായി തന്നെ കാണിക്കുകയും ചെയ്യുന്നുുണ്ട്. അങ്ങനെയല്ലാത്തവ തിരുത്തപ്പെടേണ്ടതാണ്. മലയാളത്തിനു മാത്രമല്ല മറ്റു ഭാരതീയ ഭാഷകള്‍ക്കും ഇവയുടെ സാന്നിദ്ധ്യം ആവശ്യമാണ്.

ഇപ്പോള്‍ നടക്കുന്ന പ്രത്യേകമായ ചില്ല് എന്‍കോഡിങ്ങിനുള്ള ശ്രമം ZWJ,ZWNJ എന്നിവയെഒഴിവാക്കുന്ന അപ്ലിക്കേഷനുകള്‍ക്കുവേണ്ടി വാദിക്കുന്നവര്‍ നടത്തുന്നതാണ്. ഇതുകൊണ്ട് ചില border line സംഗതികള്‍ പരിഹരിക്കപ്പെടുന്നു എന്നാണ് അവകാശവാദം. ഉദാ: 'വന്യവനിക/വന്‍യവനിക' യില്‍ ഇവയെ വേര്‍തിരിക്കുന്നത് ZWJ ആണ്. അതിനാല്‍ ZWJ നെ തള്ളുന്ന അപ്ലിക്കേഷന്‍ ഇവ തമ്മിലുള്ള അന്തരം ഇല്ലാതാക്കുന്നു.

ഇത് പരിഹരിക്കാനായാണ് പ്രത്യേകമായ ചില്ല് എന്‍കോഡിങ്ങ് വേണമെന്ന് ഒരു കൂട്ടര്‍ വാദിക്കുന്നത്. ഇത്തരം 'കര്‍ട്ടണ്‍ വാക്കുകള്‍' ഏതാനും എണ്ണം ഗവേഷണം ചെയ്ത് കണ്ടെത്തിയിട്ടുമുണ്ട് ഇവര്‍; നല്ലതു തന്നെ. പക്ഷെ അപ്ലിക്കേഷനുകളുടെ, ZWJ,ZWNJ തള്ളുന്ന പ്രവണതയെ ഇല്ലാതാക്കണമെന്ന്
ഇവര്‍ കരുതുന്നുമില്ല. യഥാര്‍ത്ഥത്തില്‍ ഇതിനായിരുന്നു മുന്‍ഗണന കൊടുക്കേണ്ടിയിരുന്നത്.

ശരി,ചില്ലകള്‍ എന്‍കോഡ് ചെയ്തെന്നു തന്നെയിരിക്കട്ടെ. 'കര്‍ട്ടണ്‍ വാക്കുകളു'ടെ പ്രശ്നം തലതിരിഞ്ഞ അപ്ലിക്കേഷനുകളെ സംബന്ധിച്ചിടത്തോളം തീരുകയും ചെയ്യും. അപ്പോഴും കൂട്ടക്ഷരങ്ങള്‍ പിരിക്കുന്നതിന്
ഉപയോഗിക്കുന്ന ZWNJനെ അപ്ലിക്കേഷനുകള്‍ തള്ളുന്ന കാര്യം പരിഹൃതമാക്കാന്‍ ഇക്കൂട്ടര്‍ ശ്രമിക്കുന്നില്ല. ഇതിന് ഇവര്‍ പറയുന്ന ന്യായം ZWNJനെ തള്ളുന്നതുകൊണ്ട് അര്‍ത്ഥ വ്യത്യാസം ഉണ്ടാകുന്നില്ല എന്നതാണ്. പക്ഷെ, അനാവശ്യമായി കൂട്ടക്ഷരങ്ങള്‍ ഉണ്ടാകുമ്പോള്‍ എഴുതിയ മലയാളം വികലമായി കാണുന്നു; ചിലപ്പോള്‍ അര്‍ത്ഥവ്യത്യാസവും വന്നേക്കാം. അതായത് നിങ്ങള്‍ എഴുതിയ രീതിയില്‍ തന്നെ പിന്നീട് കാണപ്പെടുമെന്ന് യാതൊരു ഉറപ്പുമില്ലെന്നു സാരം. അങ്ങനെ ഉറപ്പിച്ചു പറയാമോ?

ഇല്ല.അവിടെയാണ് ടൈപ്‌റൈറര്‍ ലിപി വരുന്നത്. മലയാളികള്‍ ചവറ്റുകുട്ടയില്‍ തള്ളിയ ഇതിനെ വീണ്ടും എഴുന്നെള്ളിക്കാനുള്ള ശ്രമങ്ങളുടെ ഭാഗമാണ് മേല്‍പ്പറഞ്ഞ ഇടപെടലുകള്‍ ചില വ്യക്തികള്‍ നടത്തുന്നത്. ടൈപ്‌റൈറ്റര്‍ ലിപി അര്‍ത്ഥവ്യത്യാസം ഉണ്ടാക്കുകയില്ല. കൂട്ടക്ഷരങ്ങളെയെല്ലാം പിരിച്ചുതന്നെ കാണിക്കും. എഴുതിയത് 'അതുപോലെ തന്നെ' വായിക്കാം(നര്‍മ്മബോധമുണ്ടെങ്കില്‍ വേറൊരു രീതിയിലും വായിക്കാം!). ZWJഉം ZWNJഉം ആവശ്യമായി വരുന്നില്ല. ന്യായവാദങ്ങള്‍ ഇനിയും കണ്ടെക്കാം.

അതുകൊണ്ട് മലയാള ഭാഷയെ സ്നേഹിക്കുന്നവര്‍ വ്യക്തമാക്കുക. ZWJഉം ZWNJഉം ഇല്ലാത്ത ടൈപ്‌റൈറര്‍ മലയാളം വേണോ അതോ ZWJഉം ZWNJഉം അടങ്ങിയ, നമ്മുടെ പ്രിയപ്പെട്ട അക്ഷരങ്ങള്‍ അതുപോലെ കാണിക്കുന്ന, നമ്മള്‍ ഇതുവരെ ശീലിച്ച നമ്മുടെ മലയാളം വേണോ എന്ന്.

ഇതും കൂടി കാണുക.

Monday, May 14, 2007

പാന്‍ഗോ 1.16.4 പാച്ച്

ഗ്നു/ലിനക്സിനുള്ള പാന്‍ഗോ 1.16.4 ന്റെ പാച്ച് ഇവിടെ.

ഉപയോഗിക്കുന്ന വിധം:

ആദ്യം pango-querymodules --version കമാന്‍ഡ് ഉപയോഗിച്ച് നിങ്ങള്‍ ഉപയോഗിക്കുന്ന പാന്‍ഗോയുടെ മോഡ്യൂള്‍ വേര്‍ഷന്‍ നോക്കുക.

module interface version: 1.6.0

ആണ് കിട്ടുന്നതെങ്കില്‍ മാത്രം ഈ പാച്ച് ഉപയോഗിച്ചാല്‍ മതിയാകും.

extract ചെയ്ത tar.bz2 ഫയലില്‍ നിന്ന് കിട്ടുന്ന patch directory യില്‍ 64bit-ഉം 32-ഉം പാച്ച് ഉണ്ട്.അതില്‍ നിന്ന് സിസ്റ്റത്തിന് ഉചിതമായ pango-indic-fc.so ഉപയോഗിക്കാം. /usr/lib/pango/1.6.0/modules directory-ല്‍ പോയി അവിടെയുള്ള pango-indic-fc.so നെ pango-indic-fc.so.orig എന്ന് പുനര്‍നാമകരണം ചെയ്യുക(പിന്നീട് പഴയ സ്ഥിതി പുനഃസ്ഥാപിക്കണമെങ്കില്‍ ഇതിനെ പഴയപേരിലാക്കി ഉപയോഗിക്കാം).ഇനി ഇവിടെ നേരത്തെ extract ചെയ്ത, ഉചിതമായ pango-indic-fc.so പാച്ച് നിക്ഷേപിക്കുക.CTRL + ALT + BackSpace അടിച്ച് X റീസ്റ്റാര്‍ട്ട് ചെയ്യുക.

ഇന്‍സ്റ്റാളര്‍ ചേര്‍ത്തിട്ടുണ്ട്.ScreenCam video ഇവിടെ.

Last Edited on: 29/05/2007

Powered by ScribeFire.

Thursday, April 12, 2007

രചന ഫോണ്ട് സുറുമ പാച്ചിനൊപ്പം

ഫ്രീ ഫോണ്ടുകളായ രചനയും ഫ്രീസെരിഫും സുറുമ പാച്ചിനൊപ്പം ഉപയോഗിക്കാവുന്ന രീതിയില്‍ ഇവിടെ.



Powered by ScribeFire.