လာေရာက္ေလ့လာဖတ္ရွဳသူအေပါင္း စိတ္၏ခ်မ္းသာျခင္း၊ ကုိယ္၏က်န္းမာျခင္းျဖင့္ ျပည့္စံုၾကပါေစ...

ဘာသာျပန္ကြန္ပ်ဴတာမ်ား

Posted by Unknown Monday, November 12, 2012 0 comments

လူမ်ဳိးတစ္ရာ့တစ္ပါးမွာ ေရးၾကေျပာၾကတဲ့ ဘာသာစကားက အမ်ဳိးမ်ဳိးဆုိေတာ့ တစ္ေယာက္ရဲ႕စာ ဒါမွမဟုတ္ ဘာသာစကားကို တစ္ေယာက္က အလြယ္နဲ႔ နားလည္ေအာင္ ဘာသာျပန္စနစ္ လုိပါတယ္။  ဘာသာစကား ႏွစ္မ်ဳိးလုံး နားလည္တဲ့ လူတစ္ေယာက္ရွိရင္ အဆင္ေျပတယ္ဆုိေပမယ့္ လူတစ္ေယာက္ဟာ တုိင္းျခား ဘာသာစကားတစ္ခုကို နားလည္ေအာင္ ႏွစ္နဲ႔ခ်ီၿပီး ေလ့လာယူ ၾကရပါတယ္။ ဘာသာျပန္ဖုိ႔ ကိစၥေတြ အမ်ားႀကီး လိုလာၿပီဆုိရင္ လူအင္အား အရင္းအျမစ္ကလည္း အမ်ားႀကီး လိုလာပါမယ္။ ဒါေၾကာင့္ ကၽြန္ေတာ္တုိ႔ရဲ႕ ဘိုးေဘးဘီဘင္ လူသားေတြဟာ လူအစား စက္နဲ႔ ဘာသာျပန္မယ့္ စနစ္ကို ႀကံဆစဥ္းစားခဲ့ၾကပါတယ္။ စက္နဲ႔ ဘာသာျပန္စနစ္ကို တည္ေထာင္ဖို႔ ႀကံစည္ခဲ့တဲ့ စိတ္ကူးစိတ္သန္းဟာ ၁၇ ရာစုႏွစ္ေလာက္ကစၿပီး ေပၚေပါက္ခဲ့ပါတယ္။ ၁၆၂၉ ခုႏွစ္မွာ Rene Descartes ဆုိတဲ့ လူဟာ တစ္ခုတည္းေသာ ကမ႓ာသုံး ဘာသာစကား ေပၚေပါက္လာေစဖို႔ အဆုိျပဳခဲ့တယ္။ အမွတ္သေကၤတ တစ္ခုစီကို ဘုံအျဖစ္သုံးၿပီး ကြဲျပားျခားနားေနတဲ့ ဘာသာစကားေတြကို အလြယ္တကူ ေပါင္းစည္းေပးႏိုင္ဖို႔ ရည္ရြယ္ခဲ့တာပါ။ ဒါေပမဲ့ နည္းပညာပိုင္းဆုိင္ရာ အခက္အခဲေတြေၾကာင့္ စက္နဲ႔ဘာသာျပန္တဲ့ အဆင့္ထိ မေရာက္ခဲ့ပါဘူး။ လူအစား စက္ကို သုံးစြဲၿပီး ဘာသာျပန္တဲ့ အလုပ္ဟာ ၂၀ ရာစု အစပိုင္းေရာက္မွစၿပီး အေကာင္အထည္ေဖာ္တဲ့ အဆင့္ ေရာက္လာပါတယ္။ ဘာသာျပန္လုပ္ငန္းမွာ ကြန္ပ်ဴတာသုံး ၿပီး ေဆာင္ရြက္မယ္ဆုိတဲ့ စိတ္ကူးလဲ အဲဒီအခ်ိန္က ရွိခဲ့တယ္။

ဒီစိတ္ကူးကို ၁၉၄၆ ခုႏွစ္မွာ A.D Booth ဆုိတဲ့ လူကစၿပီး အဆုိတင္တယ္။ စိတ္ကူးယဥ္မယ္ဆုိလည္း ယဥ္ေလာက္ပါတယ္။ ကမ႓ာ့ ပထမဆုံးကြန္ပ်ဴတာလုိ႔ ဆုိေလာက္တဲ့ ENIAC ကြန္ပ်ဴတာႀကီးဟာ ၁၉၄၆ ခုႏွစ္မွာစၿပီး ေပၚေနၿပီ။ ရန္ကုန္ၿမိဳ႕လည္ေခါင္က အခန္းက်ယ္တုိက္ခန္းႀကီး တစ္ခန္းစာေလာက္ ေနရာယူတဲ့ ကြန္ပ်ဴတာႀကီးကိုသုံးၿပီး ကြန္ပ်ဴတာဘာသာျပန္ စနစ္ကို Warren Weaver ဆုိတဲ့လူက ေရးပါတယ္။ ကမ႓ာေပၚမွာ ပထမဆုံး ကြန္ပ်ဴတာ ဘာသာျပန္စနစ္လုိ႔ ေျပာႏုိင္တာက ၁၉၅၄ ခုႏွစ္မွာ ျပဳလုပ္ခဲ့တဲ့ George Town Experiment ပါ။ ႐ုရွားဘာသာနဲ႔ ေရးထားတဲ့စာေၾကာင္း ၆၀ ေက်ာ္ေလာက္ကို အဂၤလိပ္ဘာသာအျဖစ္ ေအာင္ေအာင္ျမင္ျမင္ ဘာသာျပန္ႏိုင္ခဲ့ပါတယ္။ စမ္းသပ္ခ်က္ဆုိေပမဲ့ အင္မတန္ ႀကီးက်ယ္တဲ့ ေအာင္ျမင္မႈျဖစ္တဲ့အတြက္ ကြန္ပ်ဴတာသုံး ဘာသာျပန္စနစ္အတြက္ ရန္ပုံေငြ အေထာက္အပံ့ေတြ ေပးလာပါတယ္။ စက္ဘာသာျပန္စနစ္ကိုလည္း ဆက္ၿပီး သုေတသန လုပ္ခဲ့ၾကပါတယ္။ ကြန္ပ်ဴတာစက္သုံးၿပီး ဘာသာျပန္တဲ့စနစ္ဟာ သုံးႏွစ္ကေန ငါးႏွစ္အတြင္းမွာ ေပၚေပါက္လာလိမ့္မယ္လို႔ ပညာရွင္ေတြ ေမွ်ာ္လင့္ခဲ့ၾကပါတယ္။ လက္ေတြ႕မွာ တုိးတက္မႈက အေတာ္ပဲ ေႏွးေကြးတယ္။ ေရွ႕ဆက္ၿပီး ဆယ္ႏွစ္ေက်ာ္ေလာက္ ႀကိဳးစားၾကေပမယ့္ အမ်ားေမွ်ာ္လင့္သလို ေအာင္ျမင္မႈ မရခဲ့ပါဘူး။ ဒါေၾကာင့္ ရန္ပုံေငြ ေထာက္ပံ့မႈေတြလည္း ေလ်ာ့က်လာပါတယ္။ ၁၉၈၀ ျပည့္လြန္ႏွစ္ေတြ ေရာက္ေတာ့ ကြန္ပ်ဴတာေတြဟာ တြက္ခ်က္မႈ စြမ္းပကားေတြ အေတာ္ႀကီး ေကာင္းလာၿပီး အရြယ္အစား က ေတာ္ေတာ္ေသးလာတဲ့အျပင္ ေပၚဦးေပၚဖ်ားကထက္စာရင္ အမ်ားႀကီး ေစ်းသက္သာလာတယ္။ အဲဒီအခ်ိန္မွာ သိပၸံပညာရွင္ေတြဟာ ကြန္ပ်ဴတာ ဘာသာျပန္စနစ္ဘက္ကို ျပန္ၿပီး စိတ္လည္လာၾကပါတယ္။ သာမန္ ကြန္ပ်ဴတာ သုံးစြဲသူေတြအတြက္ လက္ေတြ႕ အသုံးျပဳႏုိင္တဲ့ ဘာသာျပန္ ေဆာ့ဖ္ဝဲေတြက ၁၉၉၀ ျပည့္လြန္ႏွစ္ေတြမွာ ေပၚလာပါတယ္။ သကၠရာဇ္ (၂၀၀၀) ဝန္းက်င္မွာ ျမန္မာျပည္က ကြန္ပ်ဴတာသုံးစြဲသူ တခ်ဳိ႕ေတာင္ အဲဒီေဆာ့ဖ္ဝဲေတြ သုံးစြဲခြင့္ရၾကပါတယ္။

Babylon ဘာသာျပန္ ေဆာ့ဖ္ဝဲဟာ ကၽြန္ေတာ္တုိ႔ဆီမွာ ေတာ္ေတာ္ အသုံးမ်ားပါတယ္။ ဒါေပမဲ့ ဘာသာျပန္ ေဆာ့ဖ္ဝဲေတြဟာ စားလုံးတစ္လုံးခ်င္း၊ ဒါမွမဟုတ္ စာေၾကာင္းတုိေတြ ဘာသာျပန္ရာမွာပဲ အသုံးတည့္တာ မ်ားပါတယ္။ တကယ္လက္ေတြ႕က်ၿပီး လူသုံးမ်ားတာက online translation service ေတြ ျဖစ္ပါတယ္။ အခုအခ်ိန္မွာဆုိရင္ Google translate နဲ႔ Bing translate ကို အထင္အရွားရွိၿပီး က်န္တဲ့ေဒသဆုိင္ရာ ဘာသာျပန္စနစ္ ငယ္ေတြလည္း ရွိပါတယ္။ ေကာင္းက်ဳိးက ကိုယ္နားမလည္တဲ့ ဘာသာစကားတစ္ခုနဲ႔ ေရးထားတဲ့ Website ကို ဘာသာျပန္ခိုင္းတာနဲ႔ တစ္ၿပိဳင္နက္ ကမ႓ာမွာ လူသုံးအမ်ားဆုံး ဘာသာစကား (ဥပမာ-အဂၤလိပ္) နဲ႔ ဘာသာျပန္ခ်က္ကို ခ်က္ခ်င္းနီးပါး ရႏုိုင္တာပါ။ (ခ်က္ခ်င္းနီးပါးလို႔ ဆုိတဲ့ေနရာမွာ HSDPA ကို 3Kbps ေလာက္ အျမန္ႏႈန္းနဲ႔ေပးတဲ့ ကၽြန္ေတာ္ တုိ႔လို ႏုိင္ငံမ်ဳိးေတာ့ မပါဘူးေပါ့ဗ်ာ)။ ဒါေပမဲ့ ကၽြန္ပ်ဴတာ ဘာသာျပန္စနစ္ထဲ မထည့္သြင္းႏုိင္ေသးတဲ့ Farsi နဲ႔ Pashto လို ဘာသာစကားမ်ဳိးအတြက္ကေတာ့ မရႏုိင္ေသးပါဘူး။

ဒီေန႔ သုံးစြဲေနတဲ့ ကြန္ပ်ဴတာ ဘာသာျပန္စနစ္ဟာ ဘာသာစကားတစ္ခုမွာ သုံးတဲ့စာသားရဲ႕ Statical properties ကို ကြန္ပ်ဴတာထဲ သြတ္သြင္းေပးထားၿပီး ကြန္ပ်ဴတာက အဲဒါကိုသုံးလို႔ တျခားဘာသာစကားတစ္ခုကို ျပန္ဆုိတဲ့ စနစ္ျဖစ္ပါတယ္။ ေနာက္ထပ္ အသုံးမ်ားတာကHybird machine Tranlation လို႔ေခၚပါတယ္။ သူကေတာ့ Statical based နဲ႔ rule based နည္းလမ္းႏွစ္ခုကို ေပါင္းစပ္ၿပီး သုံးပါတယ္။ လက္ရွိ ကြန္ပ်ဴတာ ဘာသာျပန္စနစ္အရဆုိရင္ ဘုံတူညီခ်က္ေတြရွိၿပီး ႏွစ္ဘာသာ အဘိဓာန္ စနစ္ျပဳစုၿပီးသား၊ လူသုံးလည္း မ်ားၿပီးသားဘာသာေတြအတြက္ ကြန္ပ်ဴတာက ေကာင္းေကာင္း ဘာသာျပန္ႏုိင္ပါတယ္။ ဥပမာျပရရင္ စပိန္-အဂၤလိပ္နဲ႔ ျပင္သစ္-အဂၤလိပ္ ဘာသာအတြဲမ်ဳိး ျဖစ္ပါတယ္။ ဒါေပမဲ့ လူသုံးအလြန္နည္းတဲ့ ဒါမွမဟုတ္ ႏွစ္ဘာသာ အဘိဓာန္စနစ္ မရွိထားေသးတဲ့ ဘာသာစကားေတြအတြက္ ကြန္ပ်ဴတာ ဘာသာျပန္စနစ္ရဖို႔ အလြန္ခက္ခဲပါတယ္။ ဒီအခက္အခဲကို ကြန္ပ်ဴတာ နည္းပညာသုံးၿပီး ေျဖရွင္းဖို႔ ႀကိဳးစားသူေတြက ကယ္လီဖုိးနီးယား ေတာင္ပိုင္း တကၠသိုလ္ ပညာရွင္ Sujith Ravi နဲ႔ Kevin Knight တုိ႔ ျဖစ္ပါတယ္။

လူသုံးနည္းပါးတဲ့ ဘာသာစကားကို အဂၤလိပ္ဘာသာလို လူသုံးမ်ား ဘာသာစကားအေနနဲ႔ ဘာသာျပန္ႏုိင္ဖို႔ ေဆာ့ဖ္ဝဲကို သူတုိ႔သုံးပါတယ္။ ေဆာ့ဖ္ဝဲဟာ လူသုံးနည္း ဘာသာစကားမွာပါတဲ့ စာလုံးေတြကို ဆန္းစစ္ပါတယ္။ စာလုံးတစ္လုံးဟာ ဘာသာျပန္ရမဲ့စာပုိဒ္ရဲ႕ ေနရာအေတာ္မ်ားမ်ားမွာ ပါေနသလား၊ ဒါဆုိရင္ အဲဒီစာလုံးဟာ a လို the လို article စာလုံး ျဖစ္ႏုိင္ပါတယ္။ ေဆာ့ဖ္ဝဲဟာ ဒီလိုမ်ဳိး မွန္းဆတဲ့ နည္းကို အေျခခံၿပီး ဘာသာျပန္အလုပ္ကို လုပ္ဖို႔ႀကိဳးစားပါတယ္။ သဘာဝက်တဲ့ အဂၤလိပ္ဘာသာျပန္ ျဖစ္ေစဖို႔အတြက္ တျခားေဆာ့ဖ္ဝဲတစ္ခုကို အကဲျဖတ္ကိစၥမွာ သုံးပါတယ္။ ဘာသာျပန္ ေဆာ့ဖ္ဝဲမွာပါတဲ့ ျဖစ္ႏုိင္ေျခ တြက္ခ်က္မႈ စြမ္းရည္ကိုသုံးၿပီး အလွည့္အပတ္ေလးေတြနဲ႔ ဘာသာျပန္မႈ ေခ်ာေမြ႕ေအာင္ လုပ္တာ ျဖစ္ပါတယ္။

ေလာေလာဆယ္မွာေတာ့ စာသားတုိေလးေတြ (ဥပမာ last year, the fourth quarter စသည္) နဲ႔ စမ္းသပ္ေနပါတယ္။ စပိန္ဘာသာစကားကေန အဂၤလိပ္ဘာသာစကားကို ဘာသာျပန္တာက ေအာင္ျမင္ ပါတယ္။ ကြန္ပ်ဴတာ ဘာသာျပန္တဲ့နည္းကို သုံးၿပီး ႐ုပ္ရွင္ဇာတ္ကား စာတမ္းထိုး (Subtile) ဖုိ႔ ႀကိဳးစားေနပါတယ္။ သူတုိ႔သုံးတဲ့ ဘာသာျပန္ နည္းစနစ္ကို monolingual traslation လို႔ နာမည္ေပးထားပါတယ္။ ဘာေၾကာင့္ ဒီနာမည္ေပးရတယ္ေတာ့ မဆိုတတ္ပါဘူး။ စာသား တုိေလးေတြမွာ ေအာင္ျမင္တယ္ဆုိေပမယ့္ စာသားရွည္ရွည္နဲ႔ ႐ႈပ္႐ႈပ္ေထြးေထြး ဝါက်ေတြ က်ရင္ေကာ ေအာင္ျမင္ပါ့မလားဆုိတာ ေတြးစရာပါ။ ဂၽြန္ေဟာပ္ကင္း တကၠသိုလ္ရဲ႕ သုေတသီ Chris Calisson ကေတာ့ Ravi နဲ႔ Knight တုိ႔ရဲ႕ စမ္းသပ္ခ်က္ဟာ ေရွ႕အလားအလာ သိပ္ေကာင္းတယ္လို႔ ဆုိပါတယ္။ Chris တုိ႔အဖြဲ႕ကလည္း ကြန္ပ်ဴတာေဆာ့ဖ္ဝဲသုံးၿပီး ဘာသာျပန္တဲ့အလုပ္ကို စမ္းသပ္ေနတာပါ။

သူ႔ေဆာ့ဖ္ဝဲကေတာ့ data ႏွစ္မ်ဳိး တစ္ၿပိဳင္တည္း အလုပ္လုပ္တဲ့ကိစၥကို ေရွာင္ရပါတယ္။ ေလာေလာဆယ္ အင္တာနက္ေပၚက text ေတြနဲ႔ စမ္းသပ္ေနပါတယ္။ မတူညီတဲ့ ဘာသာစကားႏွစ္ခုထဲက ကြဲလြဲခ်က္ေတြကို ရွာေဖြၿပီးအလုပ္လုပ္တဲ့ နည္းကိုသုံးပါတယ္။ အလုပ္လုပ္တာ ေႏွးတယ္၊ ဒါေပမဲ့စပိန္ႏွင့္ အဂၤလိပ္ဘာသာႏွစ္ခုကို ဘာသာျပန္ၾကည့္ေတာ့ ေအာင္ျမင္ေနပါတယ္။ Ravi နဲ႔ Knight တုိ႔အေနနဲ႔ ေရွ႕ဆက္ၿပီးလုပ္ဖို႔ ရည္ရြယ္ထားတာကသူတုိ႔ရဲ႕ Monolingual နည္းလမ္းဟာ ကမ႓ာေပၚမွာ မသုံးေတာ့တာ ၾကာၿပီျဖစ္တဲ့ ဘာသာစကားေတြနဲ႔ အဓိပၸာယ္ေဖာ္ဖို႔ မလြယ္တဲ့ ေရွးေဟာင္းဘာသာ စကားေတြကို အဓိပၸာယ္ေဖာ္ရာမွာ ကူညီႏိုင္မလားဆုိတဲ့ ကိစၥျဖစ္ပါတယ္။ ဒီကိစၥဟာ လုံးဝ ျဖစ္ႏုိင္တယ္လို႔ Ravi က ေျပာပါတယ္။ လင္းပိုင္ေတြ ေျပာတဲ့စကားကိုေတာင္ အဓိပၸာယ္ဖြင့္ႏုိင္ဦးမွာပါတဲ့။

ေနာင္စိုး(ထားဝယ္)

0 comments:

Post a Comment

ယေန႔ရက္စြဲ

သူငယ္ခ်င္းမ်ား

Google တြင္ရွာေဖြရန္

Hit Counter


Visitor Tracker


ေငြေၾကးလဲလွယ္မွဳႏွဳန္းထားမ်ား

Facebook Page