UNICODE
ဝီကီပီးဒီးယား, အခမဲ့စွယ်စုံကျမ်းထဲကနေ
ရှာဖွေ navigationJump ဤနေရာသို့သွားရန် အဆိုပါ 1889 က Universal Telegraphic Phrase-စာအုပ်အဘို့, ကုန်သွယ်လုပ်ငန်းခွန်ကုဒ် (ဆက်သွယ်ရေး) ကိုကြည့်ပါ။ ဟူသောဝေါဟာရကို "ယူနီကုဒ်" Microsoft မှစာရွက်စာတမ်းများအတွက်ဘာကိုဆိုလိုသလဲဆိုတာအဘို့, UTF-16 ကိုကြည့်ပါ။ ယူနီကုဒ် နယူးယူနီကုဒ် logo.png အဆိုပါယူနီကုဒ် Consortium ၏လိုဂို alias (es) က Universal coded Character Set (UCS) ဘာသာစကား (s) ကိုအင်တာနေရှင်နယ် စံယူနီကုဒ်စံ encoding ကို formats UTF-8, UTF-16, GB18030 ဒီထက်ဘုံ: UTF-32, BOCU, SCSU, UTF-7 က ISO 8859 နေဖြင့်ရှေ့ပြေးအမျိုးမျိုးအခြားသူတွေ vte ဤဆောင်းပါးသည်အထူးအက္ခရာများပါဝင်သည်။ သငျ့လျြောသောတင်ဆက်မှုထောက်ခံမှုမပါဘဲ, သငျသညျဆိုတဲ့မေးခွန်းကိုအမှတ်, သေတ္တာများသို့မဟုတ်အခြားသင်္ကေတများကိုမြင်ရလိမ့်မည်။ ယူနီကုဒ်ကမ္ဘာ့အရေးအသားစနစ်များအများစုအတွက်ထုတ်ဖော်ပြောဆိုနေတဲ့ကွန်ပျူတာစက်မှုလုပ်ငန်းဟာတသမတ်တည်း encoding ကများအတွက်စံ, ကိုယ်စားပြုမှုနှင့်စာသားကိုင်တွယ်ဖြစ်ပါတယ်။ အဆိုပါစံယူနီကုဒ် Consortium အားဖြင့်ထိန်းသိမ်းထား, မေလ, 2019 လတ်တလောဗားရှင်းအဖြစ်, ယူနီကုဒ် 12.1, 137,994 150 ခေတ်မီခြင်းနှင့်သမိုင်းဝင် script များဖုံးအုပ်ဇာတ်ကောင်အဖြစ်မျိုးစုံသင်္ကေတအစုံနဲ့ရုပ်ပြောင်တစ်ခု repertoire ပါရှိသည်။ နေသည် အဆိုပါယူနီကုဒ်စံ၏ဇာတ်ကောင် repertoire ISO / IEC 10646 နှင့်အတူညှိများနှင့်နှစ်ဦးစလုံးကုဒ်-for-code ကိုတူညီနေကြသည်ဖြစ်ပါတယ်။ အဆိုပါယူနီကုဒ်စံအမြင်အာရုံကိုကိုးကား, စံ character encoding မျိုးစုံတစ်ခု encoding ကနည်းလမ်းနှင့်အစု, ရည်ညွှန်းဒေတာဖိုင်များကိုအစုတခုနှင့်ထိုကဲ့သို့သောဇာတ်ကောင်ဂုဏ်သတ္တိများ, ပုံမှန်အဘို့စည်းမျဉ်းစည်းကမ်းတွေ, ပြိုကွဲ, စုစည်းစီစဉ်အဖြစ်ဆက်စပ်ပစ္စည်းများ, တစ်အရေအတွက်ကုဒ်ဇယားအစုတခုပါဝင်ပါသည် (ထိုကဲ့သို့သောဗေီနှင့်ဟီဘရူးအဖြစ် Right-To-လက်ဝဲ script များ, နှင့်လက်ဝဲမှလက်ယာ script များနှစ်မျိုးလုံးပါဝင်သောစာသားမှန်ကန်သော display ကိုအဘို့), rendering နှင့် bidirectional display ကိုအမိန့်။ [1] စညျးလုံးဇာတ်ကောင်အစုံမှာယူနီကုဒ်၏အောင်မြင်မှုကွန်ပျူတာ software ကို internationalization နှင့်ဒေသခံ၎င်း၏ကျယ်ပြန့်ခြင်းနှင့်အများစုသုံးမှဦးဆောင်လျက်ရှိသည်။ အဆိုပါစံခေတ်မီတဲ့ operating systems XML ကို, ဂျာဗား (နှင့်အခြားပရိုဂရမ်ဘာသာစကားတွေ) အပါအဝင်များစွာသောမကြာသေးမီနည်းပညာများ, အကောင်အထည်ဖော်, နှင့် .NET Framework ကိုခံခဲ့ရသည်။ ယူနီကုဒ် character encoding မျိုးစုံကအကောင်အထည်ဖော်ဆောင်ရွက်နိုင်ပါသည်။ အဆိုပါယူနီကုဒ်စံ UTF-8, UTF-16, နဲ့ UTF-32 သတ်မှတ်ပါတယ်နှင့်အခြား encoding မျိုးစုံအသုံးပြုမှု၌ရှိကြ၏။ အသုံးအများဆုံးမှာ UTF-8, UTF-16, နှင့် (ယူနီကုဒ်အဘို့အပြည့်အဝထောက်ခံမှုမပါဘဲ) UCS-2, UTF-16 ၏ရှေ့ပြေးပါ၏ GB18030 တာဝန်ရှိသူတစ်ဦးကယူနီကုဒ်စံတရုတ်နိုင်ငံတွင်စံများနှင့်အပြည့်အဝယူနီကုဒ်အကောင်အထည်ဖော်ဆောင်ရွက်နေသော, စဉ်မပေးပါ။ UTF-8, (ဝက်ဘ်ဆိုက်များ၏ 94% ကျော်များတွင်အသုံးပြု) က World Wide Web ကိုအပေါ်လွှမ်းမိုး encoding က [2] ပထမဦးဆုံး 128 ကုဒ်မှတ်နှင့်အခြားဇာတ်ကောင် 4 bytes အထိတဦးတည်းက byte အသုံးပြုသည်။ [3] ပထမဦးဆုံး 128 ယူနီကုဒ်ကုဒ်အချက်များမဆို ASCII စာသားကိုလည်း UTF-8 ကိုစာသားဖြစ်ပါတယ်ဆိုလိုတာကသည် ASCII ဇာတ်ကောင်ကိုကိုယ်စားပြုသည်။ UCS-2 တစ်ခုချင်းစီကိုဇာတ်ကောင်နှစ်ခု byte (16-bits) ကိုအသုံးပြုသည်သာပထမဦးဆုံး 65.536 ကုဒ်အချက်များ, ဒါခေါ်အခြေခံပညာဘာသာစကားမျိုးစုံလေယာဉ် (BMP) ဝှက်လို့ရပါတယ်။
                            SOURCE: Wikipedia

Comments

Popular Posts