လက်ရှိတည်နေရာ: ပင်မစာမျက်နှာ> နောက်ဆုံးရဆောင်းပါးများစာရင်း> UTF-8 encoded strings များကိုကိုင်တွယ်ရန် MB_GEget_info လုပ်ဆောင်မှုသည်အခြား mbstring function များနှင့်အလုပ်လုပ်သနည်း။

UTF-8 encoded strings များကိုကိုင်တွယ်ရန် MB_GEget_info လုပ်ဆောင်မှုသည်အခြား mbstring function များနှင့်အလုပ်လုပ်သနည်း။

gitbox 2025-05-11

PHP တွင် Mbstring (Multibyte string) extension သည် multibyte encoded strings များကိုကိုင်တွယ်ရန်အတွက်အစွမ်းထက်သောကိရိယာများကိုထောက်ပံ့ပေးသည်။ အထူးသဖြင့် UTF-8 encoded strings များနှင့်ဆက်ဆံရာတွင် Mbstring function သည်အထူးအရေးကြီးသည်။ MB_Get_info သည် Mbstring extension တွင်အလွန်အသုံးဝင်သောလုပ်ဆောင်မှုတစ်ခုဖြစ်သည်။ ၎င်းသည်လက်ရှိဇာတ်ကောင် encoding နှင့်သက်ဆိုင်သောသတင်းအချက်အလက်များကိုရရှိရန်အသုံးပြုနိုင်သည်။ UTF-8 encoded strings များကိုကိုင်တွယ်ရန်အခြား Mbstring functions များနှင့် တွဲဖက်. မည်သို့အသုံးပြုရမည်ကိုသင်သိလိုပါကဤဆောင်းပါးသည်၎င်းကိုသင့်အတွက်အသေးစိတ်ရှင်းပြလိမ့်မည်။

mb_get_info function ကိုမိတ်ဆက်

MB_GET_INFO function ကိုအဓိကအားဖြင့် Mbstring extension ၏ configuration information ကိုရရှိရန်အဓိကအားဖြင့်အသုံးပြုသည်။ ၎င်း၏ပြန်လာတန်ဖိုးမှာ configuration information array တစ်ခုဖြစ်သည်။ ပုံမှန်အားဖြင့် MB_Get_info () MBString နှင့်ပတ်သက်သော configuration information အားလုံးကိုပြန်ပို့သည်။ အချို့သောတိကျသောသတင်းအချက်အလက်များကိုသင်သာဂရုစိုက်ပါက၎င်းကို parameters များကိုဖြတ်သန်းခြင်းဖြင့်သင်သတ်မှတ်နိုင်သည်။

 $info = mb_get_info();
print_r($info);

ဤလုပ်ဆောင်ချက်သည်သတင်းအချက်အလက်အမြောက်အများကိုရရှိစေသည်။

  • လက်ရှိဇာတ်ကောင် encoding ။

  • Mbstring ဗားရှင်း။

  • ရရှိနိုင်အက်ခရာ encodings ၏စာရင်း။

  • String processing ၏ internal encoding စသည်တို့ကိုစသည်တို့

သတ်မှတ်ထားသောစာလုံးအစု၏ configuration information ကိုသင်ကြည့်လိုပါက၎င်းကိုသင်ဤကဲ့သို့သောခေါ်ဆိုနိုင်သည်။

 $info = mb_get_info('encoding');
print_r($info);

UTF-8 encoded strings တွေကိုဘယ်လိုကိုင်တွယ်ရမလဲ

လက်တွေ့ကျကျလျှောက်လွှာများတွင် UTF-8 သည်အင်တာနက်ပေါ်တွင်အသုံးအများဆုံးအက်ခရာသင်္ကေတဖြစ်သည်။ UTF-8 encoded strings များနှင့်ဆက်ဆံရာတွင် Mbstring Extension သည်သင့်အားပိုမိုအဆင်ပြေစွာလုပ်ဆောင်နိုင်ရန်အတွက်ကူညီရန်အချို့သောလုပ်ဆောင်ချက်များကိုပေးသည်။

1 ။ string ကိုအရှည်ရရန် mb_strlen ကိုသုံးပါ

UTF-8 encoded strings များကို process လုပ်ရန်လိုအပ်သည့်အခါ PHP ၏ built-in strlen function ကိုတိုက်ရိုက် အသုံးပြု. ဇာတ်ကောင်အရေအတွက်ကိုမှန်ကန်စွာတွက်ချက်နိုင်မည်မဟုတ်ပါ။ ဘာဖြစ်လို့လဲဆိုတော့ strlen function ကဇာတ်ကောင်အတော်များများထက် bytes အတော်များများပြန်လာလို့ပဲ။ MB_strlen function သည် UTF-8 ကြိုးများကိုမှန်ကန်စွာပြုလုပ်နိုင်ပြီးအက်ခရာအရေအတွက်ကိုပြန်ပေးနိုင်သည်။

 $str = "မင်္ဂလာပါ,ကမ်ာဘ!";
$length = mb_strlen($str, 'UTF-8');
echo "string အရှည်:$length";  // ထုတ်လုပ်ခြင်း 6

2 ။ strings ကိုကြားဖြတ်ရန် MB_substr ကိုသုံးပါ

အလားတူစွာ MB_Substrintion function သည် MATCOBYTE encoded စာလုံးများကိုမှန်ကန်စွာကိုင်တွယ်နိုင်သည့် Mbstring extension တွင်အလွန်လက်တွေ့ကျသောလုပ်ဆောင်ချက်တစ်ခုဖြစ်သည်။ ဥပမာအားဖြင့် UTF-8 encoded string ကိုကြားဖြတ်သောအခါ MB_Subtr သည် ဇာတ်ကောင်များကိုဖြတ်တောက်ရန်သေချာစေနိုင်သည်။

 $str = "မင်္ဂလာပါ,ကမ်ာဘ!";
$substring = mb_substr($str, 0, 3, 'UTF-8');
echo "ကြားဖြတ် string ကို:$substring";  // ထုတ်လုပ်ခြင်း မင်္ဂလာပါ

3 ။ encoding ပြောင်းခြင်းအတွက် MB_ConVert_encoding ကိုသုံးပါ

MB_ConVert_encoding function ကိုမတူညီသောဇာတ်ကောင် encodings အကြားပြောင်းလဲရန်အသုံးပြုနိုင်သည်။ UTF-8 strings များနှင့်အလုပ်လုပ်စဉ်က string ကိုအခြား encoding formats (ISO-8859-1 သို့မဟုတ် Windows-1252) သို့ပြောင်းရန်လိုအပ်နိုင်သည်။

 $str = "မင်္ဂလာပါ,ကမ်ာဘ!";
$converted_str = mb_convert_encoding($str, 'ISO-8859-1', 'UTF-8');
echo "string ကိုပြောင်းလဲ:$converted_str";  

4 ။ စာလုံးထောက်ပြရန် MB_Detect_encoding ကိုသုံးပါ

string တစ်ခု၏ encoding နှင့် ပတ်သက်. သင်မသေချာသည့်အခါ string ၏ encoding format များကိုရှာဖွေရန် MB_Detect_encoding function ကိုသုံးနိုင်သည်။ ဤလုပ်ဆောင်ချက်သည်ဇာတ်ကောင်အစုံများစွာကိုထောက်ခံပြီး UTF-8-encoded strings များကိုတိကျစွာအသိအမှတ်ပြုသည်။

 $str = "မင်္ဂလာပါ,ကမ်ာဘ!";
$encoding = mb_detect_encoding($str, 'UTF-8, ISO-8859-1, GB2312');
echo "အဆိုပါ string ကို၏ encoding ဖြစ်ပါတယ်:$encoding";  // ထုတ်လုပ်ခြင်း UTF-8

mb_get_info ကိုအခြား Mbstring functions များနှင့်ပေါင်းစပ်

MB_GEget_info ၏အဓိကလုပ်ဆောင်ချက်မှာ string processing အတွက်တိုက်ရိုက်အသုံးပြုမည့်အစား Mbstring extension ၏ confcring extension ၏ configuration information ကိုရယူရန်ဖြစ်သည်။ သို့သော်ကျွန်ုပ်တို့သည် MB_Get_info မှတဆင့်လက်ရှိ configuration မှ encoding method ကိုစစ်ဆေးနိုင်ပြီး UTF-8 encoded strings များကိုမှန်ကန်စွာလုပ်ဆောင်ရန်အခြား mbstring လုပ်ဆောင်ချက်များကိုပေါင်းစပ်နိုင်သည်။

ဥပမာအားဖြင့်, Current Encoding ချိန်ညှိချက်များသည် UTF-8 ကိုအထောက်အပံ့ပေး,

 $info = mb_get_info('internal_encoding');
if ($info == 'UTF-8') {
    echo "လက်ရှိပြည်တွင်းရေးကုဒ်ဖြစ်ပါတယ်UTF-8,အပြောင်းအလဲနဲ့ဆက်လက်နိုင်ပါတယ်UTF-8ကြိုး";
} else {
    echo "လက်ရှိအတွင်းပိုင်း encoding မဟုတ်ပါဘူးUTF-8,အဲဒါကိုချိန်ညှိဖို့အကြံပြုသည်UTF-8အပြောင်းအလဲနဲ့လုပ်ဆောင်";
}

ဤနည်းလမ်းသည်ပရိုဂရမ်၏ configurations configurations သည် string string ကိုမလုပ်ဆောင်မီပစ်မှတ် encoding နှင့်ကိုက်ညီမှုရှိစေရန်သင့်အားကူညီနိုင်သည်။

နိဂုံးချုပ်အားဖြင့်

Mbstring extension တွင်လုပ်ဆောင်ချက်များကို UTF-8 ကဲ့သို့သော Multibyte ဇာတ်ကောင်အစုံများအတွက်ခိုင်မာသောထောက်ခံမှုပေးသည်။ MB_Get_info ကို အခြားလုပ်ဆောင်ချက်များကိုပေါင်းစပ်ခြင်းဖြင့် (ဥပမာ MB_strlen , MB_CSUBSUR , MB_COCVERT_ENCOCOTINGS ) ကိုပေါင်းစပ်ခြင်းဖြင့်), utf-8 encoded strings များကိုအလွယ်တကူကိုင်တွယ်နိုင်သည်။ ဤလုပ်ဆောင်မှုများကိုနားလည်သဘောပေါက်ခြင်းနှင့်အသုံးပြုခြင်းကိုစနစ်တကျပြုလုပ်ခြင်းသည်ဖွံ့ဖြိုးရေးစဉ်အတွင်းဘုံအက္ခရာများပြ problems နာများကိုရှောင်ရှားရန်နှင့်သင်၏ကုဒ်ကိုအားဖြည့်စွက်ခြင်းနှင့်လိုက်လျောညီထွေဖြစ်စေရန်သင့်အားရှောင်ရှားရန်ခွင့်ပြုလိမ့်မည်။