တရုတ်ပြည်မကြီး, မလေးရှားနှင့်အခြားဒေသများတွင်တရုတ်ပြည်မကြီး, မလေးရှားနှင့်အခြားဒေသများတွင်လူကြိုက်များသောဘာသာစကားဖြစ်သည်။ တရုတ်အက္ခရာများသည်ထူးခြားပြီးရှုပ်ထွေးသောလေဖြတ်ခြင်းနှင့်အစွန်းရောက်များဖြင့်ဖွဲ့စည်းထားပြီး,
တရုတ်ဘာသာစကားကိုသိုလှောင်ခြင်းနှင့်ပြုပြင်ခြင်းအတွက်ကွန်ပျူတာများတွင်စာဝှက်ရန်လိုအပ်သည်။ အသုံးများသော encoding နည်းလမ်းများသည်အဓိကအားဖြင့်ဖြစ်သည်။
GB2312 encoding
Unicode Encoding
၎င်းတို့အနက် GB2312 သည်တရုတ်အက်ခရာ 6763 ခုအပါအ 0 င်တရုတ်အက်ခရာ 6763 ခုအပါအ 0 င်နှစ်ဆ byte encoding ဖြစ်သည်။ Unicode Encoding တွင်ကမ္ဘာတစ်ဝှမ်းရှိအက္ခရာများအားလုံးပါ 0 င်သည်။
PHP တွင်ပုံမှန်အသုံးအနှုန်းများကို Unicode Range ရှိတရုတ်စာလုံးများနှင့်ကိုက်ညီရန်အသုံးပြုနိုင်သည်။
// စာသားမဟုတ်သောတရုတ်စာလုံးများကိုဖျက်ပါ
function remove_non_chinese($text) {
// တရုတ်စာလုံးများကိုသာထိန်းသိမ်းထားသည်
$pattern = '/[\x{4e00}-\x{9fa5}]+/u';
return preg_replace($pattern, '', $text);
}
အထက်ဖော်ပြပါကုဒ်သည် Unicode encoding range ကိုအသုံးပြုသည် ။
$text = 'Hello, မင်္ဂလာပါ,ငါက PHP တည်ဆောက်သူ。';
တရုတ်မဟုတ်သောစာလုံးများကိုဖျက်ရန် function ကိုခေါ်ဆိုခြင်း
$chinese_only = remove_non_chinese($text);
echo $chinese_only; // ထုတ်လုပ်ခြင်း:မင်္ဂလာပါငါကPHPတည်ဆောက်သူ
အပြေးရလဒ်များအရအင်္ဂလိပ်နှင့်နေရာများကိုအောင်မြင်စွာစစ်ထုတ်ပြီးတရုတ်စာလုံးများကိုသာချန်ထားခဲ့သည်။
ဤနည်းလမ်းသည်အဓိကအားဖြင့်ရိုးရှင်းသောတရုတ်စာလုံးများနှင့်ကိုက်ညီပြီးရိုးရာတရုတ်စာလုံးများအတွက်အကန့်အသတ်ရှိသည်။ ထို့အပြင်ကာလများနှင့်ကော်မာများကဲ့သို့ပုဒ်ဖြတ်ပုဒ်ရပ်များလည်းဖယ်ရှားပစ်လိမ့်မည်။ တိကျသော application ကိုကျင့်သုံးသောအခါ၎င်းသည်အမှန်တကယ်ဇာတ်လမ်းနှင့်ကိုက်ညီစေရန်လိုအပ်ချက်များနှင့်အညီပုံမှန်စကားရပ်ကိုချိန်ညှိနိုင်သည်။