如何正确使用mb_strcut函数来截取多字节字符串？详细操作步骤讲解

gitbox 2025-05-31

在PHP中处理多字节字符（如中文、日文、韩文等）时，mb_strcut 是一个非常实用的函数。与 substr 不同，它能够保证不会将多字节字符截断，从而避免乱码问题。本文将详细讲解如何正确使用 mb_strcut 来截取多字节字符串，并结合实际案例进行演示。

一、mb_strcut 与 mb_substr 的区别

在开始之前，先简单了解一下 mb_strcut 与 mb_substr 的区别：

这意味着，mb_strcut 更适合在字节级别处理文本，如限制数据库字段长度、生成摘要等场景。

string mb_strcut(string $string, int $start, int $length = null, string $encoding = null)

<?php
$str = "你好，世界！";
$result = mb_strcut($str, 0, 6, "UTF-8");
echo $result; // 输出：你好
?>

解释：每个汉字在 UTF-8 编码下占用 3 个字节，因此 6 个字节正好是两个汉字。

如果使用 substr 截取中文，容易出现乱码：

<?php
$str = "你好，世界！";
echo substr($str, 0, 5); // 可能输出乱码
?>

改为 mb_strcut 后可避免这个问题：

<?php
$str = "你好，世界！";
echo mb_strcut($str, 0, 5, "UTF-8"); // 输出：你
?>

当你需要截取文章摘要时，可以使用如下方式：

<?php
$content = "欢迎访问我们的官网：https://gitbox.net/blog/php-mb_strcut-use";
$summary = mb_strcut($content, 0, 60, "UTF-8");
echo $summary . "...";
?>

这将在网页中安全地显示出固定长度的摘要而不会乱码。

因为多字节字符在不同编码下占用字节长度不同，推荐使用 mb_strlen 配合 mb_strcut 来进行动态处理：

<?php
function safe_cut($str, $maxBytes, $encoding = "UTF-8") {
    return mb_strcut($str, 0, $maxBytes, $encoding);
}
?>

这样你可以灵活设置字节限制，比如：

echo safe_cut("这是一个PHP字符串处理的例子", 9); // 输出：这是

mb_strcut 是PHP中处理多字节字符串的重要工具，尤其适用于需要精确控制字节长度的场景。通过合理设置起始位置和长度，并结合编码设置，可以轻松避免乱码问题，提升程序的健壮性。在开发中充分利用 mb_strcut，能够让你在处理多语言字符串时更加游刃有余。