如何使用PHP实现敏感词过滤功能：步骤与示例代码

gitbox 2025-06-15

1. 简介

在现代网站的开发中，敏感词过滤是保障用户合法权益和网站内容合规性的重要环节。它不仅有助于防止用户发布不良信息，还能降低公司因违规内容而面临的法律风险。本文将详细介绍如何使用PHP实现敏感词过滤功能。

2. 敏感词过滤的步骤

2.1 读取敏感词列表

在进行敏感词过滤之前，首先需要读取存储敏感词的列表。一般来说，敏感词列表会存放在文件中，可以使用以下代码来读取文件内容：


$sensitive_file_path = 'sensitive_words.txt';
$sensitive_words = file($sensitive_file_path, FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);

这段代码将从指定的文件路径读取敏感词列表，并按行存储到$sensitive_words数组中，同时忽略空行和换行符。

2.2 构建正则表达式

读取敏感词列表后，接下来需要将这些敏感词转化为正则表达式格式，以便于在后续步骤中进行匹配。下面是将敏感词转换为正则表达式的代码：


$pattern = '/(' . implode('|', $sensitive_words) . ')/i';

此段代码将敏感词用'|'拼接成一个正则表达式，并使用'/…/i'包裹，表示进行不区分大小写的匹配。

2.3 进行匹配

正则表达式构建完成后，可以使用preg_match()函数对需要过滤的文本进行匹配。以下是进行匹配的代码示例：


$filtered_text = preg_replace($pattern, '***', $text);

这段代码会将文本$text中与敏感词匹配的部分替换为'***'，并将过滤后的文本存放在$filtered_text变量中。

2.4 完整代码示例

以下是一个完整的敏感词过滤功能代码示例：


$sensitive_file_path = 'sensitive_words.txt';
$sensitive_words = file($sensitive_file_path, FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);
$pattern = '/(' . implode('|', $sensitive_words) . ')/i';
$filtered_text = preg_replace($pattern, '***', $text);

3. 总结

通过本文的讲解，我们了解了如何使用PHP实现敏感词过滤功能，从读取敏感词列表到构建正则表达式，再到使用preg_replace()函数进行文本匹配和替换，最终完成一个完整的敏感词过滤系统。

在使用敏感词过滤功能时，需要定期更新敏感词列表，确保过滤效果的准确性，避免漏掉新的敏感词。