当前位置: 首页> 最新文章列表> PHP如何连接百度文心一言API并使用多种方法过滤句子内容

PHP如何连接百度文心一言API并使用多种方法过滤句子内容

gitbox 2025-06-16

1. 介绍

在开发网站时,使用开放API获取数据是常见的需求。百度文心一言API是一个非常受欢迎的接口,可以返回各类精美的句子。在本文中,我们将探讨如何使用PHP连接百度文心一言API获取特定类型的句子,并提供多种过滤方法以满足我们的需求。

2. 获取一言句子

2.1 百度文心一言API简介

百度文心一言API是一个免费的公共接口,提供各种类型的名言警句、励志语录、动漫台词等,特别适合用来打造语录类网站。你可以通过访问该API的官方网站获取接口地址。

该API无需认证信息,只需要通过HTTP请求即可获得数据。以下是使用PHP的file_get_contents

在上面的代码中,我们通过添加?c=a参数来指定返回“动漫”类型的名言。可以更改参数值来获取其他类型的句子,如?c=c获取“古风”名言。

返回的结果是一个PHP数组,包含名言、作者及来源等信息。你可以通过以下代码获取其中的具体内容:


$hitokoto = $result['hitokoto'];
$author = $result['from'];

2.2 连接API

为了获取特定类型的句子,我们可以在请求URL中添加不同的参数。例如,如果我们需要获取“编程”类的中文短句,可以按照以下方式发起请求:


$url = "https://v1.hitokoto.cn/?c=program&encode=text&charset=utf-8";
$response = file_get_contents($url);

此请求使用了c=program参数来获取“编程”类型句子,并指定返回文本格式和UTF-8字符集。

3. 过滤句子

3.1 过滤敏感词汇

为了避免网站出现不当内容,我们可以通过PHP中的正则表达式来过滤敏感词汇。以下代码演示了如何使用preg_replace函数替换句子中的脏话:


$badwords = array('草', '操', '尼玛', '妈逼');
$hitokoto = preg_replace('/'.implode('|', $badwords).'/i', '**', $hitokoto);

通过正则表达式,我们将敏感词汇替换为“**”,从而有效清理句子中的脏话。

3.2 设置字符长度

为了确保页面排版的整齐和美观,我们可以限制句子的字符长度。以下代码演示了如何截取不超过20个字符的句子:


$hitokoto = mb_substr($hitokoto, 0, 20);

我们通过mb_substr函数截取句子,限制其长度不超过20个字符。

3.3 过滤HTML标签

为了确保用户输入的内容安全,我们需要去除句子中的HTML标签。以下方法使用strip_tags函数来过滤HTML标签:


$hitokoto = strip_tags($hitokoto);

使用strip_tags函数后,我们可以得到不含HTML标签的纯文本内容。

4. 结论

本文介绍了如何通过PHP连接百度文心一言API,获取特定类型的句子,并提供了多种方法来过滤和优化句子的内容。通过设置API请求参数,结合正则表达式、字符长度限制和HTML标签过滤等方法,我们可以根据需要获取并处理符合要求的句子。你可以根据实际需求进一步扩展这些方法,以更好地服务于网站的用户体验。