當前位置: 首頁> 最新文章列表> PHP實現百度文心一言API連接與句子過濾方法

PHP實現百度文心一言API連接與句子過濾方法

gitbox 2025-06-16

1. 介紹

在開發網站時,開發者常常需要藉助開放API獲取外部數據。百度文心一言API作為一種廣泛使用的免費接口,提供了多種精美句子,適合用作“語錄”類內容的來源。本文將探討如何通過PHP連接百度文心一言API,獲取特定類型的句子,並展示幾種有效的句子過濾方法,以便更好地滿足開發需求。

2. 獲取一言句子

2.1 百度文心一言API

百度文心一言API是一個完全免費的公共接口,提供各種類型的句子,包括名言警句、勵志語錄、動漫台詞、遊戲台詞等,適合用於網站內容展示。通過訪問該API,開發者可以獲取不同類型的句子:

該API無需認證信息,只需發送GET請求即可獲取數據。例如,可以使用PHP的file_get_contents

在上述代碼中,URL參數?c=a指定了返回類型為“動漫”的句子。其他可選的類型參數包括: c=c代表“古風”, c=d表示“雞湯”類型。

返回的數據為PHP關聯數組,包含名言內容、作者、來源等信息。可以通過以下代碼獲取句子和作者信息:

 
        $hitokoto = $result['hitokoto'];
        $author = $result['from'];
    

2.2 連接API

上述方法能夠獲取通用的名言句子,但如果我們需要獲取特定類型的句子,可以在請求的URL中增加參數進行篩選。例如,如果需要獲取“編程”類的中文短句,可以使用如下方式:

 
        $url = "https://v1.hitokoto.cn/?c=program&encode=text&charset=utf-8";
        $response = file_get_contents($url);
    

此時,我們使用了c=program參數來獲取“編程”類型的句子,並設置返回格式為文本encode=text和字符集為UTF-8。

3. 過濾句子

3.1 過濾敏感詞彙

為了確保網站內容不包含不當語言,開發者可以使用正則表達式來過濾掉不良詞彙。例如,可以通過以下方法過濾掉常見的髒話:

 
        $badwords = array('草', '操', '尼瑪', '媽逼');
        $hitokoto = preg_replace('/' . implode('|', $badwords) . '/i', '**', $hitokoto);
    

上述代碼使用了PHP的preg_replace函數,通過正則表達式將不良詞彙替換為星號** ,確保句子中不會出現不當內容。

3.2 設置字符長度

為了保持頁面排版的整潔,開發者常常需要限制句子的長度,防止過長的句子破壞佈局。可以使用以下代碼來限制句子的最大長度:

 
        $hitokoto = mb_substr($hitokoto, 0, 20);
    

在上述代碼中,使用了PHP的mb_substr函數來截取句子的前20個字符,以確保句子的長度不超過指定限制。

3.3 過濾HTML標籤

為了確保用戶輸入的內容安全,開發者需要移除句子中的HTML標籤。可以使用PHP的strip_tags函數來實現這一目標:

 
        $hitokoto = strip_tags($hitokoto);
    

該函數會移除字符串中的所有HTML標籤,返回純文本內容,防止用戶通過輸入惡意代碼來攻擊網站。

4. 結論

通過本文的介紹,開發者可以了解到如何通過PHP連接百度文心一言API,獲取特定類型的句子,並利用正則表達式、字符長度控制及HTML標籤過濾等方法對句子進行進一步處理。這些方法有助於確保網站展示的內容既符合需求,又保持良好的質量和安全性。在實際應用中,開發者可以根據具體需求靈活調整參數和過濾規則。