PHP實現百度文心一言API連接與句子過濾方法

gitbox 2025-06-16

在開發網站時，開發者常常需要藉助開放API獲取外部數據。百度文心一言API作為一種廣泛使用的免費接口，提供了多種精美句子，適合用作“語錄”類內容的來源。本文將探討如何通過PHP連接百度文心一言API，獲取特定類型的句子，並展示幾種有效的句子過濾方法，以便更好地滿足開發需求。

百度文心一言API是一個完全免費的公共接口，提供各種類型的句子，包括名言警句、勵志語錄、動漫台詞、遊戲台詞等，適合用於網站內容展示。通過訪問該API，開發者可以獲取不同類型的句子：

該API無需認證信息，只需發送GET請求即可獲取數據。例如，可以使用PHP的file_get_contents

在上述代碼中，URL參數?c=a指定了返回類型為“動漫”的句子。其他可選的類型參數包括： c=c代表“古風”， c=d表示“雞湯”類型。

返回的數據為PHP關聯數組，包含名言內容、作者、來源等信息。可以通過以下代碼獲取句子和作者信息：

 
        $hitokoto = $result['hitokoto'];
        $author = $result['from'];

上述方法能夠獲取通用的名言句子，但如果我們需要獲取特定類型的句子，可以在請求的URL中增加參數進行篩選。例如，如果需要獲取“編程”類的中文短句，可以使用如下方式：

 
        $url = "https://v1.hitokoto.cn/?c=program&encode=text&charset=utf-8";
        $response = file_get_contents($url);

此時，我們使用了c=program參數來獲取“編程”類型的句子，並設置返回格式為文本encode=text和字符集為UTF-8。

為了確保網站內容不包含不當語言，開發者可以使用正則表達式來過濾掉不良詞彙。例如，可以通過以下方法過濾掉常見的髒話：

 
        $badwords = array('草', '操', '尼瑪', '媽逼');
        $hitokoto = preg_replace('/' . implode('|', $badwords) . '/i', '**', $hitokoto);

上述代碼使用了PHP的preg_replace函數，通過正則表達式將不良詞彙替換為星號** ，確保句子中不會出現不當內容。

為了保持頁面排版的整潔，開發者常常需要限制句子的長度，防止過長的句子破壞佈局。可以使用以下代碼來限制句子的最大長度：

 
        $hitokoto = mb_substr($hitokoto, 0, 20);

在上述代碼中，使用了PHP的mb_substr函數來截取句子的前20個字符，以確保句子的長度不超過指定限制。

為了確保用戶輸入的內容安全，開發者需要移除句子中的HTML標籤。可以使用PHP的strip_tags函數來實現這一目標：

 
        $hitokoto = strip_tags($hitokoto);

該函數會移除字符串中的所有HTML標籤，返回純文本內容，防止用戶通過輸入惡意代碼來攻擊網站。

通過本文的介紹，開發者可以了解到如何通過PHP連接百度文心一言API，獲取特定類型的句子，並利用正則表達式、字符長度控制及HTML標籤過濾等方法對句子進行進一步處理。這些方法有助於確保網站展示的內容既符合需求，又保持良好的質量和安全性。在實際應用中，開發者可以根據具體需求靈活調整參數和過濾規則。