ウェブサイトを開発するとき、開発者はしばしばオープンAPIを使用して外部データを取得する必要があります。広く使用されている無料のインターフェースとして、Baidu Wenxin Yiyan APIはさまざまな絶妙な文章を提供し、「引用」のコンテンツのソースとして使用するのに適しています。この記事では、PHPを介してBaidu Wenxin Yiyan APIに接続し、特定の種類の文を取得し、開発ニーズをよりよく満たすためにいくつかの効果的な文フィルタリング方法を表示する方法について説明します。
Baidu Wenxin Yiyan APIは、ウェブサイトのコンテンツを表示するのに適した有名な引用、インスピレーションの引用、アニメライン、ゲームラインなど、さまざまな種類の文を提供する完全に無料のパブリックインターフェイスです。 APIにアクセスすることにより、開発者はさまざまなタイプの文を取得できます。
このAPIは認証情報を必要とせず、データを取得するためにGETリクエストを送信するだけです。たとえば、PHPのfile_get_contents
使用できます
上記のコードでは、URLパラメーター?c = aは、 returnタイプ「アニメーション」の文を指定します。その他のオプションのタイプパラメーターには次のものがあります。C = Cは「古代スタイル」を表し、 C = Dは「チキンスープ」タイプを表します。
返されたデータは、有名な引用コンテンツ、著者、ソースなどの情報を含むPHP連想配列です。文および著者情報は、次のコードを介して取得できます。
$hitokoto = $result['hitokoto'];
$author = $result['from'];
上記の方法では、一般的な有名な引用文を取得できますが、特定のタイプの文を取得する必要がある場合は、フィルタリングのために要求されたURLにパラメーターを追加できます。たとえば、「プログラミング」クラスの短い中国の文を取得する必要がある場合は、次の方法を使用できます。
$url = "https://v1.hitokoto.cn/?c=program&encode=text&charset=utf-8";
$response = file_get_contents($url);
この時点で、 C =プログラムパラメーターを使用して「プログラム」タイプの文を取得し、テキストEncode =テキストに戻り形式を設定し、文字をUTF-8に設定します。
ウェブサイトのコンテンツに不適切な言語が含まれていないことを確認するために、開発者は正規表現を使用して悪い語彙を除外できます。たとえば、一般的な誓いの言葉を次のように除外できます。
$badwords = array('草', '所有', 'ニマ', 'お母さんの猫');
$hitokoto = preg_replace('/' . implode('|', $badwords) . '/i', '**', $hitokoto);
上記のコードは、PHPのpreg_replace関数を使用し、不適切なボキャブラリーを正規表現でAsterisk **に置き換えて、文に不適切なコンテンツがないことを確認します。
ページのレイアウトをきちんと維持するために、開発者はしばしば文の長さを制限して、過度に長い文がレイアウトに損害を与えるのを防ぐ必要があります。次のコードを使用して、文の最大長を制限できます。
$hitokoto = mb_substr($hitokoto, 0, 20);
上記のコードでは、PHPのMB_Substr関数を使用して、文の最初の20文字をインターセプトして、文の長さが指定された制限を超えないことを確認します。
ユーザーが入力したコンテンツが安全であることを確認するには、開発者は文からHTMLタグを削除する必要があります。これは、PHPのStrip_Tags関数を使用して実現できます。
$hitokoto = strip_tags($hitokoto);
この関数は、文字列内のすべてのHTMLタグを削除し、プレーンテキストコンテンツを返し、ユーザーが悪意のあるコードを入力してWebサイトを攻撃することを防ぎます。
この記事の導入を通じて、開発者はPHPを介してBaidu Wenxin Yiyan APIに接続し、特定のタイプの文を取得し、正規表現、文字長コントロール、およびHTMLタグフィルタリングを使用して、さらに処理文を取得する方法を学ぶことができます。これらの方法は、ウェブサイトに表示されるコンテンツがニーズを満たし、良質と安全を維持することを保証するのに役立ちます。実際のアプリケーションでは、開発者は特定のニーズに応じてパラメーターとフィルタリングルールを柔軟に調整できます。