音声認識テクノロジーは、特にインテリジェントカスタマーサービス、音声アシスタント、音声入力などのシナリオで、インテリジェントなアプリケーションでますます重要な役割を果たしています。Baiduのオープンボイス認識APIは、開発者に効率的で安定した音声認識サービスを提供します。この記事では、PHPを介したBaiduの音声認識インターフェイスに接続する方法を紹介して、開発者が音声認識機能を迅速に構築できるようにします。
Baiduの音声認識インターフェイスは、音声とオーディオのテキストへの変換をサポートし、複数の形式と多言語認識をサポートします。 APIインターフェイスを呼び出して音声データを渡すことにより、インターフェイスは対応する認識結果を返し、開発者はシステム内の音声認識機能を簡単に統合できます。
Baidu Voiceインターフェイスを使用する場合、正確な認識結果を取得するために、要求パラメーターを正しく構成し、JSON形式で応答データを処理する必要があります。
正式にインターフェイスを呼び出す前に、最初にBaidu Smart Cloudアカウントを登録し、次の3つの重要なパラメーターを取得するアプリケーションを作成する必要があります。
これらのパラメーターは、インターフェイスコールを作成するために必要な資格情報であり、音声認識サービスの許可も必要です。
//Baidu音声認識インターフェイスをセットアップしますAPI url
$url = 'http://vop.baidu.com/server_api';
//必要なパラメーターを設定します
$cuid = "123456789"; //ユーザーID
$format = "pcm"; //音声ファイル形式
$rate = 16000; //サンプリングレート
$channel = 1; //チャネルの数
$token = "24.f601973d83600bb9532f8c32ed61c45c.2592000.1570309632.282335-17098763"; //access_token
//音声ファイルを開き、コンテンツを取得します
$audio = file_get_contents("test.pcm");
//リクエストパラメーターを設定します
$header = array(
"Content-Type: audio/" . $format,
"Content-Length: " . strlen($audio),
"cuid: " . $cuid,
"rate: " . $rate,
"channel: " . $channel,
"token: " . $token
);
$options = array(
'http' => array(
'method' => 'POST',
'header' => implode("\r\n", $header),
'content' => $audio
)
);
$context = stream_context_create($options);
//リクエストを送信します,応答コンテンツをに変換しますJSON形式
$result = file_get_contents($url, false, $context);
$result = json_decode($result, true);
コードは主に3つの部分に分割されます。
Access_Tokenがインターフェイス許可確認の鍵であり、有効で期限切れでなければならないことに注意することが特に重要です。 Access_Tokenを取得する方法については、Baidu Open Platformの公式ドキュメントを参照してください。
この記事では、PHPを使用して、パラメーター設定、オーディオアップロード、応答処理、予防措置など、Baiduの音声認識インターフェイスコールを実装する完全なプロセスを紹介します。正しい統合と構成により、音声からテキストへの関数をさまざまなアプリケーションで簡単に実装して、ユーザーの相互作用エクスペリエンスを向上させることができます。