La technologie de reconnaissance vocale joue un rôle de plus en plus important dans les applications intelligentes, en particulier dans des scénarios tels que le service client intelligent, l'assistant vocal, la contribution vocale, etc. L'API de reconnaissance vocale ouverte de Baidu fournit aux développeurs des services de reconnaissance vocale efficaces et stables. Cet article présentera comment se connecter à l'interface de reconnaissance vocale de Baidu via PHP pour aider les développeurs à créer rapidement des fonctions de reconnaissance vocale.
L'interface de reconnaissance vocale de Baidu prend en charge la conversion de la voix et de l'audio en texte, et prend en charge plusieurs formats et reconnaissance multilingue. En appelant l'interface API et en passant des données vocales, l'interface renverra les résultats de reconnaissance correspondants et les développeurs peuvent facilement intégrer les capacités de reconnaissance vocale dans le système.
Lorsque vous utilisez l'interface vocale Baidu, vous devez configurer correctement les paramètres de demande et traiter les données de réponse au format JSON afin d'obtenir des résultats de reconnaissance précis.
Avant d'appeler officiellement l'interface, vous devez d'abord enregistrer un compte Smart Cloud Baidu et créer une application pour obtenir les trois paramètres clés suivants:
Ces paramètres sont des informations d'identification nécessaires pour passer des appels d'interface et des autorisations de service de reconnaissance vocale sont également nécessaires.
//Configurer l'interface de reconnaissance vocale BaiduAPI url
$url = 'http://vop.baidu.com/server_api';
//Définir les paramètres requis
$cuid = "123456789"; //ID de l'utilisateur
$format = "pcm"; //Format de fichier vocal
$rate = 16000; //Taux d'échantillonnage
$channel = 1; //Nombre de canaux
$token = "24.f601973d83600bb9532f8c32ed61c45c.2592000.1570309632.282335-17098763"; //access_token
//Ouvrez le fichier vocal et obtenez le contenu
$audio = file_get_contents("test.pcm");
//Définir les paramètres de demande
$header = array(
"Content-Type: audio/" . $format,
"Content-Length: " . strlen($audio),
"cuid: " . $cuid,
"rate: " . $rate,
"channel: " . $channel,
"token: " . $token
);
$options = array(
'http' => array(
'method' => 'POST',
'header' => implode("\r\n", $header),
'content' => $audio
)
);
$context = stream_context_create($options);
//Envoyer une demande,et convertir le contenu de réponse enJSONFormat
$result = file_get_contents($url, false, $context);
$result = json_decode($result, true);
Le code est principalement divisé en trois parties:
Il est particulièrement important de noter que Access_token est la clé de la vérification de l'autorisation d'interface et doit être valide et expiré. Pour la méthode d'obtention de Access_token, veuillez vous référer à la documentation officielle de la plate-forme ouverte Baidu.
Cet article présente le processus complet de l'utilisation de PHP pour implémenter les appels d'interface de reconnaissance vocale de Baidu, y compris le paramètre de paramètres, le téléchargement audio, le traitement de la réponse et les précautions. Grâce à l'intégration et à la configuration correctes, la fonction voix / texte peut être facilement implémentée dans diverses applications, améliorant l'expérience d'interaction utilisateur.