Position actuelle: Accueil> Derniers articles> Techniques et précautions pour que PHP se connecte à l'interface de reconnaissance vocale de Baidu

Techniques et précautions pour que PHP se connecte à l'interface de reconnaissance vocale de Baidu

gitbox 2025-06-06

1. Préface

La technologie de reconnaissance vocale joue un rôle de plus en plus important dans les applications intelligentes, en particulier dans des scénarios tels que le service client intelligent, l'assistant vocal, la contribution vocale, etc. L'API de reconnaissance vocale ouverte de Baidu fournit aux développeurs des services de reconnaissance vocale efficaces et stables. Cet article présentera comment se connecter à l'interface de reconnaissance vocale de Baidu via PHP pour aider les développeurs à créer rapidement des fonctions de reconnaissance vocale.

2. Aperçu de l'interface de reconnaissance vocale de Baidu

L'interface de reconnaissance vocale de Baidu prend en charge la conversion de la voix et de l'audio en texte, et prend en charge plusieurs formats et reconnaissance multilingue. En appelant l'interface API et en passant des données vocales, l'interface renverra les résultats de reconnaissance correspondants et les développeurs peuvent facilement intégrer les capacités de reconnaissance vocale dans le système.

Lorsque vous utilisez l'interface vocale Baidu, vous devez configurer correctement les paramètres de demande et traiter les données de réponse au format JSON afin d'obtenir des résultats de reconnaissance précis.

3. Processus d'amarrage de l'implémentation PHP

3.1 Préparation d'accès à l'interface

Avant d'appeler officiellement l'interface, vous devez d'abord enregistrer un compte Smart Cloud Baidu et créer une application pour obtenir les trois paramètres clés suivants:

  • Appid
  • Clé API
  • Clé secrète

Ces paramètres sont des informations d'identification nécessaires pour passer des appels d'interface et des autorisations de service de reconnaissance vocale sont également nécessaires.

3.2 Code PHP implémente l'appel de reconnaissance vocale

 
//Configurer l'interface de reconnaissance vocale BaiduAPI url
$url = 'http://vop.baidu.com/server_api';
//Définir les paramètres requis
$cuid = "123456789"; //ID de l'utilisateur
$format = "pcm";     //Format de fichier vocal
$rate = 16000;       //Taux d'échantillonnage
$channel = 1;        //Nombre de canaux
$token = "24.f601973d83600bb9532f8c32ed61c45c.2592000.1570309632.282335-17098763"; //access_token

//Ouvrez le fichier vocal et obtenez le contenu
$audio = file_get_contents("test.pcm");

//Définir les paramètres de demande
$header = array(
    "Content-Type: audio/" . $format,
    "Content-Length: " . strlen($audio),
    "cuid: " . $cuid,
    "rate: " . $rate,
    "channel: " . $channel,
    "token: " . $token
);

$options = array(
    'http' => array(
        'method'  => 'POST',
        'header'  => implode("\r\n", $header),
        'content' => $audio
    )
);

$context = stream_context_create($options);
//Envoyer une demande,et convertir le contenu de réponse enJSONFormat
$result = file_get_contents($url, false, $context);
$result = json_decode($result, true);

Le code est principalement divisé en trois parties:

  • Définir l'adresse et les paramètres de l'interface
  • Lisez le contenu du fichier vocal
  • Utilisez `file_get_contents ()` pour envoyer une demande de poste pour obtenir des résultats de reconnaissance

Il est particulièrement important de noter que Access_token est la clé de la vérification de l'autorisation d'interface et doit être valide et expiré. Pour la méthode d'obtention de Access_token, veuillez vous référer à la documentation officielle de la plate-forme ouverte Baidu.

3.3 choses à noter pendant le processus de mise en œuvre

  • Exigences du fichier vocal : doit être au format PCM 16 bits, mono et la fréquence d'échantillonnage est de 16000 Hz.
  • ID utilisateur (CUID) : il doit être unique, et l'ID utilisateur, l'ID de périphérique, etc. peuvent être utilisés.
  • Token d'accès (Access_token) : Le nombre d'appels est limité et la validité doit être confirmée avant chaque utilisation.

4. Résumé

Cet article présente le processus complet de l'utilisation de PHP pour implémenter les appels d'interface de reconnaissance vocale de Baidu, y compris le paramètre de paramètres, le téléchargement audio, le traitement de la réponse et les précautions. Grâce à l'intégration et à la configuration correctes, la fonction voix / texte peut être facilement implémentée dans diverses applications, améliorant l'expérience d'interaction utilisateur.