Google Voice Search Tweaks Sur Android Pour le rendre plus rapide et plus précis
Avez-vous remarqué une amélioration à la recherche de voix ou voix de la capacité de la dictée de votre téléphone dans les derniers jours, en particulier dans des environnements bruyants? Vous pouvez remercier le discours équipe Google. Ils ont mis en place un nouveau système pour l'écoute automatisé à des voix humaines. Ajout d'une fonctionnalité de réseau neuronal récurrent au système a permis d'identifier avec plus de précision des mots complets au lieu de fragments individuels de son. Du Blog Google recherche:
Nos modèles acoustiques améliorées comptent sur les réseaux de neurones récurrents (RNN). RNNs ont des boucles de rétroaction dans leur topologie, leur permettant de modéliser les dépendances temporelles: lorsque l'utilisateur parle / u / dans l'exemple précédent, leur appareil articulatoire provient d'un / j / son et d'un / m / son avant. Essayez de dire à haute voix - «musée» - il coule tout naturellement dans un souffle, et peuvent capturer que RNNs. Le type de RNN utilisé ici est une mémoire à court terme Long (LSTM) RNN qui, à travers les cellules de mémoire et un mécanisme de déclenchement sophistiqués, mémorise des informations mieux que d'autres RNNs. L'adoption de ces modèles déjà amélioré la qualité de notre reconnaissance significative.
La prochaine étape était de former les modèles de reconnaître des phonèmes dans un énoncé sans les obliger à faire une prédiction pour chaque instant. Avec Connectionist temporelle classification, les modèles sont formés à la sortie d'une séquence de «pointes» qui révèle la séquence de sons dans la forme d'onde. Ils peuvent le faire en aucune façon, tant que la séquence est correcte.
Si votre tête tourne comme le colonel O'Neill après une explication de la physique temporelle de trou de ver, vous n'êtes pas seul ... et il ya beaucoup plus d'où cela vient. Le take-away est que les fonctions de recherche de voix et connexes de Google sur Android et iOS sont maintenant mieux à reconnaître les modèles plus nuancées dans le discours, et le retour de ces résultats corrects plus rapidement. Si vous avez déjà rencontré des difficultés pour obtenir des commandes vocales à travers dans une voiture bruyante sur l'autoroute, vous devriez être en mesure d'apprécier le travail mis en elle.
Si vous comprenez la modélisation acoustique et informatique mieux que moi, assurez-vous de consulter la soluce complète sur le lien source. Ces changements sont en direct sur Android pour l'application Recherche Google et la voix dictée, mais pas encore sur Chrome OS Chrome ou les navigateurs de bureau.
- La source:
- Blog Google Recherche