Comment la reconnaissance vocale fluide reste rapide, précise et privée

Table des matières:

Comment la reconnaissance vocale fluide reste rapide, précise et privée
Comment la reconnaissance vocale fluide reste rapide, précise et privée
Anonim

Clé à emporter

  • Fluent est un moteur de reconnaissance vocale ultra-rapide et respectueux de la vie privée qui ne nécessite pas de connexion Internet.
  • Il peut être intégré à presque n'importe quel appareil.
  • Cela fonctionne dans n'importe quelle langue.
Image
Image

Fluent.ai est un moteur de reconnaissance vocale virtuel qui n'envoie pas vos commandes sur Internet, agit presque instantanément, peut fonctionner dans n'importe quelle langue et est si petit qu'il peut être intégré même à bas prix -alimentez des appareils comme une montre de fitness, par exemple.

Contrairement à Siri et Alexa, Fluent est un assistant autonome qui vous comprend instantanément et apprend de vous afin qu'il s'améliore au fur et à mesure que vous l'utilisez. Il n'a pas la profondeur des assistants virtuels habituels, mais ce n'est pas censé le faire. Au lieu de cela, il est plus rapide, plus précis et plus privé que les efforts d'Apple, d'Amazon et de Google.

"La parole en texte utilise le traitement du langage naturel, puis dérive l'intention", a déclaré Probal Lala, PDG de Fluent, à Lifewire lors d'une interview sur Zoom. "Cela nécessite beaucoup de données et beaucoup de puissance de traitement. Fluent passe directement de la parole à l'intention, prend votre voix et la convertit directement en action."

Bottom Line

Fluent est un logiciel de contrôle vocal. Cela fonctionne en écoutant votre commande et en supprimant tous les mots dont il n'a pas besoin, ne laissant que les noms et verbes essentiels. "Éteignez les lumières", devient juste éteint et allume. Les éléments essentiels sont dépouillés d'une phrase humaine désordonnée et transformés en étapes. C'est presque comme programmer un ordinateur, transformer une idée complexe en l'ensemble d'instructions le plus simple.

À quoi peut-il servir ?

Fluent peut être utilisé pour n'importe quoi. La clé est qu'il est formé pour une situation spécifique. Avec une montre intelligente, par exemple, elle peut être entraînée aux commandes pour le fitness, ou pour la domotique, la création d'un calendrier et d'une minuterie, etc. Limiter la base de données rend tout plus ciblé et le maintient rapide.

"La vérité est qu'avec les appareils portables, vous ne cherchez pas à avoir une conversation", a déclaré Lala, "Je veux peut-être que ma routine d'exercice préférée commence, et je la veux très rapidement."

La vitesse et la précision sont essentielles. Allumer et éteindre les lumières prend quelques millisecondes, au lieu d'avoir à attendre que Siri envoie votre voix dans le cloud, attendez qu'elle soit traitée, puis quelques secondes plus tard, les lumières s'éteignent.

Cette formation restreinte réduit également la taille de l'application. L'année dernière, Google a fourni une version téléchargeable et hors ligne de son assistant. Il était, dit Lala, 85 mégaoctets, ne fonctionnait qu'en anglais, et il a fallu six mois pour le former.

"Nous avons un modèle fonctionnant avec 13 000 commandes et il fonctionne en 500 kilo-octets", a-t-il déclaré.

Bottom Line

L'autre avantage d'un moteur de reconnaissance vocale hors ligne est la confidentialité. Dans la montre intelligente d'un enfant, par exemple, "vous ne voulez pas que la voix d'un enfant aille dans le cloud", explique Lala. En fait, Fluent peut fonctionner à l'intérieur d'appareils qui ne se connectent jamais à Internet. Ce n'est pas seulement bon pour la confidentialité, mais aussi pour la sécurité. Vous pouvez utiliser un moteur de reconnaissance vocale hors ligne dans les laboratoires de recherche, les installations militaires et d'autres endroits qui interdisent les téléphones portables et les appareils photo.

Limites

Bien sûr, il y a quelques inconvénients à ce modèle. La première est que les commandes ne peuvent pas être ajoutées ultérieurement. Une fois la formation initiale terminée, c'est tout. Votre assistant basé sur Fluent ne peut pas non plus rechercher sur Internet vos résultats sportifs, l'acteur que vous reconnaissez dans ce film, mais que vous ne pouvez tout simplement pas placer, etc.

Image
Image

Au lieu de cela, le système est assez intelligent pour reconnaître quand il ne peut pas aider et il transmettra la demande à quelque chose qui le peut. Si vous demandez à votre montre la météo, Fluent se rendra compte qu'elle ne comprend pas. "Ensuite, il appellera un service préprogrammé dans la montre, qu'il s'agisse d'Alexa d'Amazon ou de Google, puis appellera le cloud", en transmettant votre commande vocale brute pour obtenir la réponse.

Cette approche hybride conserve la vitesse d'un assistant local hors ligne, avec la puissance d'Alexa ou de Google Assistant comme sauvegarde.

Pouvez-vous acheter des appareils Fluent ?

Pas encore. L'entreprise octroie des licences pour sa technologie et assure la formation pour d'autres entreprises. Grâce au COVID, deux lancements majeurs ont été repoussés à l'année prochaine. Mais vous pouvez vous attendre à le voir apparaître dans les montres et autres appareils de fitness, haut-parleurs, hubs domotiques, etc.

Ce serait formidable si cela était également intégré directement dans les smartphones comme l'iPhone, rendant les tâches quotidiennes plus rapides et ne recourant à Siri que lorsque cela est nécessaire. Ce serait la vraie application qui tue.

Mise à jour: 22 octobre, 10h12. Modifications apportées pour faire référence à Fluent en tant que moteur de reconnaissance vocale plutôt qu'en tant qu'assistant vocal.

Conseillé: