Parlez à toute vitesse, murmurez au milieu de bruits ambiants, criez plus fort que la foule... Whisper analyse et transcrit comme il se doit. Une fois de plus, OpenAI, créateur de ChatGPT, remet les pendules à l’heure.
La reconnaissance vocalereconnaissance vocale... Voilà un domaine qui bénéficie de dizaines d'années de recherche. Des programmes comme Dragon de Nuance ou Express Scribe se targuent de pratiquer la chose avec élégance. Et vous utilisez probablement Siri sur iPhone, l'Assistance Google sur un appareil AndroidAndroid ou encore CortanaCortana sur Windows.
Plus futé que Siri ou Google Assistant
Reconnaissons-le toutefois : un système de reconnaissance vocale comme SiriSiri est fort approximatif. Les textes que l'on dicte sont généralement truffés d'erreurs et si l'on ne prend pas la peine de se relire, les risques de fâcher un interlocuteur abondent.
Une fois de plus, OpenAI, créateur du célébrissime ChatGPT mais aussi du générateur d'images IA Dall.e2, se démarque par une qualité surprenante. Le speech donné en exemple (en a...
[Courte citation de 8% de l'article original]