IA : KYUTAI dévoile Moshi, sa commande vocale en première mondiale

KYUTAI, laboratoire d'IA à but non lucratif, créé en novembre 2023 par Xavier Niel, Rodolphe Saadé et Eric Schmidt vient de dévoiler une première IA à commande vocale appelée Moshi. Déjà en accès libre (lien en fin d'article), l'IA promet de se moduler aussi en fonction des émotions. lien pour tester en fin d'article
En 6 mois et avec une équipe de 8 personnes, la laboratoire hébergé à Station F doté de 300 millions d'euros vient donc de dévoiler une première mondiale.
AL ALLAIN


A propos de Moshi

Ce nouveau type de technologie permet pour la première fois de communiquer de manière fluide, naturelle et expressive avec une IA . Lors de la présentation, l’équipe de Kyutai a interagi avec Moshi pour illustrer son potentiel en tant que coach ou compagnon par exemple, et sa créativité à travers l’incarnation de personnages dans des jeux de rôle.

Plus largement, Moshi a le potentiel de révolutionner l’usage de la parole dans le monde numérique . Par exemple, ses capacités de synthèse vocale sont exceptionnelles en termes d’ émotion et d’interaction entre plusieurs voix .

Compact , Moshi peut également être installé localement et donc fonctionner en toute sécurité sur un appareil non connecté.

Avec Moshi, Kyutai entend contribuer à la recherche ouverte en IA et au développement de l’ensemble de l’écosystème . Le code et les poids des modèles seront bientôt partagés librement , ce qui est également inédit pour une telle technologie. Ils seront utiles aussi bien aux chercheurs du domaine qu’aux développeurs travaillant sur des produits et services basés sur la voix. Cette technologie peut donc être étudiée en profondeur, modifiée, étendue ou spécialisée selon les besoins. La communauté pourra notamment étendre la base de connaissances et la factualité de Moshi, actuellement volontairement limitées dans un modèle aussi léger, tout en exploitant ses capacités d’interaction vocale inégalées.

A propos de Kyutai

Kyutai est un laboratoire à but non lucratif dédié à la recherche ouverte en IA, fondé en novembre 2023 par le groupe iliad,
CMA CGM et Schmidt Sciences.
Lancé avec une équipe initiale de six scientifiques de premier plan, qui ont tous travaillé avec des laboratoires de Big Tech aux États-Unis, Kyutai continue de recruter à un niveau élevé, et propose également des stages aux étudiants en master de recherche. Composée aujourd'hui d'une douzaine de membres, l'équipe lancera ses premières thèses de doctorat à la fin de l'année. Les recherches entreprises explorent de nouveaux modèles polyvalents à hautes capacités. Le laboratoire travaille actuellement en particulier sur la multimodalité, c'est-à-dire la possibilité pour un modèle d'exploiter différents types de contenus (texte, son, images, etc.) à la fois pour l'apprentissage et pour l'inférence.
Tous les modèles développés sont destinés à être librement partagés, de même que les logiciels et le savoir-faire qui ont permis leur création. Pour mener à bien ses travaux et entraîner ses modèles, Kyutai s'appuie notamment pour son calcul sur le super pode Nabu 23 mis à disposition par Scaleway, filiale du groupe iliad Group.
Kyutai

Regarder le replay de la conférence


TESTER MOSHI (commandes en anglais uniquement)


Jeudi 4 Juillet 2024


Articles similaires