A propos de Moshi
Ce nouveau type de technologie permet pour la première fois de communiquer de manière fluide, naturelle et expressive avec une IA . Lors de la présentation, l’équipe de Kyutai a interagi avec Moshi pour illustrer son potentiel en tant que coach ou compagnon par exemple, et sa créativité à travers l’incarnation de personnages dans des jeux de rôle.
Plus largement, Moshi a le potentiel de révolutionner l’usage de la parole dans le monde numérique . Par exemple, ses capacités de synthèse vocale sont exceptionnelles en termes d’ émotion et d’interaction entre plusieurs voix .
Compact , Moshi peut également être installé localement et donc fonctionner en toute sécurité sur un appareil non connecté.
Avec Moshi, Kyutai entend contribuer à la recherche ouverte en IA et au développement de l’ensemble de l’écosystème . Le code et les poids des modèles seront bientôt partagés librement , ce qui est également inédit pour une telle technologie. Ils seront utiles aussi bien aux chercheurs du domaine qu’aux développeurs travaillant sur des produits et services basés sur la voix. Cette technologie peut donc être étudiée en profondeur, modifiée, étendue ou spécialisée selon les besoins. La communauté pourra notamment étendre la base de connaissances et la factualité de Moshi, actuellement volontairement limitées dans un modèle aussi léger, tout en exploitant ses capacités d’interaction vocale inégalées.
Plus largement, Moshi a le potentiel de révolutionner l’usage de la parole dans le monde numérique . Par exemple, ses capacités de synthèse vocale sont exceptionnelles en termes d’ émotion et d’interaction entre plusieurs voix .
Compact , Moshi peut également être installé localement et donc fonctionner en toute sécurité sur un appareil non connecté.
Avec Moshi, Kyutai entend contribuer à la recherche ouverte en IA et au développement de l’ensemble de l’écosystème . Le code et les poids des modèles seront bientôt partagés librement , ce qui est également inédit pour une telle technologie. Ils seront utiles aussi bien aux chercheurs du domaine qu’aux développeurs travaillant sur des produits et services basés sur la voix. Cette technologie peut donc être étudiée en profondeur, modifiée, étendue ou spécialisée selon les besoins. La communauté pourra notamment étendre la base de connaissances et la factualité de Moshi, actuellement volontairement limitées dans un modèle aussi léger, tout en exploitant ses capacités d’interaction vocale inégalées.
A propos de Kyutai
Kyutai est un laboratoire à but non lucratif dédié à la recherche ouverte en IA, fondé en novembre 2023 par le groupe iliad,
CMA CGM et Schmidt Sciences.
Lancé avec une équipe initiale de six scientifiques de premier plan, qui ont tous travaillé avec des laboratoires de Big Tech aux États-Unis, Kyutai continue de recruter à un niveau élevé, et propose également des stages aux étudiants en master de recherche. Composée aujourd'hui d'une douzaine de membres, l'équipe lancera ses premières thèses de doctorat à la fin de l'année. Les recherches entreprises explorent de nouveaux modèles polyvalents à hautes capacités. Le laboratoire travaille actuellement en particulier sur la multimodalité, c'est-à-dire la possibilité pour un modèle d'exploiter différents types de contenus (texte, son, images, etc.) à la fois pour l'apprentissage et pour l'inférence.
Tous les modèles développés sont destinés à être librement partagés, de même que les logiciels et le savoir-faire qui ont permis leur création. Pour mener à bien ses travaux et entraîner ses modèles, Kyutai s'appuie notamment pour son calcul sur le super pode Nabu 23 mis à disposition par Scaleway, filiale du groupe iliad Group.
Kyutai
CMA CGM et Schmidt Sciences.
Lancé avec une équipe initiale de six scientifiques de premier plan, qui ont tous travaillé avec des laboratoires de Big Tech aux États-Unis, Kyutai continue de recruter à un niveau élevé, et propose également des stages aux étudiants en master de recherche. Composée aujourd'hui d'une douzaine de membres, l'équipe lancera ses premières thèses de doctorat à la fin de l'année. Les recherches entreprises explorent de nouveaux modèles polyvalents à hautes capacités. Le laboratoire travaille actuellement en particulier sur la multimodalité, c'est-à-dire la possibilité pour un modèle d'exploiter différents types de contenus (texte, son, images, etc.) à la fois pour l'apprentissage et pour l'inférence.
Tous les modèles développés sont destinés à être librement partagés, de même que les logiciels et le savoir-faire qui ont permis leur création. Pour mener à bien ses travaux et entraîner ses modèles, Kyutai s'appuie notamment pour son calcul sur le super pode Nabu 23 mis à disposition par Scaleway, filiale du groupe iliad Group.
Kyutai
Regarder le replay de la conférence
TESTER MOSHI (commandes en anglais uniquement)
Autres articles
-
Just se projette au UK à l'aune de sa levée de 8 Millions d'Euros
-
Physical Intelligence, un tour de table à 400 millions de dollars auprès de Jeff Bezos et d'OpenAI ?
-
La nouvelle vie de la fintech Kard au sein de THK Capital
-
Visa en négociations exclusives pour le rachat de Featurespace, solution tech basée sur l'IA spécialisée dans la prévention de la fraude
-
Alan & Belfius, un partenariat plus que stratégique, valorisant l'insurtech au-delà des 4 milliards.