Quelle sera la prochaine étape de l’IA ?

Cette année, nous avons assisté à un nombre impressionnant de percées dans le domaine de l’IA générative, qu’il s’agisse d’IA capables de produire des vidéos à partir de quelques mots ou de modèles capables de générer du son à partir de bribes d’une chanson.

La semaine dernière, Google a organisé un événement consacré à l’IA dans ses bureaux flambant neufs au bord du fleuve Hudson à Manhattan. Votre correspondant s’y est arrêté pour voir de quoi il retournait. Dans le prolongement des tendances actuelles, Google a annoncé une série d’avancées dans le domaine de l’IA générative, notamment un système qui combine ses deux modèles d’IA de conversion de texte en vidéo, Phenaki et Imagen. Phenaki permet au système de générer des vidéos à l’aide d’une série d’invites textuelles qui fonctionnent comme une sorte de script, tandis qu’Imagen permet d’obtenir des vidéos de plus haute résolution.

Mais ces modèles sont encore loin de pouvoir être utilisés par le grand public. Ils présentent encore quelques problèmes majeurs, comme la capacité de générer des contenus violents, sexistes, racistes ou contraires aux droits d’auteur, en raison de la nature des données d’entraînement, qui sont pour la plupart extraites de l’internet. Un chercheur de Google m’a dit que ces modèles n’en étaient qu’à leurs débuts et que de nombreuses « étoiles devaient être alignées » avant qu’ils puissent être utilisés dans des produits réels. Il s’agit d’une recherche impressionnante en matière d’IA, mais la manière dont Google pourrait monétiser ces technologies n’est pas claire non plus.

Ce qui pourrait avoir un impact sur le monde réel beaucoup plus tôt, c’est le nouveau projet de Google visant à développer un « modèle vocal universel » qui a été formé sur plus de 400 langues, a déclaré Zoubin Ghahramani, vice-président de la recherche chez Google AI, lors de l’événement. L’entreprise n’a pas donné beaucoup de détails, mais a indiqué qu’elle publierait un article dans les mois à venir.

Si cela fonctionne, cela représentera un grand bond en avant dans les capacités des grands modèles de langage, ou LLM.  Le LLM BLOOM de la startup Hugging Face a été entraîné sur 46 langues, et Meta travaille sur des modèles d’IA capables de traduire des centaines de langues en temps réel. Si davantage de langues apportent des données d’entraînement à son modèle, Google sera en mesure de proposer ses services à un nombre encore plus important de personnes. L’intégration de centaines de langues dans un modèle d’IA pourrait permettre à Google d’offrir de meilleures traductions ou légendes sur YouTube, ou d’améliorer son moteur de recherche afin qu’il soit plus performant dans l’obtention de résultats dans un plus grand nombre de langues.

Au cours de mon voyage sur la côte Est, j’ai discuté avec des cadres supérieurs de certains des plus grands laboratoires d’IA du monde pour savoir ce qui, selon eux, allait animer la conversation sur l’IA l’année prochaine. Voici ce qu’ils avaient à dire :

Douglas Eck, scientifique principal chez Google Research et directeur de recherche de Google Brain, l’équipe de recherche sur l’apprentissage profond de l’entreprise.
La prochaine percée viendra probablement des modèles d’IA multimodale, qui sont dotés de plusieurs sens, comme la capacité d’utiliser la vision par ordinateur et l’audio pour interpréter les choses, m’a dit Douglas Eck. La prochaine étape importante consistera à trouver le moyen d’intégrer des modèles linguistiques dans d’autres modèles d’IA lorsqu’ils perçoivent le monde. Cela pourrait, par exemple, aider les robots à comprendre leur environnement par le biais d’indices visuels et linguistiques et de commandes vocales.

Yann LeCun, responsable scientifique de l’IA chez Meta
Selon Yann LeCun, l’IA générative va s’améliorer de plus en plus : « Nous aurons de meilleures façons de spécifier ce que nous attendons d’elle. » Actuellement, les modèles réagissent aux invites, mais « il est très difficile de contrôler ce que le système de génération de texte va faire », a-t-il ajouté. Il espère qu’à l’avenir, « il sera possible de modifier un peu l’architecture afin de permettre un certain niveau de planification plus délibéré ».

Raia Hadsell, directrice de recherche chez DeepMind
Raia Hadsell s’est elle aussi enthousiasmée pour les systèmes d’IA générative multimodale, qui combinent l’audio, le langage et la vision. En ajoutant l’apprentissage par renforcement, qui permet aux modèles d’IA de s’entraîner par essais et erreurs, nous pourrions voir des modèles d’IA ayant « la capacité d’explorer, d’être autonomes et d’interagir dans des environnements », m’a dit Hadsell.

Un apprentissage plus approfondi

Ce que les licenciements massifs chez Twitter signifient pour ses travailleurs en IA

Comme nous l’avons signalé la semaine dernière, Twitter pourrait avoir perdu plus d’un million d’utilisateurs depuis qu’Elon Musk en a pris le contrôle. La société Bot Sentinel, qui suit les comportements inauthentiques sur Twitter en analysant plus de 3,1 millions de comptes et leur activité quotidienne, estime qu’environ 877 000 comptes ont été désactivés et 497 000 autres suspendus entre le 27 octobre et le 1er novembre. C’est plus du double du nombre habituel.

Pour moi, la raison de ce phénomène est claire. Les utilisateurs parient que la plateforme va devenir un endroit moins agréable à fréquenter. C’est en partie parce qu’ils ont vu Musk licencier des équipes de personnes qui travaillent pour s’assurer que la plateforme est sûre, notamment toute l’équipe d’éthique de l’IA de Twitter. Il est probable que Musk regrette cette décision. La société est déjà en train de réembaucher des ingénieurs et des chefs de produit pour 13 postes liés à l’apprentissage automatique, y compris des rôles impliqués dans la vie privée, la manipulation de la plate-forme, la gouvernance et la défense des utilisateurs en ligne contre le terrorisme, l’extrémisme violent et les dommages coordonnés. Mais on ne peut que se demander quels dégâts ont déjà été causés, surtout avec l’imminence des élections de mi-mandat aux États-Unis.

Un exemple inquiétant : L’équipe d’éthique de l’IA, dirigée par le pionnier de l’éthique de l’IA appliquée Rumman Chowdhury, a fait des choses vraiment impressionnantes pour freiner les effets secondaires les plus toxiques des algorithmes de modération de contenu de Twitter, comme donner à des personnes extérieures l’accès à leurs ensembles de données pour trouver des biais. Comme je l’ai écrit la semaine dernière, les spécialistes de l’éthique de l’IA sont déjà confrontés à beaucoup d’ignorance et de rejet de leur travail, ce qui peut les amener à s’épuiser. Ceux qui resteront chez Twitter devront faire face à la pression de résoudre les mêmes problèmes, mais avec beaucoup moins de ressources qu’auparavant. Cela ne va pas être beau à voir. Et alors que l’économie mondiale vacille au bord de la récession, il est très inquiétant de constater que des dirigeants tels que Musk pensent que l’éthique de l’IA, un domaine qui s’efforce de garantir que les systèmes d’IA sont justes et sûrs, est la première chose à supprimer.

Bits et Octets

Cet outil permet à tout le monde de voir les préjugés des générateurs d’images de l’IA.
Sasha Luccioni, chercheuse à Hugging Face, a créé un outil qui permet à quiconque de tester la façon dont l’IA Stable Diffusion, génératrice d’images à partir de textes, produit des résultats biaisés pour certaines combinaisons de mots. (Vice)

Des algorithmes dirigent discrètement la ville de Washington et peut-être votre ville natale.
Selon un nouveau rapport de l’Electronic Privacy Information Center, Washington DC utilise des algorithmes dans 20 agences, dont plus d’un tiers sont liées au maintien de l’ordre ou à la justice pénale. (Wired)

Meta fait du pliage de protéines
Suivant les traces de DeepMind pour appliquer l’IA à la biologie, Meta a dévoilé une IA qui révèle les structures de centaines de millions de protéines parmi les moins comprises. L’entreprise affirme qu’avec 600 millions de structures, son modèle est trois fois plus grand que tout ce qui existait auparavant. (Meta)

ia prochaine étape

SEO INSIDE est une agence SEO (notamment…).

 

--

 

SEO Inside est une agence web et SEO - en savoir plus sur nous:

Agence web / Audit SEO / Conseil SEO / Création de site internet / Refonte de site internet optimisé pour le SEO / Référencement naturel / Référencement local /Netlinking / Formation SEO / E-Réputation et avis

Voici nos implantations :
Lille / Dunkerque / Amiens – ce sont nos 3 bureaux historiques.

Puis voici nos zones géographiques d’intervention :
Paris / Abbeville / Rouen / Compiègne / Reims / Metz / Caen / Evreux / Nancy / Colmar / Rennes / Le Mans / Orléans / Dijon / Besançon / Angers / Nantes / La Rochelle / Poitiers / Limoges /Clermont-Ferrand / Lyon / Annecy / Grenoble / Valence / Bordeaux / Montauban / Toulouse / Biarritz / Montpellier / Marseille / Cannes / Nice / Avignon / Monaco

SEO INSIDE est une agence web spécialiste en référencement naturel qui se veut proche de vous. Contactez-nous pour discuter de vos projets.