Ces derniers mois, j'ai lu avec une fascination croissante l'obsession du secteur technologique pour des applications très en vue comme ChatGPT, le parfait exemple d'applications d'IA générative qui ont fait irruption sur la scène.
En plus de 25 ans de carrière dans le secteur technologique, je n'ai jamais vu une nouvelle fonctionnalité susciter un tel engouement que l'IA de nouvelle génération. Plus intrigant encore, ce n'est pas seulement l'obsession, mais le fait que de nombreuses entreprises de renom aient été prises au dépourvu par l'intérêt des médias et des consommateurs, et soient toujours incapables d'expliquer clairement comment elles comptent participer à cette frénésie qui anime le secteur.
Il est tout aussi fascinant de constater l'impatience avec laquelle le secteur attend la présentation par Apple de ses produits de réalité augmentée/réalité virtuelle lors de sa conférence WWDC en juin ou plus tard cette année. Si la plupart des entreprises proposant déjà des produits de ce type (Meta, par exemple) craignent généralement l'arrivée d'un concurrent majeur comme Apple sur ce marché, compte tenu de son influence et de la notoriété de sa marque, cette crainte pourrait bien être différente.
Laisse-moi expliquer.
L'attrait mitigé des casques de réalité mixte et virtuelle actuels
L'analyste renommé Ming-Chi Kuo estime que les investisseurs ont jusqu'à présent surestimé l'intérêt et la demande réels des consommateurs pour les casques de réalité virtuelle et mixte. L'arrivée d'Apple sur le marché de la réalité augmentée et de la réalité virtuelle pourrait changer la donne.
Kuo a récemment écrit que les consommateurs ne sont peut-être pas encore prêts à adopter la RA et la RV, car il n'existe pas suffisamment de preuves convaincantes que les casques de réalité augmentée deviendront la dernière tendance en matière d'électronique grand public.
Selon lui, les casques de réalité mixte d'Apple représentent « peut-être la dernière chance de convaincre les investisseurs que le casque AR/MR pourrait devenir le prochain produit phare de l'électronique grand public ».
Kuo n'avance pas cette affirmation sans preuves, soulignant qu'il y a eu un déclin de la fabrication et de la vente de casques de réalité virtuelle sur l'ensemble du marché.
Un exemple révélateur : Sony a revu à la baisse ses prévisions de production de casques PS VR2 de 20 % pour 2023. Par ailleurs, Meta Quest Pro n’a été livré qu’à 300 000 exemplaires. Pico, le plus grand fabricant de casques AR/VR en Chine, a manqué de 40 % ses objectifs de livraison pour 2022. Ces faits ne permettent pas de considérer les casques AR/VR comme des produits grand public.
Tous les regards sont tournés vers la WWDC 2023
Dans ce contexte de marché morose, des rumeurs circulent selon lesquelles Apple dévoilerait prochainement son casque de réalité mixte très attendu. Kuo a publiquement déclaré être convaincu que l'appareil sera présenté au troisième trimestre de cette année, tandis que d'autres estiment qu'il sera dévoilé lors de la WWDC 2023.
Tim Cook a maintes fois exprimé son soutien au casque de réalité augmentée d'Apple. Cependant, d'autres ingénieurs d'Apple s'inquiètent, semble-t-il, du fait que l'entrée de l'entreprise sur le marché de la réalité virtuelle et augmentée puisse se révéler un échec coûteux, car la technologie pourrait ne pas être suffisamment mature pour une utilisation à grande échelle, notamment en termes de modèles d'usage pertinents.
Selon moi, ce dont les gens ont vraiment besoin, c'est d'une bonne raison d'acheter un de ces écouteurs, plutôt qu'un nouvel appareil Apple au design élégant. Après tout, de nombreux experts du secteur estiment qu'Apple annoncera ces nouveaux écouteurs à des prix résolument « atypiques », aux alentours de 3 000 $ ou plus. Avec un tel prix et une récession en perspective, ces facteurs pourraient constituer des obstacles importants, même pour Apple.
Les jeux en réalité virtuelle fascinent certains joueurs passionnés, mais les jeux occasionnels détiennent une part de marché bien plus importante et ne nécessitent pas de casque. Les entreprises peuvent absorber des prix plus élevés, car les casques de réalité augmentée/réalité virtuelle offrent des applications convaincantes dans les opérations, l'entreposage et le secteur médical, mais les volumes de vente restent modestes.
Les films sont intéressants, mais combien de personnes apprécient réellement les interactions en regardant la télévision plutôt que de rester enfermées dans leur propre petit cinéma privé ? Excusez-moi de bâiller.
Ce dernier point me ramène à Apple.
Expérience FaceTime immersive
Je pense qu'Apple attendait de développer un modèle grand public capable de séduire un large éventail de personnes, quel que soit son prix. Je crois qu'il s'agira d'une application de réalité augmentée ou virtuelle pour FaceTime.
FaceTime a révolutionné les appels vidéo entre particuliers et les a fait sortir du domaine réservé aux passionnés de technologie ou d'informatique pour en faire quelque chose de tellement informel qu'une grand-mère n'y pense même plus.

FaceTime sur macOS (Crédit image : Apple)
Oui, le prix de ces nouveaux écouteurs Apple sera élevé, car le matériel haut de gamme requis est essentiel pour éviter une expérience amateur, mais Apple regarde vers l'avenir, et ces prix baisseront rapidement à mesure que le marché se développera.
Si Apple parvient à créer une expérience FaceTime immersive permettant à un utilisateur équipé d'un casque Apple de se percevoir comme se trouvant au même endroit réel qu'un ou plusieurs autres utilisateurs, cela révolutionnera le secteur. En ce sens, le succès d'Apple est indispensable à l'essor de la réalité augmentée et de la réalité virtuelle. Comme le dit l'adage, la marée montante affecte tous les bateaux, et l'industrie en est bien consciente.
L'IA générative est la « ruée vers l'or » actuelle.
Le moins qu'on puisse dire, c'est que les investisseurs, le secteur technologique et le grand public ont adopté l'IA générative comme jamais auparavant. Cependant, je crois qu'ils négligent un risque crucial.
Le monde de la technologie s'est enflammé lors du lancement de ChatGPT en novembre dernier, permettant aux utilisateurs de poser des questions à un chatbot et de recevoir des réponses générées par l'IA.
D'après de nombreux experts, cette nouvelle technologie a le potentiel de transformer des secteurs entiers, notamment les médias et la santé (elle a récemment réussi les trois épreuves de l'examen d'agrément médical américain). Même HAL, de « 2001 : L'Odyssée de l'espace », en serait impressionné.
Pour déployer rapidement cette technologie à l'échelle mondiale, Microsoft a déjà investi des milliards de dollars dans sa relation avec le créateur de la technologie, OpenAI, et a commencé à intégrer cette fonctionnalité dans son moteur de recherche Bing.
Les dirigeants espèrent sans aucun doute que cela permettra à Microsoft de rattraper son retard sur Google, leader du marché de la recherche, où il a pris du retard. Ironie du sort, Google a lui aussi connu des revers en matière d'IA générative, notamment avec le lancement mitigé de sa fonctionnalité Bard.
ChatGPT est l'exemple par excellence des capacités de l'IA générative, bien qu'il ne soit pas le seul. À partir d'un ensemble de données d'entraînement, l'IA générative peut produire de nouvelles données, telles que des images, des sons ou du texte, dans le cas d'un chatbot.
On peut reconnaître une valeur considérable à l'intelligence artificielle générative, car les modèles peuvent produire des résultats beaucoup plus rapidement que les humains. Prenons l'exemple d'un environnement où l'intelligence artificielle crée des paysages et des personnages nouveaux et complexes sans intervention humaine.
IA boîte noire
Cependant, l'IA générative ne convient pas à tous les contextes ni à tous les secteurs. Elle peut fournir des résultats attrayants et pratiques pour les jeux, les vidéos, les photos et même la poésie. En revanche, elle peut s'avérer dangereuse lorsqu'il s'agit de systèmes critiques, dans des situations où les erreurs sont coûteuses, voire mortelles, ou lorsque les biais sont inacceptables.
Par exemple, un établissement de santé situé dans une région rurale aux ressources limitées où l'IA est utilisée pour améliorer le diagnostic et la planification des traitements. Ou encore, imaginez une école où un seul enseignant utilise un système de planification de cours basé sur l'IA pour personnaliser l'enseignement destiné à plusieurs élèves en fonction de leurs compétences spécifiques.
Dans ces circonstances, l'IA générative semblerait de prime abord prometteuse, mais elle soulèverait plusieurs problèmes. Comment s'assurer de l'exactitude du diagnostic ? Qu'en est-il des éventuels biais présents dans les ressources pédagogiques ? Ce sont des questions cruciales auxquelles il convient de répondre.
Les modèles utilisant l'IA générative sont qualifiés de « boîtes noires ». En l'absence de logique sous-jacente, il est difficile de comprendre comment ils parviennent à leurs résultats. Même les chercheurs expérimentés peinent souvent à comprendre leur fonctionnement interne. Par exemple, déterminer ce qui permet à une IA de reconnaître avec précision l'image d'un brin d'herbe est un défi bien connu.
Même en tant qu'utilisateur occasionnel de ChatGPT ou d'un autre modèle génératif, vous pourriez avoir peu d'informations sur les données d'entraînement initiales. Si vous vous renseignez sur la source des données de ChatGPT, le logiciel se contentera de répondre qu'il a été entraîné sur « un ensemble diversifié de données provenant d'Internet ». De telles déclarations vagues n'inspirent guère confiance.
Risques liés aux sorties causés par l'IA
Cette situation peut engendrer des dangers. Il est impossible de comprendre pourquoi un modèle produit des prédictions spécifiques sans observer les liens et les structures internes qu'il a appris des données, ni de déterminer quelles caractéristiques de ces données sont les plus importantes pour lui. Par conséquent, les défauts ou biais fondamentaux du modèle sont difficiles à déceler et à corriger.
Je me souviens d'une scène du célèbre film sur la guerre nucléaire accidentelle « Fail Safe », dans laquelle un dirigeant du secteur technologique explique à un responsable gouvernemental que les ordinateurs peuvent commettre des erreurs subtiles, si subtiles qu'aucun être humain ne pourrait contester ces résultats en temps réel, et ce film est sorti en 1964 !
Les internautes ont documenté des cas souvent involontairement drôles dans lesquels ChatGPT a donné des réponses incorrectes ou douteuses, allant de la défaite aux échecs à la production de code Python décidant qui devait être torturé.
J'ai assisté récemment à une conférence HP où un dirigeant renommé du secteur a exprimé son soutien à des outils comme ChatGPT pour faciliter la tâche « fastidieuse » des évaluations de performance des employés. Imaginez le nombre de procès qui en découleraient si cela devenait la norme.
Il ne s'agit là que des cas où la réponse incorrecte était manifeste. Selon certaines estimations, environ 20 % des réponses de ChatGPT sont inventées. Il est possible qu'avec les progrès de l'IA, nous vivions à une époque où des chatbots sûrs d'eux fourniront des réponses qui semblent exactes, et où les humains seront incapables de faire la différence.
Mettre l'IA en pause ?
Cela ne signifie pas que nous ne devrions pas nous enthousiasmer pour l'IA, mais le monde doit faire preuve de prudence. Malgré la réaction émotionnelle des médias, qui semble s'amplifier à chaque prise de parole d'Elon Musk, ne négligeons pas la récente lettre signée par lui et d'autres personnalités du secteur, dont Steve Wozniak, appelant à une pause dans le déploiement de nouvelles applications d'IA.
Malheureusement, il est peu probable que cette mentalité de ruée vers l'or freine les choses sans une improbable directive gouvernementale, et la réglementation n'est pas pour demain. Je suis également sensible à l'argument selon lequel les États-Unis doivent être à la pointe de l'intelligence artificielle pour des raisons de sécurité nationale, d'autant plus que la Chine représente une menace croissante.
Il est toutefois essentiel de prendre en compte les risques et de se concentrer sur les applications concrètes de ces modèles d'IA. On pourrait obtenir des résultats plus positifs en les entraînant à réduire leur taux élevé de fausses réponses, ou « hallucinations ».
Cependant, la formation seule pourrait ne pas suffire. En théorie, on pourrait créer une situation où les outils d'IA seraient récompensés pour les résultats qu'ils produisent et que leurs évaluateurs humains jugent concluants — par exemple, en les incitant à nous induire délibérément en erreur en entraînant simplement les modèles à générer les résultats que nous souhaitons.
La situation pourrait s'aggraver, et les applications d'IA pourraient développer des modèles sophistiqués pour échapper à la détection, voire surpasser les humains, comme certains l'ont prédit. Ce scénario pourrait être tragique.
Approche de la boîte blanche
Il existe une autre option. Certaines entreprises peuvent utiliser des modèles tels que l'apprentissage automatique en boîte blanche ou explicable au lieu de se concentrer sur la manière dont nous entraînons les modèles d'IA générative.
Un modèle à boîte blanche, contrairement aux modèles à boîte noire tels que l'IA générative, est transparent et permet de mieux comprendre comment le modèle établit ses prédictions et quels paramètres il prend en compte.
Bien que les modèles à boîte blanche puissent être sophistiqués dans leurs algorithmes, ils sont plus simples à comprendre car ils sont accompagnés de justifications et de contexte. En indiquant ce qu'elle considère comme la réponse correcte, une implémentation à boîte blanche de ChatGPT peut également préciser son degré de confiance : 60 %, 90 % ou 100 %, par exemple.
Cette approche permettrait aux utilisateurs de déterminer la fiabilité des réponses et de comprendre leur mode de calcul. Autrement dit, connaître les données utilisées pour obtenir une réponse permettrait aux utilisateurs d'examiner différentes variantes d'une même réponse. C'est un pas dans la bonne direction.
Bien sûr, cela n'est pas forcément nécessaire pour un dialogue direct avec le chatbot. Cependant, disposer de ce contexte peut s'avérer crucial dans des situations où une réponse erronée pourrait avoir de graves conséquences (dans le domaine médical, par exemple).
Ce scénario est nettement moins risqué que celui où un médecin fonde tous ses jugements exclusivement sur le résultat d'un algorithme secret, s'il utilise l'IA pour établir des diagnostics mais peut constater le degré de confiance du programme dans sa conclusion.
Participation humaine
Selon moi, l'IA aura sans aucun doute un impact considérable sur les entreprises et la société. Par conséquent, laissons les humains choisir la technique d'IA la plus appropriée à chaque situation.
La présence d'un être humain dans le cycle de calcul de l'IA peut sembler étrange, mais c'est peut-être précisément ce qu'il faut pour gagner la confiance, la crédibilité et la responsabilité des utilisateurs.





