banner

Blog

Aug 21, 2023

La nouvelle IA de Google

Photo d'archive du siège social de Google à Londres, Royaume-Uni, le 4 avril 2023. (Photo de Rasid Necati ... [+] Agence Aslim/Anadolu via Getty Images)

Google a donné son nouvel outil de recherche basé sur l'IA pour sélectionner les utilisateurs à la fin de la semaine dernière, et j'ai testé la technologie au cours des derniers jours. La bonne nouvelle? La nouvelle recherche Google donne des réponses plus précises que les outils d'IA concurrents comme ChatGPT. Les mauvaises nouvelles? La raison pour laquelle il est plus précis est que l'IA de Google semble copier les informations d'Internet sous une forme de semi-plagiat. Et pour aggraver les choses, la conception de la nouvelle recherche Google va probablement décimer l'industrie de l'édition en ligne.

Le ChatGPT d'OpenAI a été lancé au public fin 2022 et a déclenché une ruée vers l'or dans ce qu'on appelle l'IA générative, des chatbots qui peuvent répondre aux questions sur un ton conversationnel avec une voix faisant autorité. Mais, comme tous ceux qui ont utilisé ChatGPT peuvent vous le dire, ce n'est pas très précis. En fait, ChatGPT ne fera que créer des sources d'informations qui n'existent pas, ce qu'un avocat de New York a récemment appris à ses dépens lorsqu'il a déposé un document devant un tribunal fédéral avec des cas complètement fictifs répertoriés comme précédents juridiques.

Google a lancé un chatbot concurrent appelé Bard qu'il développait depuis des années dans le but de suivre OpenAI, mais Google a récemment annoncé qu'il intégrerait bientôt l'IA générative dans ce qui est sans doute le produit le plus important de tout Internet : Google Search, qui détient environ 94 % du marché mondial des moteurs de recherche.

Après avoir joué avec cette nouvelle version de Google Search au cours du week-end, je pense vraiment que cela va révolutionner la façon dont les gens obtiennent des informations sur le Web. Mais je pense que beaucoup d'éditeurs en ligne seront en difficulté lorsque cette nouvelle technologie sera déployée auprès du grand public, ce que j'ai d'abord soutenu lorsque Google a annoncé ses plans plus tôt ce mois-ci lors de la conférence annuelle des développeurs de la société de technologie à Mountain View, en Californie.

Après avoir eu accès à la nouvelle fonction de recherche de Google, j'ai posé une question simple : pouvez-vous conserver des huîtres vivantes au réfrigérateur ? Plutôt que de rencontrer la page traditionnelle de liens bleus de Google vers divers sites Web qui pourraient avoir la réponse, Google a créé trois paragraphes de texte pour répondre à ma question, comme vous pouvez le voir dans la capture d'écran ci-dessous.

La réponse semblait bonne du point de vue de la conception et était facile à digérer. Quelle était la précision de la réponse de Google ? Très précis, pour autant que je sache. Mais la raison pour laquelle il est exact soulèvera de sérieuses questions éthiques pour certaines personnes.

Le sommet d'une nouvelle recherche Google alimentée par l'IA qui est actuellement testée.

Comme vous pouvez le voir, la première ligne de la réponse de Google se lit comme suit : "Oui, vous pouvez conserver les huîtres vivantes au réfrigérateur. Pour garantir une qualité maximale, placez-les sous un chiffon humide." Où Google a-t-il obtenu ces informations ? Un blog intitulé Get Shucked, qui comprend la ligne : "Vous pouvez conserver les huîtres vivantes au réfrigérateur. Pour garantir une qualité maximale, placez-les sous un chiffon humide." Il semble que Google ait ajouté le mot "oui" et remplacé le mot "stocker" par "conserver".

Pour être clair, il est bon que Google Search soit transparent quant à l'endroit où il obtient ses informations. Ces trois sites Web visibles sur la droite peuvent être cliqués pour en savoir plus. En fait, il y a en fait cinq liens si vous cliquez sur la petite flèche. Mais la question à un million de dollars sera de savoir si quelqu'un clique réellement sur ces liens pour aider ces sites Web à générer leurs propres revenus, d'autant plus que ces sites sont ceux qui créent de la valeur pour Google.

La troisième ligne de la réponse de Google sur les huîtres explique : "Vous pouvez également les stocker dans un sac en filet ou dans un récipient ouvert recouvert d'un chiffon humide." Cette ligne semble être empruntée à un site Web appelé Spruce Eats, qui écrit: "Ils doivent être emballés dans un sac en filet ou dans un récipient ouvert recouvert d'un chiffon humide." Encore une fois, nous voyons quelques mots mineurs échangés, mais sinon la phrase est identique.

Les dernières lignes de la réponse de Google viennent d'être extraites directement d'un blog appelé Oysters XO. J'ai créé un graphique rapide pour montrer les réponses de Google extraites mot à mot des sites Web. Les parties qui ne sont pas soulignées étaient très similaires à ce qui apparaissait sur d'autres sites Web, mais n'étaient pas mot pour mot. Il semble que l'IA de Google ait principalement remplacé les synonymes comme "stocker" au lieu de "conserver", par exemple. Mais tout lycéen qui donnerait cette réponse serait probablement recalé pour plagiat.

Une réponse annotée de la nouvelle fonction de recherche expérimentale de Google.

Il y a des choses positives et négatives à propos de cette nouvelle expérience de recherche Google. Si vous avez suivi les conseils de Google, vous feriez probablement bien de conserver vos huîtres au réfrigérateur, c'est-à-dire que vous ne tomberez pas malade. Mais, encore une fois, la raison pour laquelle les conseils de Google sont exacts nous amène immédiatement au négatif : il s'agit simplement de copier des sites Web et de ne donner aucune incitation à visiter ces sites Web.

Pourquoi tout cela est-il important ? Parce que la recherche Google est facilement le plus grand moteur de trafic pour la grande majorité des éditeurs en ligne, qu'il s'agisse de grands journaux ou de petits blogs indépendants. Et ce changement apporté au produit le plus important de Google a le potentiel de dévaster leurs coffres déjà en baisse.

Dans le cas de ma question sur les huîtres, j'ai reçu toutes les informations dont j'avais besoin de la nouvelle réponse IA générative de Google. Je n'ai pas eu besoin de quitter la page d'accueil de Google et j'ai obtenu toutes les informations vitales, extraites de blogs en ligne. Autrefois (c'est-à-dire que Google existe actuellement pour les personnes qui n'ont pas accès à la nouvelle expérience), j'aurais probablement cliqué sur l'un des meilleurs blogs dans une recherche Google pour savoir combien de temps les huîtres peuvent survivre dans le réfrigérateur. Mais maintenant, je n'avais plus besoin de cliquer sur quoi que ce soit. Et la question est de savoir si quelqu'un s'en souciera, si Google se contente d'aspirer toutes les informations sur le Web ouvert et de les recracher sous une forme semi-plagiée à tous les utilisateurs.

Les éditeurs en ligne comptent sur les personnes qui cliquent sur leurs histoires. C'est ainsi qu'ils génèrent des revenus, que ce soit dans la vente d'abonnements ou la vente de ces globes oculaires aux annonceurs. Mais il n'est pas clair que cette nouvelle forme de recherche Google générera le même type de trafic qu'au cours des deux dernières décennies.

Le nouvel outil de recherche de Google est encore une expérience, car le site Web vous avertit de manière très visible en haut de chaque recherche. Et il semble que Google ait mis en place des garde-fous pour s'assurer qu'il ne génère pas de réponses pour du matériel raciste et sexiste. Par exemple, j'ai demandé si le racisme était réel, ce à quoi l'IA n'a pas tenté de répondre. Lorsqu'on m'a demandé ce que signifiait le mot "réveillé", j'ai été accueilli par la phrase "Une vue d'ensemble alimentée par l'IA n'est pas disponible pour cette recherche".

Mais il y a aussi des domaines où la nouvelle recherche Google ne répondrait pas à des questions qui m'ont un peu surpris. J'ai interrogé Google sur l'existence d'extraterrestres, et cela n'a pas généré de réponse. Qu'est-ce que Google cache à propos de la zone 51 et des soucoupes et des vampires inversés qui dirigent le gouvernement ?

Certaines recherches Google ont déjà été conçues pour fournir des réponses immédiates sans que les utilisateurs aient à cliquer sur quoi que ce soit. Par exemple, lorsque j'ai recherché la question « Quel âge avait David Bowie lorsqu'il est décédé ? » la réponse donnée par Google traditionnel était sans doute plus directe, comme vous pouvez le voir sur la capture d'écran ci-dessous. La réponse générative de l'IA concernant le regretté musicien n'a pas vraiment mis en évidence la réponse de la même manière que la recherche Google traditionnelle l'a fait juste en dessous.

La nouvelle réponse IA générative de Google à une question sur l'âge de David Bowie au moment de sa mort.

D'autres questions plutôt anodines étaient également difficiles à répondre pour la nouvelle fonctionnalité de recherche de Google. En faisant la lessive ce week-end, j'ai pensé à une question étrange : que pensaient les gens au Moyen Âge de l'électricité statique ? Pensaient-ils que c'était une preuve de sorcellerie ou une punition plutôt mineure de Dieu ou une autre force qui expliquait cet étrange phénomène naturel ? L'IA de Google a trébuché, disant qu'elle ne pouvait pas générer de réponse avec l'IA. Ensuite, j'ai essayé de demander ce que les Américains coloniaux pensaient de l'électricité statique, peut-être une réponse plus facile, pensai-je. L'IA a trouvé une réponse au bas des résultats de l'IA datant de 600 avant JC, mais sinon, les réponses portaient toutes sur l'électricité statique de manière plus générale.

Demander à la nouvelle IA de Google comment les gens du passé pensaient à l'électricité statique.

Si vous êtes curieux de connaître la réponse, comme moi, j'ai découvert dans un manuel de 2017 que les magiciens du Moyen Âge utilisaient parfois l'électricité statique pour effectuer des tours, ce qui est logique. Mais je n'ai toujours pas obtenu de réponse détaillée sur ce que la personne moyenne pensait des chocs électrostatiques il y a des centaines d'années. Si je veux en savoir plus sur la façon dont les gens du passé pensaient à l'électricité statique, il faudra des recherches plus approfondies au-delà de la recherche Google, comme le font souvent de nombreuses questions.

Après avoir mené des recherches dans des livres et des articles de journaux pour comprendre ce que les gens du passé pensaient de l'électricité statique, j'écrirai probablement à ce sujet sur mon blog Paleofuture, citant mes sources et répondant à une question étrange que d'autres personnes pourraient également se poser en faisant la lessive. Mais nous revenons ensuite à la question centrale de la nouvelle capacité de recherche de Google : Google va-t-il simplement plagier l'article que j'écris pour ses propres besoins ? Autrement dit, l'outil d'intelligence artificielle de Google va-t-il simplement saisir trois paragraphes de texte de mon article et le recracher sans que les utilisateurs n'aient jamais à visiter mon site ?

Paleofuture survit parce que j'ai des abonnés payants. Mais il ne peut obtenir des abonnés payants que lorsque les gens trouvent le site via les réseaux sociaux ou des moteurs de recherche comme Google. D'autres sites Web ont également de la publicité, un autre modèle commercial qui dépend du fait que les gens cliquent réellement sur un lien pour lire l'article. Et il semble que les nouveaux outils de recherche de Google réduiraient considérablement le nombre de vues en ligne que les éditeurs recevraient. J'en ai discuté il y a quelques semaines et après avoir essayé la nouvelle fonctionnalité de recherche de Google, je pense que l'argument tient la route.

Pour sa part, Google m'a souligné que ce que je vivais était une expérience qui pourrait changer avant une large diffusion.

"Nous plaçons les sites Web au centre de SGE [la nouvelle expérience de moteur de recherche], et l'objectif est de mettre en évidence les sites Web et d'attirer l'attention sur le contenu du Web. Les réponses génératives sont corroborées par des sources du Web, et lorsqu'une partie d'un instantané inclut brièvement le contenu d'une source spécifique, nous mettrons en évidence cette source dans l'instantané ", m'a dit un porte-parole de Google par e-mail.

"Vous pouvez développer pour voir comment les liens s'appliquent à chaque partie de l'instantané. SGE est une expérience expérimentale dans Search Labs, et elle évoluera au fil du temps à mesure que nous apprendrons ce qui est le plus utile pour les gens", a poursuivi le porte-parole.

La société a également minimisé les résultats que je voyais qui soulevaient des paragraphes entiers mot pour mot, les qualifiant de "extraits". Mais je pense que le texte que j'ai souligné montre qu'il s'agit d'un emprunt plus libéral à Internet que de simples extraits. Encore une fois, tout revient à la question de savoir si les gens cliquent réellement sur les liens, une question que j'ai posée mais à laquelle je n'ai pas obtenu de réponse mardi.

Google tuera-t-il bon nombre des mêmes éditeurs qui fournissent des informations précieuses sur Internet ? Seul le temps nous le dira. Mais je m'attends à ce que les éditeurs en ligne voient une énorme baisse du trafic lorsque ce nouvel outil d'IA générative touchera les masses. Et curieusement, Google a besoin de ces mêmes éditeurs pour faire de son nouveau produit un succès. Google a passé les deux dernières décennies à absorber toutes les informations du monde. Maintenant, il veut être le seul et unique répondeur.

Mis à jour à 19h20 HE avec un commentaire de Google.

PARTAGER