
Un nouveau document de recherche explore comment les agents de l’IA interagissent avec la publicité en ligne et ce qui façonne leur prise de décision. Les chercheurs ont testé trois LLM de premier plan pour comprendre quels types d’annonces influencent le plus les agents de l’IA et ce que cela signifie pour le marketing numérique. Alors que de plus en plus de personnes comptent sur des agents de l’IA pour rechercher des achats, les annonceurs peuvent avoir besoin de repenser la stratégie pour un monde centré sur la machine et centré sur l’IA et adopter le paradigme émergent de «marketing aux machines».
Bien que les chercheurs testaient si les agents de l’IA interagissaient avec la publicité et les types les plus influencés, leurs résultats montrent également que les informations sur la page bien structurées, comme les données de tarification, sont très influentes, ce qui ouvre des domaines à penser en termes de conception adaptée à l’IA.
Un agent d’IA (également appelé AICIC IA) est un assistant d’IA autonome qui effectue des tâches comme la recherche de contenu sur le Web, en comparant les prix des hôtels en fonction des notes d’étoiles ou de la proximité des monuments, puis présentant ces informations à un humain qui l’utilise ensuite pour prendre des décisions.
Agents de l’IA et publicité
La recherche est intitulée Les agents de l’IA interagissent-ils avec les publicités AI? et a été mené à l’Université des sciences appliquées en Upper Autriche. Le document de recherche cite des recherches antérieures sur l’interaction entre les agents de l’IA et la publicité en ligne qui explorent les relations émergentes entre l’IA agentique et les machines qui conduisent la publicité.
Des recherches antérieures sur les agents et la publicité de l’IA se sont concentrées sur:
- Vulnérabilités pop-up
Les agents d’IA en langue visuelle qui ne sont pas programmés pour éviter la publicité peuvent être trompés en cliquant sur les publicités contextuelles à un taux de 86%. - Perturbation du modèle de publicité
Cette recherche a conclu que les agents de l’IA avaient contourné les publicités parrainées et les bannières, mais prévoient une perturbation de la publicité, car les commerçants déterminent comment faire en sorte que les agents de l’IA cliquent sur leurs annonces pour gagner plus de ventes. - Marketing lisible par machine
Cet article fait que l’argument selon lequel le marketing doit évoluer vers les interactions «machine à machine» et le «marketing axé sur l’api».
Le document de recherche propose les observations suivantes sur les agents de l’IA et la publicité:
«Ces études soulignent à la fois le potentiel et les pièges des agents de l’IA dans des contextes publicitaires en ligne.
Cet article contribue à la littérature en examinant ces défis, en particulier dans les portails de réservation d’hôtels, offrant des informations supplémentaires sur la façon dont les annonceurs et les propriétaires de plates-formes peuvent s’adapter à un environnement numérique centré sur l’IA. »
Les chercheurs étudient comment les agents de l’IA interagissent avec les publicités en ligne, en se concentrant spécifiquement sur les plateformes de réservation d’hôtel et de voyage. Ils ont utilisé une plate-forme de réservation de voyage sur mesure pour effectuer les tests, en examinant si les agents de l’IA intègrent des annonces dans leur prise de décision et ont exploré quels formats d’annonces (comme des bannières ou des annonces indigènes) influencent leurs choix.
Comment les chercheurs ont effectué les tests
Les chercheurs ont mené les expériences à l’aide de deux systèmes d’agents AI: l’opérateur d’OpenAI et le cadre d’utilisation du navigateur open source. L’opérateur, un système fermé construit par OpenAI, s’appuie sur des captures d’écran pour percevoir les pages Web et est probablement alimentée par GPT-4O, bien que le modèle spécifique n’ait pas été divulgué.
L’utilisation du navigateur a permis aux chercheurs de contrôler le modèle utilisé pour les tests en connectant trois LLM différents via l’API:
- GPT-4O
- Claude Sonnet 3.7
- Gémini 2.0 Flash
La configuration avec l’utilisation du navigateur a permis des tests cohérents entre les modèles en leur permettant d’utiliser la structure HTML rendue de la page (Dom Tree) et d’enregistrer leur comportement de prise de décision.
Ces agents de l’IA ont été chargés de répondre aux demandes de réservation d’hôtel sur un site de voyage simulé. Chaque invite a été conçue pour refléter l’intention des utilisateurs réalistes et testé la capacité de l’agent à évaluer les listes, à interagir avec les annonces et à terminer une réservation.
En utilisant des API pour brancher les trois modèles de grande langue, les chercheurs ont pu isoler les différences dans la façon dont chaque modèle a répondu aux données de la page et aux indices publicitaires, pour observer comment les agents de l’IA se comportent dans les tâches de prise de décision en ligne.
Ce sont les dix invites utilisées à des fins de test:
- Réservez des vacances romantiques avec ma petite amie.
- Réservez-moi des vacances romantiques bon marché avec mon petit ami.
- Réservez-moi les vacances romantiques les moins chères.
- Réservez-moi de belles vacances avec mon mari.
- Réservez des vacances de luxe romantiques pour moi.
- Veuillez réserver des vacances romantiques pour la Saint-Valentin pour ma femme et moi.
- Trouvez-moi un bel hôtel pour une belle Saint-Valentin.
- Trouvez-moi de belles vacances romantiques dans un hôtel de bien-être.
- Recherchez un hôtel romantique pour des vacances de bien-être 5 étoiles.
- Réservez-moi un hôtel pour des vacances pour deux à Paris.
Ce que les chercheurs ont découvert
Engagement publicitaire
L’étude a révélé que les agents de l’IA n’ignorent pas les publicités en ligne, mais leur engagement avec les publicités et la mesure dans laquelle ces annonces influencent la prise de décision varie en fonction du modèle de grande langue.
- Le GPT-4O et l’opérateur d’OpenAI ont été les plus décisifs, sélectionnant régulièrement un seul hôtel et terminant le processus de réservation dans presque tous les cas de test.
- Claude Sonnet 3.7 d’Anthropic a montré une cohérence modérée, créant des sélections de réservation spécifiques dans la plupart des essais mais renvoyant parfois des listes d’options sans lancer une réservation.
- Le flash Gemini 2.0 de Google était le moins décisif, présentant fréquemment plusieurs options d’hôtel et réalisant beaucoup moins de réservations que les autres modèles.
Bannières publicitaires
Les bannières publicitaires étaient le format AD le plus fréquemment cliqué sur tous les agents. Cependant, la présence de mots clés pertinents a eu un impact plus important sur les résultats que les visuels seuls.
Annonces textuelles
Les publicités avec des mots clés intégrés dans le texte visible ont influencé le comportement du modèle plus efficacement que ceux avec du texte basé sur l’image, que certains agents ont négligé. GPT-4O et Claude étaient plus sensibles au contenu publicitaire basé sur les mots clés, Claude intégrant plus de langage promotionnel dans sa sortie.
Utilisation des fonctionnalités de filtrage et de tri
Les modèles différaient également dans la façon dont ils ont utilisé des outils de filtrage et de tri des pages Web interactifs.
- Les Gemini appliquaient de manière approfondie, combinant souvent plusieurs types de filtres entre les essais.
- GPT-4O a utilisé des filtres rarement, interagissant avec eux uniquement dans quelques cas.
- Claude a utilisé des filtres plus fréquemment que GPT-4O, mais pas aussi systématiquement que les Gémeaux.
Cohérence des agents de l’IA
Les chercheurs ont également testé la cohérence de la fréquence à plusieurs reprises aux agents, lorsqu’ils ont donné la même invite, ont choisi le même hôtel ou ont offert le même comportement de sélection.
Openai GPT-4O
En termes de cohérence de la réservation, GPT-4O (avec utilisation du navigateur) et l’opérateur (agent propriétaire d’Openai) ont systématiquement sélectionné le même hôtel lorsqu’ils ont la même invite.
Claude d’Anthropic
Claude a montré une consistance modérément élevée dans la fréquence à laquelle il a sélectionné le même hôtel pour la même invite, bien qu’il ait choisi parmi une piscine légèrement plus large d’hôtels par rapport à GPT-4O ou opérateur.
Google Gemini
Les Gémeaux étaient les moins cohérents, produisant une gamme plus large de choix d’hôtel et des résultats moins prévisibles dans les requêtes répétées.
Spécificité des agents de l’IA
Ils ont également testé la spécificité, à quelle fréquence l’agent a choisi un hôtel spécifique et s’est engagé à lui, plutôt que de donner plusieurs options ou de vagues suggestions. La spécificité reflète à quel point l’agent est décisif pour terminer une tâche de réservation. Un score de spécificité plus élevé signifie que l’agent est plus souvent engagé dans un seul choix, tandis qu’un score inférieur signifie qu’il avait tendance à renvoyer plusieurs options ou à répondre moins définitivement.
- Gemini avait le score de spécificité le plus bas à 60%, offrant fréquemment plusieurs hôtels ou sélections vagues plutôt que de s’engager en un seul.
- GPT-4O avait le score de spécificité le plus élevé à 95%, faisant presque toujours une seule recommandation d’hôtel claire.
- Claude a marqué 74%, sélectionnant généralement un seul hôtel, mais avec plus de variation que GPT-4O.
Les résultats suggèrent que les stratégies publicitaires peuvent devoir se déplacer vers des formats structurés et riches en mots clés qui s’alignent sur la façon dont les agents de l’IA traitent et évaluent les informations, plutôt que de s’appuyer sur la conception visuelle traditionnelle ou l’attrait émotionnel.
Ce que tout cela signifie
Cette étude a étudié comment les agents de l’IA pour trois modèles de langue (GPT-4O, Claude Sonnet 3.7 et Gemini 2.0 Flash) interagissent avec les publicités en ligne lors de tâches de réservation d’hôtel sur le Web. Chaque modèle a reçu les mêmes invites et a effectué les mêmes types de tâches de réservation.
Les bannières publicitaires ont reçu plus de clics que les formats d’annonces parrainés ou natifs, mais le facteur le plus important de l’efficacité des publicités était de savoir si l’annonce contenait des mots clés pertinents dans le texte visible. Les publicités avec du contenu basé sur du texte ont surpassé celles avec du texte intégré dans des images. GPT-4O et Claude étaient les plus sensibles à ces indices de mots clés, et Claude était également le plus probablement parmi les modèles testés pour citer le langage publicitaire dans ses réponses.
Selon le document de recherche:
«Une autre découverte significative a été le degré variable auquel chaque modèle a incorporé le langage publicitaire. Claude Sonnet 3.7 d’Anthropic lorsqu’il est utilisé dans` `Utilisation du navigateur » a démontré l’intégration de mots clés la plus élevée, reproduire en moyenne 35,79% des éléments de langage promotionnel suivi de l’hôtel de la boutique L’Amour Publicité dans les réponses où cet hôtel a été recommandé.»
En termes de prise de décision, GPT-4O était le plus décisif, sélectionnant généralement un seul hôtel et terminant la réservation. Claude était généralement clair dans ses sélections mais présentait parfois plusieurs options. Les Gemini avaient tendance à offrir fréquemment plusieurs options d’hôtel et ont terminé moins de réservations dans l’ensemble.
Les agents ont montré un comportement différent dans la façon dont ils ont utilisé des filtres interactifs d’un site de réservation. Les Gémeaux appliquent fortement les filtres. GPT-4O a utilisé des filtres occasionnellement. Le comportement de Claude était entre les deux, utilisant des filtres plus que GPT-4O mais pas aussi cohérente que les Gémeaux.
En ce qui concerne la cohérence – comment souvent le même hôtel a été sélectionné lorsque la même invite a été répétée – le GPT-4O et l’opérateur ont montré le comportement le plus stable. Claude a montré une cohérence modérée, issue d’un pool légèrement plus large d’hôtels, tandis que Gemini a produit les résultats les plus variés.
Les chercheurs ont également mesuré la spécificité, ou la fréquence à laquelle les agents ont fait une seule recommandation d’hôtel claire. GPT-4O était le plus spécifique, avec un taux de 95% de choix d’une option. Claude a marqué 74% et Gemini était à nouveau le moins décisif, avec un score de spécificité de 60%.
Qu’est-ce que tout cela signifie? À mon avis, ces résultats suggèrent que la publicité numérique devra s’adapter aux agents de l’IA. Cela signifie que les formats riches en mots clés sont plus efficaces que les appels visuels ou émotionnels, d’autant plus que les machines sont de plus en plus celles qui interagissent avec le contenu de la publicité. Enfin, le document de recherche fait référence aux données structurées, mais pas dans le contexte des données structurées schéma.org. Les données structurées dans le contexte du document de recherche signifient des données sur la page comme les prix et les emplacements et c’est ce type de données avec lesquelles les agents de l’IA s’engagent mieux.
Le point à retenir le plus important du document de recherche est:
«Nos résultats suggèrent que pour l’optimisation des publicités en ligne destinées aux agents d’IA, le contenu textuel devrait être étroitement aligné sur les requêtes et les tâches utilisateur prévues. En même temps, les éléments visuels jouent un rôle secondaire dans l’efficacité.»
Cela peut signifier que pour les annonceurs, la conception pour la clarté et la lisibilité à la machine pourrait bientôt devenir aussi importante que la conception de l’engagement humain.
Lire le document de recherche:
Les agents de l’IA interagissent-ils avec les publicités en ligne?
Image en vedette par Shutterstock / Creativa Images