ChatGPT, Perplexity et Gemini (Google) sont devenus les nouveaux réflexes de recherche de millions d’utilisateurs. Et avec eux, une nouvelle discipline est née : le GEO – Generative Engine Optimization. Mais que savent réellement les marques de leur visibilité sur ces plateformes ? Et comment les LLMs (Large Language Models) choisissent-ils les contenus ou les marques qu’ils citent dans leurs réponses ?
Pour y voir plus clair, Qwairy.co a mené la plus grande étude jamais réalisée sur le sujet : 32 961 requêtes analysées, 3 IA passées au crible, et près de 60 000 sources collectées. Objectif : comprendre ce qui permet à une marque d’être citée ou référencée dans une réponse générée par une IA.
Nous avons sélectionné 9 statistiques clés, à la fois étonnantes et stratégiques, pour vous aider à adapter votre stratégie de contenu et à positionner votre marque.
En savoir plus sur le contexte de l’étude et la récupération des réponses vous pouvez lire l’article de Qwairy directement.
1. La taille moyenne des réponses varie étrangement entre les LLMs
Première statistique intéressante : comparer les réponses entre les LLMs.
- SearchGPT : 280 à 340 mots par réponse
- Gemini : 490 à 590 mots par réponse
- Sonar (Perplexity) : 340 à 410 mots par réponse
Ce qu’il faut retenir : Gemini donne des réponses bien plus longues. Si vous voulez apparaître chez lui, mieux vaut produire du contenu plus complet. Sur SearchGPT, au contraire, la concision est la clé.
2. Gemini cite en moyenne plus de marques que ses concurrents
Parmi les trois LLMs analysés, Gemini est celui qui mentionne le plus de concurrents dans ses réponses.
Là où SearchGPT reste très sélectif, Gemini n’hésite pas à multiplier les références à des marques, produits ou services similaires.
Ce qu’il faut retenir : Dans un environnement LLM, être cité, c’est exister. Et Gemini offre plus d’opportunités d’exposition pour les marques, même celles qui n’ont pas une notoriété nationale.
Implication stratégique :
Si vous êtes une marque challenger, Gemini est probablement votre meilleur point d’entrée dans les LLMs. La logique est similaire à un élargissement de la SERP : là où Google propose 10 résultats, Gemini peut en présenter 15 ou 20 via ses citations internes.
C’est aussi une invitation à :
- travailler votre présence sur les sources que Gemini utilise le plus (voir Stat #8),
- et à structurer vos contenus pour qu’ils soient facilement réutilisables dans des comparatifs, guides ou listes.
3. Les LLMs adorent les listes structurées avec des tirets
99 % des réponses analysées utilisent des listes avec des tirets “–” pour présenter les éléments.
C’est massif. Presque toutes les réponses générées par ChatGPT, Perplexity ou Gemini intègrent au moins une liste structurée avec des points à la ligne, façon bullet points.
Ce qu’il faut retenir : Les LLMs valorisent le contenu lisible, clair et structuré visuellement. Ils semblent accorder une importance particulière aux formats qui facilitent la synthèse : listes, étapes, comparatifs.
Si votre contenu est composé de longs paragraphes non hiérarchisés, vous réduisez probablement vos chances d’être repris par une IA. Pour s’adapter à ce nouveau standard, il est conseillé de :
- Utiliser des listes avec “–” ou “•”
- Structurer chaque idée ou recommandation en une phrase claire
- Ajouter des intertitres fréquents pour faciliter le scan du contenu
Autrement dit : rédigez comme si vous étiez une IA vous-même.
4. Wikipédia est une source appréciée des LLMs
Sans surprise, Wikipedia est la source la plus fréquemment citée dans les réponses générées par les LLMs, en particulier par SearchGPT et Perplexity. Mais d’autres acteurs reviennent aussi régulièrement dans les corpus analysés :
- Trustpilot et Avis Vérifiés pour les avis consommateurs
- LeMonde.fr, LeFigaro.fr et Letudiant.fr pour les contenus éditoriaux et informatifs
- Google Maps dans certains cas pour des requêtes locales
Ce qu’il faut retenir : Les LLMs s’appuient sur des sources perçues comme fiables, éditoriales ou communautaires. Ce ne sont pas toujours des “gros sites SEO”, mais plutôt des plateformes riches, cohérentes et bien structurées.
Si vous souhaitez augmenter vos chances d’être cité dans les réponses LLM :
- Cherchez à être présent sur ces plateformes (ex. : citation dans un article de presse, fiche entreprise sur Wikipedia, page Trustpilot active, page capterra, page G2 pour les SaaS…)
C’est une nouvelle logique de netlinking, où la mention de la marque compte autant que le lien vers votre site.
Voici le détail complet des principales sources utilisées dans l’étude :



Petite précision importante ici : la donnée provient des requêtes ajoutées sur Qwairy. Certains sites peuvent ressortir plus que d’autres si certaines thématiques sont plus présentes sur l’outil.
5. Les verbes incitatifs sont présents dans plus de 25 % des réponses LLM
Les LLMs n’informent pas seulement, ils incitent à l’action. Dans plus d’un quart des réponses analysées, on retrouve des verbes comme :
- “Découvrez”
- “Choisissez”
- “Essayez”
- “Profitez”
- “Optez pour”
Ce qu’il faut retenir : Le ton adopté par les LLMs est persuasif, mais subtil.
6. Le formatage visuel influence directement votre présence dans les LLMs
L’étude révèle que :
- 99 % des réponses contiennent au moins un élément en bullet point
- La majorité des paragraphes sont très courts : entre 1 et 3 phrases
Ce qu’il faut retenir : Les LLMs ne rédigent pas comme un blogueur en 2010. Ils privilégient :
- Des blocs de texte aérés
- Une structure logique et facile à scanner
- Un ton direct, fluide, sans fioriture
Optimiser pour le GEO, c’est aussi penser design rédactionnel :
- Bannir les “pavés” de 10 lignes
- Multiplier les sauts de ligne
- Favoriser les listes, les étapes numérotées, les sous-titres
En clair, vous devez écrire comme si votre contenu allait être copié-collé dans une réponse IA.
L’avantage, c’est que votre contenu en deviendra encore plus lisible pour l’utilisateur final !
7. 59 992 sources ont été citées… mais très peu sont régulièrement utilisées
L’étude Qwairy a recensé 59 992 sources uniques utilisées dans les réponses générées par les LLMs.
Mais fait surprenant : Très peu de ces sources reviennent fréquemment.
Ce qu’il faut retenir : Les LLMs utilisent un corpus extrêmement large, mais ne s’appuient que rarement sur les mêmes sites d’une réponse à l’autre (sauf quelques exceptions comme Wikipedia ou Trustpilot).
Implication stratégique :
Cela ouvre deux opportunités majeures :
- Vous avez une vraie chance d’être cité, même si vous n’êtes pas un site ultra-autoritaire.
- En parallèle, travailler les 1 % de sources qui reviennent régulièrement (Wikipedia, médias nationaux, comparateurs) reste une tactique GEO puissante pour augmenter vos probabilités d’apparition.
C’est une logique double : viser les tops (sources très citées), mais aussi les niches (car le terrain n’est pas saturé).
8. Les LLMs ne s’appuient pas tous sur les mêmes sources
Chaque LLM a ses propres réflexes en matière de sourcing. L’étude révèle des différences marquées :
SearchGPT (ChatGPT)
- Wikipédia
- Trustpilot
- LeMonde.fr
- Google Maps
Gemini (Google)
- Google.com
- YouTube
- Sites publics (ex. service-public.fr, gouv.fr)
- Reddit, Studyrama, Lecoindesentrepreneurs
Perplexity (Sonar)
- YouTube est la source la plus citée
- Présence très large de blogs, forums, comparateurs spécialisés
Ce qu’il faut retenir : Il n’existe pas de “référentiel universel” des sources LLMs. Chaque modèle a ses biais et son écosystème.
- Si votre audience utilise surtout ChatGPT : travaillez votre présence sur Wikipedia, les médias français, les sites d’avis.
- Si vous ciblez Perplexity : pensez vidéo YouTube, contenu technique, format Q&A.
- Pour Gemini : soyez présent sur des plateformes à forte autorité et des sites publics.
Pour réussir votre GEO, il faut adapter votre stratégie de contenu et de netlinking à chaque moteur IA, comme vous le feriez pour Google vs Bing dans le SEO classique.
9. Les slugs d’URL contiennent des mots-clés très spécifiques (et révélateurs)
L’étude a mis en évidence une tendance claire dans les URL utilisées comme sources par les LLMs : les slugs (la partie lisible de l’URL) contiennent fréquemment certains mots-clés.
Voici quelques patterns repérés :
- SearchGPT : “meilleur”, “top”, “2023”
- Gemini : “guide”, “comment”, “choisir”
- Perplexity : “2025”, “comparatif”, “prix”, “avis”
Évidemment, ce n’est pas parce que vous allez mettre “2023” dans un slug que vous allez ranker sur ChatGPT. Mais cela prouve que ChatGPT peut encore se baser sur des urls anciennes.
De même, l’omniprésence de terme comme “meilleur” ou “guide” prouve aussi que ces contenus sont à considérer dans votre stratégie de contenu pour réussir en SEO en 2025.
L’article “9 statistiques surprenantes issues de 32 961 recherches réalisées sur ChatGPT, Perplexity et Gemini” a été publié sur le site Abondance.