1. Pourquoi ChatGPT cite-t-il certains sites et pas d'autres ?
La question revient dans toutes les réunions : "Pourquoi notre concurrent apparaît dans les réponses ChatGPT et pas nous ?" La réponse n'est pas mystérieuse, mais elle nécessite de comprendre comment les modèles de langage construisent leurs réponses.
ChatGPT s'appuie sur deux flux distincts selon le mode de requête : la mémoire d'entraînement (données crawlées jusqu'à la date de coupure du modèle) et la recherche web temps réel via Bing (disponible quand l'utilisateur active la navigation ou dans ChatGPT Search). Pour les requêtes d'information générale sur des sujets stables, c'est surtout la mémoire qui joue. Pour les requêtes récentes, c'est Bing qui prime.
Dans les deux cas, les contenus sur-représentés dans les réponses partagent des caractéristiques communes, identifiées empiriquement sur les sites que nous gérons et confirmées par plusieurs études publiées en 2025-2026 (notamment les travaux de l'équipe de recherche de l'Université de Waterloo sur la sélectivité des LLM, et les analyses de Search Engine Land sur le comportement de ChatGPT Search).
Les 3 filtres implicites de ChatGPT
Filtre 1 — Confiance sources : Les modèles favorisent les sources qu'ils associent à l'autorité dans un domaine. Ce n'est pas uniquement le PageRank : c'est la combinaison PageRank + mentions de marque + cohérence thématique du site. Un site spécialisé sur un sujet précis sera souvent préféré à un généraliste, même plus grand.
Filtre 2 — Densité informationnelle : Les passages cités sont presque toujours des passages à haute densité factuelle — chiffres, listes, définitions, comparaisons. Un paragraphe narratif de 200 mots sans données sera rarement cité. Un tableau de comparaison de 8 lignes sera souvent repris.
Filtre 3 — Réponse directe : ChatGPT doit construire une réponse synthétique. Il cherche des passages qui répondent directement à la question sans ambiguïté. Les contenus qui "tournent autour" avant de répondre sont écartés au profit de contenus qui répondent en une phrase, puis développent.
Signal de terrain : Sur un client cabinet de conseil en transformation digitale, nous avons reformaté 12 articles existants en ajoutant une réponse directe en ouverture (2-3 phrases) + un tableau de comparaison. En 6 semaines, 4 de ces articles ont commencé à apparaître dans des réponses ChatGPT sur leurs requêtes cibles respectives. Le contenu n'avait pas changé — seule la structure avait été modifiée.
2. Les 8 leviers GEO fondamentaux
Vue complémentaire sur les enjeux concrets de cette stratégie.
La GEO (Generative Engine Optimization) n'est pas une discipline séparée du SEO — c'est une extension. Les fondamentaux SEO restent valides. Voici les 8 leviers spécifiques à la citabilité IA :
Réponse directe en ouverture
Une réponse en 2-3 phrases à la question principale, avant tout développement.
Structures lisibles par machine
Listes, tableaux, H2/H3 avec verbes d'action. Éviter les paragraphes-blocs sans balise.
Données chiffrées sourcées
Chaque statistique avec sa source nommée et sa date. Les chiffres non sourcés sont ignorés.
Auteur identifié (E-E-A-T)
Nom réel, photo, bio, LinkedIn, schema.org Person. L'anonymat pénalise la citabilité.
Schema.org pertinent
Article, FAQPage, HowTo, Organization — choisir selon le type de contenu.
Cohérence thématique du site
Un site spécialisé sur un domaine sera cité avant un généraliste sur ce même domaine.
Fraîcheur et dateModified
Maintenir la date de modification à jour. Les contenus périmés sont déprioritisés.
Mentions de marque externes
Presse, blogs sectoriels, forums — la marque doit exister en dehors de son propre site.
3. Structurer son contenu pour la citabilité
Le levier le plus actionnable — et souvent le plus négligé — est la structure. Un contenu bien informé mais mal structuré sera rarement cité. Un contenu modérément informé mais parfaitement structuré sera régulièrement repris.
La règle des "passages extractibles"
Imaginez que vous devez construire une réponse de 80 mots à partir de votre article. Vous allez chercher un passage précis, autonome, qui répond directement. C'est exactement ce que fait le modèle. La question à se poser pour chaque section de votre contenu : ce passage peut-il être extrait et cité tel quel, de manière autonome ?
Les passages extractibles ont ces caractéristiques :
- Ils commencent par la réponse, pas par le contexte.
- Ils contiennent une donnée concrète (chiffre, nom, date, résultat).
- Ils ne dépassent pas 100 mots.
- Ils n'utilisent pas de pronoms sans référent clair ("il", "cela", "cette approche").
Hiérarchie de titres GEO-optimisée
Les H2 doivent formuler une question ou une affirmation complète — pas un thème vague. Comparer :
H2 : "Visibilité en ligne"
H3 : "Enjeux actuels"
H3 : "Solutions disponibles"
H2 : "Comment améliorer sa visibilité en ligne en 2026 ?"
H3 : "3 signaux que Google et ChatGPT partagent"
H3 : "Ce que le SEO traditionnel manque aujourd'hui"
Les H2 formulés comme des questions correspondent exactement aux requêtes que les utilisateurs posent aux IA génératives. Quand le titre d'une section reformule mot pour mot la question de l'utilisateur, l'extracteur a un signal fort pour choisir ce passage.
Listes : quand et comment
Les listes sont sur-représentées dans les citations IA, mais seulement quand elles respectent ces règles :
- Maximum 7 items — au-delà, le modèle résume plutôt que de citer.
- Items parallèles — même structure grammaticale pour chaque item.
- Items autonomes — chaque item a un sens sans lire les autres.
- Pas de liste sans intro — une phrase d'introduction expliquant ce que liste la liste.
4. Schema.org : ce qui compte vraiment
La plupart des guides de schema.org pour le SEO restent au niveau des rich snippets Google. Pour la citabilité IA, l'enjeu est différent : il s'agit de fournir une représentation structurée de qui vous êtes et pourquoi vous faites autorité sur ce sujet.
Les 5 types de schema à prioriser
| Type schema | Utilité GEO principale | Priorité |
|---|---|---|
| Article + dateModified | Fraîcheur, attribution auteur | Critique |
| Person (auteur) | Identification E-E-A-T, expertise | Critique |
| Organization + sameAs | Reconnaissance entité marque | Critique |
| FAQPage | Extractibilité directe des Q&A | Important |
| HowTo | Procédures étape par étape | Important |
| BreadcrumbList | Contexte thématique du site | Utile |
Le schema Person est le plus sous-utilisé et pourtant l'un des plus impactants. Il permet au modèle d'associer l'article à un individu réel avec une expertise vérifiable. L'attribut sameAs pointant vers LinkedIn, Twitter/X et éventuellement Wikipedia crée un graphe d'entité que les modèles utilisent pour évaluer la crédibilité.
Le schema Organization avec sameAs vers des annuaires professionnels (LinkedIn Company, Crunchbase, etc.) remplit le même rôle au niveau de la marque. Un site sans schema Organization est traité comme une source anonyme.
FAQPage : le raccourci de citabilité
Le schema FAQPage est le plus direct pour la citabilité IA. Chaque Question / acceptedAnswer est une unité extractible autonome. Quand un utilisateur pose une question à ChatGPT, si votre contenu inclut cette question exacte en FAQPage avec une réponse complète, la probabilité de citation est maximale.
Deux règles pour des FAQ GEO-efficaces :
- Les questions doivent formuler exactement les requêtes réelles — utilisez Google Autocomplete et "People Also Ask" pour les identifier.
- Les réponses doivent être autonomes — complètes en elles-mêmes, sans renvoi à "la section ci-dessus".
5. Signaux d'autorité et E-E-A-T IA
L'E-E-A-T (Expérience, Expertise, Autorité, Fiabilité) n'est pas uniquement un concept Google — c'est le cadre mental qu'un modèle de langage utilise pour évaluer si une source mérite d'être citée. La différence avec le SEO classique : en GEO, les signaux d'E-E-A-T doivent être explicitement dans le contenu, pas seulement dans les métadonnées ou les backlinks.
Expérience — Ce que les modèles cherchent
Un contenu basé sur l'expérience terrain se distingue par des détails non génériques : un chiffre issu d'un cas client réel, une erreur commise et corrigée, un avant/après nommé. Les formulations vagues ("dans notre expérience", "selon nos clients") ne fonctionnent pas — elles ressemblent à du contenu généré sans ancrage réel.
Ce qui fonctionne : "Sur le cas de [secteur anonymisé], nous avons observé X%" ou "Dans les 6 sites sur 40 où nous avons testé cette approche, le résultat a été Y". La précision signale l'expérience.
Expertise — Signaux structurels
L'expertise se démontre dans la structure de l'argumentation : présence de nuances, de cas limites, de conditions ("cela fonctionne si et seulement si"), de comparaisons avec d'autres approches. Un contenu qui ne mentionne aucune limite ou contre-exemple est perçu comme promotionnel, pas expert.
Autorité — La présence externe
L'autorité ne peut pas être auto-déclarée. Elle vient de la présence sur d'autres sites : presse sectorielle, blogs de référence, forums professionnels. Pour les petites marques, les tactiques praticables incluent : contribution de tribunes dans des médias spécialisés, interviews podcast, réponses expertes sur des forums (Reddit, forums sectoriels), témoignages dans des articles tiers.
Fiabilité — Ce qui peut être vérifié
La fiabilité est la dimension la plus concrète : vos données sont sourcées, vos dates sont précises, vos auteurs sont réels, vos pages de contact et mentions légales sont complètes. Un site sans page "À propos" structurée avec des individus réels sera traité avec méfiance.
Cicéro réalise un audit GEO gratuit de 30 minutes — score sur chacun des leviers, recommandations actionnables.
Demander un audit GEO gratuit6. Exemples avant/après concrets
Les exemples suivants sont issus de reformatages réels effectués chez des clients. Les noms sont anonymisés ; les chiffres reflètent l'évolution observée.
Cas 1 — Cabinet de conseil, article "transformation digitale PME"
Intro de 250 mots de contexte. Pas de réponse directe. Deux H2 ("Enjeux actuels", "Solutions envisageables"). Aucune donnée chiffrée sourcée. Auteur absent.
Réponse directe en 3 phrases. H2 reformulés en questions. 4 statistiques avec sources nommées. Schema Person ajouté. FAQ 5 questions.
Résultat mesuré : L'article est apparu dans les réponses ChatGPT sur "transformation digitale PME étapes" 5 semaines après reformatage. Aucun nouveau contenu n'a été produit — uniquement du reformatage.
Cas 2 — Éditeur logiciel SaaS, article "sécurité des données cloud"
Bonne structure mais réponses FAQ incomplètes (renvoi à "voir ci-dessus"). Schema Article sans dateModified. Organisation non identifiée dans les métadonnées.
FAQ toutes autonomes. dateModified ajoutée. Schema Organization complet avec sameAs LinkedIn. Statistique clé ("83% des violations viennent d'erreurs humaines — IBM Cost of a Data Breach 2024") en ouverture.
Résultat mesuré : Citation vérifiée dans ChatGPT Search sur "sécurité données cloud PME France" 4 semaines après modification. Trafic direct non attribué en hausse de 31% sur cet article.
7. Mesurer ses citations dans ChatGPT
Il n'existe pas (en mai 2026) de données natives de citation ChatGPT dans Google Analytics, Search Console ou tout autre outil analytique standard. La mesure est donc indirecte et demande de combiner plusieurs signaux.
Méthode manuelle — La plus fiable
Identifiez vos 10-20 requêtes cibles principales. Interrogez ChatGPT sur chacune d'elles chaque semaine avec une question formulée comme votre utilisateur cible. Documentez si votre marque ou votre URL apparaît dans la réponse. C'est fastidieux mais c'est la seule méthode sans biais d'outil.
Signaux analytiques indirects
Plusieurs patterns dans vos données analytics peuvent signaler une citation ChatGPT :
- Hausse du trafic direct — les utilisateurs de ChatGPT recopient l'URL ou la tapent directement.
- Hausse du trafic "non attribué" dans GA4 (source/medium = (direct)/(none)) en corrélation avec la publication d'un contenu GEO.
- Trafic referral depuis chat.openai.com — dans certains cas, ChatGPT Search génère des referrals traçables.
- Hausse branded search dans Search Console — les utilisateurs IA qui entendent parler de vous cherchent ensuite votre marque sur Google.
Outils tiers
Plusieurs outils commencent à proposer du tracking de mentions IA en 2026. Les résultats sont partiels et les méthodologies varient. Nous n'en recommandons aucun en particulier à ce stade — les approches manuelles et analytiques ci-dessus sont plus fiables que des dashboards opaques.
8. Plan d'action en 8 semaines
-
Semaines 1-2 : Audit de l'existant
Inventoriez vos 20 articles les plus visités. Pour chacun : réponse directe présente ? H2 formulés comme questions ? Données sourcées ? Schema.org ? Auteur identifié ? Classez par effort/impact.
-
Semaines 2-3 : Reformatage prioritaire
Reformatez vos 5 articles à plus fort potentiel GEO. Ajoutez réponse directe, restructurez les H2, sourcez les données existantes, ajoutez FAQPage schema.org.
-
Semaine 3 : Fondations schema.org
Implémentez Organization et Person sur toutes les pages si ce n'est pas fait. Vérifiez dateModified sur tous les articles. Testez avec le Validateur de résultats enrichis Google.
-
Semaines 4-5 : Production GEO-native
Produisez 3-5 articles conçus GEO dès le départ : réponse directe en premier, structure en questions, FAQ 5-6 items, données sourcées. Cibler des requêtes questions ("comment", "pourquoi", "quelle différence").
-
Semaines 5-6 : Signaux d'autorité externe
Identifiez 3-5 opportunités de mentions externes : presse sectorielle, podcast, newsletter partenaire, forum professionnel. Chaque mention = un signal entité pour les modèles.
-
Semaines 7-8 : Mesure et ajustement
Interrogez ChatGPT sur vos 20 requêtes cibles. Documentez les résultats. Identifiez les articles cités vs. non cités. Analysez les différences structurelles et itérez.
9. Ce que ce guide ne couvre pas
Limites de ce guide
- Google AI Overviews spécifiquement — les mécanismes se recoupent avec ChatGPT mais ne sont pas identiques. Voir notre guide dédié : Comment apparaître dans ChatGPT et Google AI Overviews.
- SEO technique sous-jacent — ce guide suppose que votre site est techniquement sain (indexation, vitesse, mobile). Sans ces fondations, le GEO ne peut pas fonctionner.
- Stratégie de backlinks — les signaux d'autorité externe sont mentionnés mais pas approfondis ici.
- Secteurs YMYL — santé, droit, finance — où les règles E-E-A-T sont plus strictes et nécessitent une approche spécifique.
- Résultats garantis — la citabilité ChatGPT dépend d'algorithmes non publics qui évoluent. Ce guide décrit les meilleures pratiques actuelles, pas une formule infaillible.
Questions fréquentes
Comment être cité par ChatGPT ?
Pour être cité par ChatGPT, votre contenu doit répondre directement à des questions précises avec une réponse synthétique en début d'article, utiliser des structures claires (listes, tableaux, titres H2/H3), intégrer des données chiffrées sourcées, et posséder des signaux d'autorité (auteur identifié, schema.org Person/Organization, mentions de marque en ligne). ChatGPT s'appuie sur le web indexé via Bing : les pages bien structurées, à fort signal E-E-A-T, sont sur-représentées dans les réponses générées.
Quelle est la différence entre SEO et GEO ?
Le SEO (Search Engine Optimization) optimise le contenu pour les moteurs de recherche traditionnels comme Google. Le GEO (Generative Engine Optimization) optimise le contenu pour être cité dans les réponses des IA génératives : ChatGPT, Google AI Overviews. Les deux partagent des fondements communs (qualité, structure, autorité) mais le GEO ajoute des exigences spécifiques : réponses directes citables, données chiffrées, identification claire de l'auteur et format facile à synthétiser par un modèle de langage.
Combien de temps pour apparaître dans ChatGPT ?
La visibilité dans ChatGPT n'a pas de délai garanti, car elle dépend des cycles d'entraînement et de l'indexation Bing. Sur les sites que nous gérons, les premiers résultats (citations vérifiées dans ChatGPT) apparaissent entre 4 et 10 semaines après publication d'un contenu optimisé GEO. La visibilité dans Google AI Overviews peut arriver plus rapidement — 2 à 4 semaines.
Le schema.org aide-t-il à être cité dans ChatGPT ?
Oui, le schema.org contribue à la citabilité. Les balises Article, Person, Organization, FAQPage et HowTo fournissent aux modèles de langage une structure sémantique lisible par machine. Elles renforcent l'identification de l'auteur (E-E-A-T) et facilitent l'extraction de réponses structurées. Elles ne garantissent pas la citation, mais éliminent les ambiguïtés d'interprétation qui pénalisent les contenus mal balisés.
Peut-on mesurer ses citations dans ChatGPT ?
Il n'existe pas de données natives ChatGPT dans Google Analytics ou Search Console. Les méthodes pratiques sont : interroger ChatGPT manuellement sur vos requêtes cibles, surveiller les pics de trafic non attribués (dark traffic, direct/typé), et analyser le trafic referral depuis chat.openai.com dans GA4.
Un site récent peut-il être cité par ChatGPT ?
Oui, mais l'autorité de domaine reste un facteur. Un site récent avec peu de liens entrants sera moins cité qu'un site établi, à contenu identique. La stratégie recommandée : cibler des requêtes longue traîne à faible concurrence GEO, publier du contenu de référence sur des sujets de niche, développer progressivement l'autorité via des mentions et backlinks éditoriaux.
J'accompagne des marques B2B et des éditeurs à construire leur visibilité sur Google et les IA génératives. Ce guide synthétise ce que nous observons sur les dizaines de sites que nous gérons — pas de la théorie, des patterns reproductibles.
Suivre sur LinkedInSources et références
- Équipe de recherche, Université de Waterloo — "LLM Source Selectivity in Generative Search" (2025)
- Search Engine Land — "How ChatGPT Search selects sources" (janvier 2026)
- IBM Security — "Cost of a Data Breach Report 2024"
- BrightEdge — "Organic & AI Search Trends" (T1 2026)
- Google — Documentation Search Central, schema.org guidelines (mise à jour avril 2026)