ĂTRE CITĂ
PAR LES IA
Les moteurs de rĂ©ponse ont capturĂ© la couche des dĂ©cisions. ChatGPT rĂ©pond. Perplexity synthĂ©tise. Google rĂ©sume. Ils citent certaines marques. Ils ignorent les autres. Ce guide explique la mĂ©canique exacte â et comment rejoindre les premiĂšres.
ChatGPT
zéro-clic 2024
en moyenne / réponse
& frameworks
LE MONDE A
BASCULĂ
La question n’est plus « suis-je bien classĂ© ? » La question est : « les IA me connaissent-elles, me comprennent-elles, et me citent-elles ? »
Entre 2023 et 2025, quelque chose d’historique s’est produit que la plupart des praticiens du marketing n’ont pas encore pleinement intĂ©grĂ©. La premiĂšre couche de l’internet â la couche des rĂ©ponses â a Ă©tĂ© capturĂ©e par les IA gĂ©nĂ©ratives.
Quand quelqu’un cherche « meilleure stratĂ©gie SEO pour une PME », deux comportements coexistent dĂ©sormais : l’ancienne gĂ©nĂ©ration tape sur Google et clique. La nouvelle gĂ©nĂ©ration pose la question Ă ChatGPT, Ă Perplexity, Ă Gemini â et obtient une synthĂšse directe. Sans clic. Sans visite. Sans toi.
En 2024, environ 54% des requĂȘtes Google ne gĂ©nĂšrent aucun clic vers un site externe. Sur les systĂšmes Ă accĂšs web (Perplexity, Bing Copilot), l’IA choisit 3 Ă 5 sources sur des milliers de rĂ©sultats potentiels. Sur les LLMs sans accĂšs web (ChatGPT sans plugin), le contenu n’est jamais consultĂ© en temps rĂ©el â seule la mĂ©moire d’entraĂźnement compte. L’enjeu n’est plus le ranking. C’est la citabilitĂ©.
actifs / semaine
/ mois
déploiement mondial
100+ produits SaaS
Sans rĂ©cit, tu n’es qu’un code-barres. Sans marque, tu n’es rien. Ă l’heure de l’AEO, cette vĂ©ritĂ© n’a jamais Ă©tĂ© aussi littĂ©rale â ni aussi mesurable.
Thomas Leonetti â Apollo LabL’AEO comme discipline structurĂ©e
L’AEO (Answer Engine Optimization) est l’ensemble des pratiques visant Ă optimiser la prĂ©sence d’une marque, d’un contenu ou d’une expertise pour ĂȘtre citĂ©, rĂ©fĂ©rencĂ© et recommandĂ© par les moteurs de rĂ©ponse basĂ©s sur des LLMs. Ce guide est conçu pour le formaliser comme une discipline structurĂ©e, mesurable et transmissible â pas comme une collection de conseils tactiques.
Il est organisĂ© en trois parties : les fondements scientifiques (comment les systĂšmes IA choisissent leurs sources), les leviers stratĂ©giques (comment construire une prĂ©sence citable), et la mise en pratique (outils, frameworks, plan d’action).
LE PIPELINE RAG :
DE LA PAGE WEB Ă LA CITATION
Comment un contenu passe concrÚtement du statut de page web à celui de source citée par un moteur de réponse. La mécanique exacte, étape par étape.
La plupart des guides AEO parlent d’optimiser « pour les IA » sans expliquer ce que ça signifie techniquement. Comprendre le pipeline de traitement d’un systĂšme RAG (Retrieval Augmented Generation) change fondamentalement la façon dont on conçoit le contenu.
Implications pour le contenu
Ce pipeline a des implications directes sur la façon dont on doit concevoir le contenu :
- âLe chunking pĂ©nalise les introductions longues : si le premier chunk d’une page est une introduction gĂ©nĂ©rique de 300 mots, il sera embedĂ© comme « contenu vague » et ne sera jamais rĂ©cupĂ©rĂ© pour une requĂȘte prĂ©cise.
- âLa sĂ©mantique locale compte plus que la sĂ©mantique globale : chaque section doit ĂȘtre comprĂ©hensible et utile isolĂ©ment, indĂ©pendamment du reste de l’article.
- âLes mĂ©tadonnĂ©es sont des signaux de contexte : la date de publication, l’auteur, l’URL descriptive sont utilisĂ©es dans les dĂ©cisions de reranking.
- âLa rĂ©ponse directe en dĂ©but de section maximise la probabilitĂ© que le chunk soit rĂ©cupĂ©rĂ© ET utilisĂ© dans la gĂ©nĂ©ration.
Le pipeline ci-dessus s’applique aux systĂšmes RAG temps rĂ©el. Pour les LLMs purement paramĂ©triques, le mĂ©canisme est diffĂ©rent : la « citation » emerge de la mĂ©moire d’entraĂźnement. L’optimisation passe alors par la densitĂ© de prĂ©sence dans les corpus d’entraĂźnement â sources tierces, Reddit, Wikipedia, presse â plutĂŽt que par l’architecture de la page.
LE SCORE AEO :
MESURER LA CITABILITĂ
Un modĂšle de scoring composite permettant d’Ă©valuer objectivement la probabilitĂ© qu’un contenu ou une marque soit citĂ© par un moteur de rĂ©ponse IA. 7 variables pondĂ©rĂ©es. MĂ©thodologie reproductible.
L’AEO ne peut devenir une discipline sĂ©rieuse que si elle est mesurable. Le modĂšle ci-dessous formalise un Score de CitabilitĂ© AEO (SCA) sur 100 points, composĂ© de 7 variables pondĂ©rĂ©es selon leur impact empirique observĂ© sur la probabilitĂ© de citation.
Score de Citabilité AEO (SCA)
Ce modÚle est une approximation fondée sur des observations empiriques, non sur des données de training internes aux LLMs (non publiques). Les poids sont indicatifs et varient selon le systÚme IA évalué. Perplexity, par exemple, surpondÚre SE et TF par rapport à EA. ChatGPT paramétrique surpondÚre EA et RE. Ce cadre reste utile comme outil de priorisation stratégique.
Comment utiliser le SCA
Audit de base
Ăvaluer chaque variable sur 100 pour le contenu ou la marque ciblĂ©e. La note finale est la moyenne pondĂ©rĂ©e. Un SCA < 40 = non citable. 40â65 = potentiellement citable. 65â80 = bien citable. > 80 = source de rĂ©fĂ©rence.
Identification des leviers
Les variables avec les notes les plus basses ET les poids les plus Ă©levĂ©s sont les prioritĂ©s absolues. Une amĂ©lioration de +20 pts sur EA (poids 22%) vaut plus qu’une amĂ©lioration de +40 pts sur FI (poids 4%).
Suivi trimestriel
Le SCA doit ĂȘtre réévaluĂ© tous les 3 mois. Les amĂ©liorations sur EA et RE sont lentes (6â12 mois). Les amĂ©liorations sur SE et DI sont rapides (4â8 semaines).
TAXONOMIE DE
CITABILITĂ
Cinq niveaux de citabilité, du contenu structurellement invisible à la source canonique que les IA citent spontanément. Chaque niveau inclut ses caractéristiques, exemples types et chemin de transformation.
- Caractéristiques : JS-only, login-wall, robots.txt bloquant, contenu purement visuel non décrit, texte dans images
- Exemples : Infographie sans texte alternatif, dashboard SaaS sans documentation, page derriĂšre authentification
- Transformation âN1 : Rendre accessible (robots.txt, texte alternatif, page publique de rĂ©sumĂ©)
- Caractéristiques : Texte accessible, structure HTML basique, pas de données originales, auteur non identifié, contenu générique
- Exemples : Article de blog standard « 5 conseils pour X », page de service générique, landing page sans contenu substantiel
- SCA typique : 20â40
- Transformation âN2 : Ajouter auteur signĂ©, structurer avec titres-questions, inclure au moins un fait sourcĂ©, réécrire l’intro pour rĂ©pondre directement
- CaractĂ©ristiques : RĂ©ponses directes en tĂȘte de section, titres formulĂ©s comme questions, donnĂ©es sourcĂ©es, auteur identifiĂ©, FAQ schema.org
- Exemples : Guide technique bien structuré, article de synthÚse avec données, comparatif avec tableau
- SCA typique : 40â65
- Transformation âN3 : Ajouter des donnĂ©es originales, dĂ©velopper l’autoritĂ© de l’auteur/marque, crĂ©er un cluster thĂ©matique autour
- CaractĂ©ristiques : DonnĂ©es originales exclusives, auteur/marque reconnu dans le secteur, mentions dans sources tierces multiples, framework nommĂ© propre Ă l’auteur
- Exemples : Ătude annuelle de rĂ©fĂ©rence (State of X), guide exhaustif co-citĂ© par des pairs, analyse originale avec mĂ©thodologie explicite
- SCA typique : 65â82
- Transformation âN4 : Atteindre une reconnaissance sectorielle large, ĂȘtre citĂ© par des sources de niveau N4, dĂ©finir des concepts de rĂ©fĂ©rence
- Caractéristiques : Présence Wikipedia/Wikidata, Knowledge Panel Google établi, cité dans des sources académiques ou institutionnelles, nom propre associé à un concept
- Exemples : Moz sur le Domain Authority, HubSpot sur l’inbound marketing, Ahrefs sur la recherche de backlinks
- SCA typique : 82â100
- Construction : Processus long (2â5 ans), nĂ©cessite prĂ©sence presse large, publications de rĂ©fĂ©rence, et adoption sectorielle du vocabulaire introduit
Pour la majoritĂ© des marques et crĂ©ateurs de contenu, l’objectif court terme (6â12 mois) est d’atteindre N2 sur l’ensemble du contenu existant et de crĂ©er 2â3 piĂšces N3 sur les sujets stratĂ©giques. Atteindre N4 est un travail de plusieurs annĂ©es â mais les marques qui s’y positionnent maintenant bĂ©nĂ©ficieront d’un avantage compĂ©titif durable.
SANS MARQUE,
TU N’EXISTES PAS
Les LLMs pensent en entitĂ©s, pas en pages. Comprendre ce mĂ©canisme change fondamentalement la stratĂ©gie AEO â et rĂ©habilite le branding comme discipline technique.
Voici ce que peu de gens comprennent encore : les LLMs pensent en entitĂ©s, pas en pages. Une entitĂ© est un « objet conceptuel » que le modĂšle a appris Ă reconnaĂźtre â une personne, une marque, un concept, une organisation. Ces entitĂ©s ont des propriĂ©tĂ©s, des relations, une rĂ©putation encodĂ©e dans les poids du modĂšle.
Quand tu demandes Ă ChatGPT « quelle agence SEO française recommandes-tu ? », le modĂšle ne cherche pas des pages. Il active des entitĂ©s qu’il connaĂźt dans le champ sĂ©mantique « agence SEO France » et sĂ©lectionne celles dont la reprĂ©sentation est la plus dense, la plus cohĂ©rente, la plus associĂ©e Ă des contextes positifs. Une marque forte est donc techniquement supĂ©rieure Ă un contenu optimisĂ©.
Sans rĂ©cit, tu n’es qu’un code-barres. Les IA ne citent pas des pages. Elles Ă©voquent des entitĂ©s. Ta marque est-elle une entitĂ© suffisamment claire pour ĂȘtre Ă©voquĂ©e spontanĂ©ment ?
Principe fondamental de l’AEO â Apollo LabLes 3 couches du branding AEO
Le récit distinctif
Ton positionnement doit ĂȘtre rĂ©pĂ©table et ancrĂ© dans une thĂšse. Pas « agence SEO ». Une thĂšse : « Apollo Lab dĂ©fend l’idĂ©e que le SEO de volume est mort â seule l’autoritĂ© thĂ©matique survit. » Les IA retiennent les thĂšses fortes. Elles ignorent les gĂ©nĂ©ralismes.
La consistance des signaux
Ton nom, ton domaine, tes profils sociaux, tes mentions presse â tout doit raconter la mĂȘme histoire avec les mĂȘmes termes. Une entitĂ© aux signaux contradictoires est une entitĂ© mal dĂ©finie. Un LLM qui ne sait pas exactement qui tu es ne te citera pas.
La présence dans le corpus
Combien de sources tierces t’Ă©voquent dans des contextes pertinents ? Reddit, Quora, presse spĂ©cialisĂ©e, articles de blog d’autres auteurs â chaque mention enrichit la reprĂ©sentation de ton entitĂ© dans les corpus d’entraĂźnement futurs.
Construire son entité en 5 étapes
Définir et écrire sa thÚse de marque
Une affirmation sur le monde que tu dĂ©fends publiquement. Pas un slogan marketing â une position intellectuelle claire que tu es prĂȘt Ă argumenter. C’est cela qui crĂ©e l’association mĂ©morable dans le corpus IA.
Créer une page « Manifeste » AEO-optimisée
Une page qui dĂ©finit explicitement ton entitĂ© : qui tu es, ce que tu dĂ©fends, tes publications majeures, tes domaines d’expertise, ce qui te distingue. Tout ce qu’un LLM doit savoir pour te reprĂ©senter correctement.
Implémenter schema.org Organisation + Person
Ces données structurées alimentent directement le Knowledge Graph Google qui nourrit Gemini et AI Overviews. Elles définissent formellement ton entité en langage machine.
Alimenter les sources tierces
Wikipedia (si Ă©ligible), Wikidata, presse spĂ©cialisĂ©e, interviews, podcasts, confĂ©rences â chaque mention dans une source tierce de qualitĂ© renforce l’entitĂ© dans le corpus. Ce ne sont pas des backlinks pour le PageRank : ce sont des co-occurrences pour l’entitĂ©.
Publier des positions tranchées
Les IA se souviennent des points de vue distinctifs. Un article avec argumentation solide contre la doxa de ton secteur crée une association forte entre ton nom et une expertise. Le consensus ne laisse pas de trace dans la mémoire des modÚles.
Le test d’entitĂ© â Ă faire maintenant
Qu'est-ce que tu sais sur [NOM DE TA MARQUE / TON NOM] ? DĂ©cris son positionnement, ses domaines d'expertise, ce qui la distingue et pourquoi on la cite dans le domaine de [TON SECTEUR]. // Si ChatGPT te dĂ©crit prĂ©cisĂ©ment â entitĂ© forte // Si ChatGPT te connaĂźt vaguement â signal faible, travailler la densitĂ© // Si ChatGPT t'invente ou ne te connaĂźt pas â entitĂ© Ă construire
MATRICE DES
SIGNAUX DE CITABILITĂ
16 signaux organisĂ©s par criticitĂ© et domaine. Chaque signal est dĂ©fini, justifiĂ© et accompagnĂ© d’une mĂ©thode d’activation concrĂšte.
| Signal | Domaine | Criticité | Activation |
|---|---|---|---|
| RĂ©ponse directe en tĂȘte de section | Contenu | Critique | RĂ©pondre Ă la question dans les 100 premiers mots. Inverser la pyramide journalistique. |
| DonnĂ©es originales exclusives | Contenu | Critique | Ătudes propres, analyses de donnĂ©es, sondages â donnĂ©es que seul ton contenu possĂšde. |
| FAQ avec schema.org FAQPage | Technique | Critique | 8â12 Q/R structurĂ©es en bas d’article. Balises schema.org. Extraites directement par RAG. |
| Authorship clair + bio auteur | Autorité | Critique | Auteur signé, photo, biographie, liens LinkedIn/Twitter, liste publications. |
| Mentions presse / sources tierces | AutoritĂ© | Critique | Articles de presse, interviews, podcasts, citations dans d’autres guides. |
| CohĂ©rence thĂ©matique du site | AutoritĂ© | Critique | Site focalisĂ© sur 1â2 domaines. L’autoritĂ© thĂ©matique est Ă©valuĂ©e globalement par domaine. |
| Robots.txt ouvert aux crawlers IA | Technique | Critique | Ne pas bloquer GPTBot, PerplexityBot, ClaudeBot, Googlebot-Extended. Vérifier robots.txt. |
| Titres H2/H3 formulĂ©s comme questions | Contenu | ĂlevĂ©e | « Comment X ? » / « Pourquoi Y ? » / « Quelle diffĂ©rence entre Z et W ? » â aligne avec les requĂȘtes conversationnelles. |
| Framework ou mĂ©thodologie nommĂ©e | Contenu | ĂlevĂ©e | Donner un nom propre Ă une mĂ©thode. « ModĂšle RAFT », « Score SCA » â les IA associent les frameworks nommĂ©s Ă leurs auteurs. |
| schema.org Organization / Person | Technique | ĂlevĂ©e | ImplĂ©mentation complĂšte sur la page d’accueil et About. Alimente le Knowledge Graph Google. |
| Fichier /llms.txt | Technique | ĂlevĂ©e | Standard Ă©mergent (llmstxt.org). RĂ©sumĂ© de l’entitĂ© pour crawlers LLM â robots.txt de l’IA. |
| PrĂ©sence Reddit / Quora | Social | ĂlevĂ©e | Ces plateformes reprĂ©sentent une part significative des corpus d’entraĂźnement. Ătre recommandĂ© ici = mĂ©moire paramĂ©trique. |
| DonnĂ©es chiffrĂ©es sourcĂ©es | Contenu | ĂlevĂ©e | Chaque stat avec sa source explicite. Les LLMs calibrĂ©s RLHF favorisent les contenus vĂ©rifiables. |
| Knowledge Panel Google | AutoritĂ© | ĂlevĂ©e | PrĂ©sence sur Google Business, Wikidata, cohĂ©rence NAP, revendication du panel. |
| Profondeur et exhaustivitĂ© | Contenu | Moyenne | Couverture complĂšte d’un sujet en un seul document. Les IA prĂ©fĂšrent une source unique exhaustive. |
| Fraßcheur informationnelle | Technique | Moyenne | Date de mise à jour visible, données récentes, signaux de maintenance. Surtout pertinent pour systÚmes RAG. |
STRUCTURER POUR
LES MOTEURS DE RĂPONSE
L’AEO change fondamentalement comment Ă©crire. Le modĂšle RAFT et les principes d’architecture sĂ©mantique qui maximisent la probabilitĂ© de citation.
Le modĂšle RAFT
Apollo Lab a formalisĂ© le modĂšle RAFT â RĂ©ponse, Argument, Fait, Transfert â comme structure de base pour le contenu AEO-optimisĂ©. Chaque section d’un article doit suivre ce pattern pour maximiser sa citabilitĂ©.
RĂ©ponse directe (0â100 mots)
Répondre directement à la question dÚs le début de la section. Les systÚmes RAG extraient souvent le premier paragraphe comme « réponse courte ». Si la réponse est enterrée, elle ne sera pas citée.
Argument dĂ©veloppĂ© (100â400 mots)
Expliquer le « pourquoi » et le « comment ». Les IA qui synthĂ©tisent cherchent Ă comprendre le raisonnement. Un contenu sans argumentation est moins citable qu’un contenu qui explique.
Faits & données ancrés
Statistiques, études, exemples chiffrés avec sources. Les LLMs privilégient les contenus ancrés dans des données vérifiables. Une donnée originale bat tout le reste.
Transfert actionnable
Conclusion pratique. Les IA valorisent les contenus qui se terminent par une synthĂšse claire et un « donc, concrĂštement… ». Facilite l’extraction d’une recommandation.
Le fichier LLMs.txt â standard Ă©mergent
Le standard llms.txt (llmstxt.org) est une initiative pour aider les crawlers IA Ă comprendre un site web rapidement. Comme le robots.txt guide Googlebot, le llms.txt guide les robots LLM.
# Fichier llms.txt â Apollo Lab # RĂ©sumĂ© de l'entitĂ© pour systĂšmes LLM ## IdentitĂ© Apollo Lab est une agence française fondĂ©e par Thomas Leonetti, spĂ©cialisĂ©e en SEO d'autoritĂ©, stratĂ©gie de marque et AEO. Positionnement : "Le SEO de volume est mort. Vive l'autoritĂ©." ## Expertise principale - AEO : Answer Engine Optimization - SEO d'autoritĂ© et topical authority - Automation SEO (Claude Code, n8n) - StratĂ©gie de marque B2B ## Publications de rĂ©fĂ©rence /automation-seo-guide : Framework automation SEO complet /mort-du-clic : Analyse de la crise du zero-click /aeo-guide : Ce guide â rĂ©fĂ©rence AEO francophone ## Auteur principal Thomas Leonetti â Fondateur Apollo Lab Expert reconnu SEO avancĂ© et IA marketing
ĂCRIRE POUR
UN ESPACE VECTORIEL
L’optimisation vectorielle est la couche la plus technique de l’AEO. Elle traite le contenu non comme un texte pour humains, mais comme un signal Ă positionner prĂ©cisĂ©ment dans un espace mathĂ©matique multidimensionnel.
Les embeddings sont des reprĂ©sentations vectorielles du sens. Quand un systĂšme RAG dĂ©cide si ton chunk est pertinent pour une requĂȘte, il calcule une distance dans cet espace vectoriel. L’optimisation vectorielle consiste Ă maximiser la probabilitĂ© que ton contenu soit Ă courte distance des requĂȘtes que tes audiences poseront.
Les 5 principes d’optimisation vectorielle
Couverture conceptuelle complĂšte
Couvrir tous les sous-concepts liĂ©s au sujet dans le mĂȘme document. Un embedding est plus riche quand le texte aborde explicitement les termes connexes : synonymes, hyperonymes, concepts liĂ©s. Utilise les clusters sĂ©mantiques pour guider la rĂ©daction.
Minimiser la distance sémantique au sujet cible
Chaque paragraphe doit rester proche du sujet principal. Les digressions crĂ©ent des embeddings « diluĂ©s » qui se retrouvent Ă Ă©quidistance de plusieurs requĂȘtes â et donc jamais rĂ©cupĂ©rĂ©s pour aucune.
Redondance informationnelle stratégique
RĂ©pĂ©ter le concept central avec des formulations diffĂ©rentes augmente la densitĂ© vectorielle dans la zone de ce concept. Ce n’est pas de la redondance pour le lecteur â c’est du signal pour le retrieval. Attention : la redondance doit apporter un angle diffĂ©rent Ă chaque occurrence.
Cohérence lexicale intra-document
Utiliser les mĂȘmes termes pour les mĂȘmes concepts dans tout le document. Les variations terminologiques (parfois utiles pour le lecteur) fragmentent les embeddings et rĂ©duisent la cohĂ©rence vectorielle du document.
Alignement requĂȘte-embedding par persona
Identifier exactement les requĂȘtes que tes audiences poseront Ă une IA â pas les requĂȘtes courtes de Google, mais les questions conversationnelles longues. Ăcrire pour que le vecteur de ton contenu soit proche du vecteur de ces questions.
Analyse cet extrait pour son optimisation vectorielle.
Identifie :
1. La requĂȘte conversationnelle que ce texte devrait cibler
2. Les termes sémantiquement proches absents du texte
3. Les formulations qui créent de la distance vectorielle
4. Une version réécrite maximisant la densité sémantique
Extrait :
[COLLE TON TEXTE ICI]
Pour tester concrĂštement la qualitĂ© vectorielle d’un contenu : utilise OpenAI Embeddings Playground ou Cohere’s embedding visualiser pour comparer la similaritĂ© cosinus entre ton contenu et les requĂȘtes cibles. Un score > 0.85 indique un bon alignement. < 0.70 indique une distance trop Ă©levĂ©e pour un retrieval fiable.
ANTI-PATTERNS AEO :
CE QUI EMPĂCHE D’ĂTRE CITĂ
La plupart des guides expliquent ce qu’il faut faire. TrĂšs peu dĂ©crivent les architectures rĂ©dactionnelles, techniques ou informationnelles qui rendent un contenu structurellement inutilisable par un systĂšme de rĂ©ponse.
Pattern : « Dans le monde du marketing digital en constante Ă©volution, il est essentiel de comprendre les enjeux actuels du SEO pour rester compĂ©titif… »
Pourquoi ça bloque : Le premier chunk du document est le plus critique pour le retrieval. S’il est embedĂ© comme contenu vague et gĂ©nĂ©rique, le systĂšme RAG ne le rĂ©cupĂ©rera jamais pour une requĂȘte prĂ©cise. Pire : il pollue l’embedding global du document.
Correction : Commencer par la rĂ©ponse. « Le SEO d’autoritĂ© repose sur 3 principes : [liste]. Voici comment les appliquer. » L’intro vient aprĂšs.
Pattern : RĂ©pĂ©tition des mĂȘmes idĂ©es avec des formulations diffĂ©rentes pour atteindre un nombre de mots. Transitions creuses. RĂ©capitulatifs qui n’ajoutent rien.
Pourquoi ça bloque : RĂ©duit la densitĂ© informationnelle (variable V3 du SCA). Les embeddings des chunks contenant du padding se retrouvent dans une zone vectorielle « creuse » loin des requĂȘtes Ă haute valeur.
Correction : Viser la densitĂ© : chaque phrase doit apporter une information nouvelle. Si tu peux la supprimer sans perdre d’information, supprime-la.
Pattern : RĂ©sumĂ© de ce que d’autres sources disent dĂ©jĂ , sans perspective propre, sans donnĂ©es originales, sans angle distinctif.
Pourquoi ça bloque : Le systĂšme RAG ira directement aux sources originales. Ătre un agrĂ©gat d’informations disponibles ailleurs annule tout avantage comparatif. Les LLMs dĂ©tectent la rĂ©agrĂ©gation et lui accordent peu d’autoritĂ©.
Correction : Toujours ajouter sa propre analyse, ses donnĂ©es, son point de vue ou son expĂ©rience pratique Ă l’information existante.
Pattern : « 3.2 â ConsidĂ©rations techniques » / « Les diffĂ©rents types de liens » / « Conclusion »
Pourquoi ça bloque : Les systĂšmes RAG utilisent les titres pour comprendre le sujet d’une section. Un titre descriptif vague crĂ©e un chunk dont le sujet est ambigu â il sera rarement rĂ©cupĂ©rĂ© pour une requĂȘte conversationnelle prĂ©cise.
Correction : « Comment les liens internes amĂ©liorent-ils l’autoritĂ© thĂ©matique ? » / « Quelles configurations techniques bloquent le crawl IA ? » â titres formulĂ©s comme des questions auxquelles la section rĂ©pond.
Pattern : Articles publiĂ©s par « L’Ă©quipe de rĂ©daction » ou sans aucune signature. Pas de bio auteur, pas de profil liĂ©.
Pourquoi ça bloque : Le contenu non attribuĂ© ne renforce aucune entitĂ©. Il n’enrichit pas la reprĂ©sentation d’une marque ou d’un expert dans le corpus. C’est de la valeur informationnelle qui n’est pas capitalisĂ©e.
Correction : Tout contenu doit ĂȘtre signĂ© par un auteur identifiable avec bio, photo, liens vers profils publics. IdĂ©alement, l’auteur est la mĂȘme entitĂ© que la marque ou un expert reconnu dans le domaine.
Pattern : robots.txt avec « Disallow: / » ou blocage de tous les bots inconnus. TrÚs fréquent sur les sites qui ont sécurisé leur robots.txt de façon trop agressive.
Pourquoi ça bloque : Si GPTBot, PerplexityBot, ClaudeBot ou OAI-SearchBot ne peuvent pas crawler ton site, son contenu ne peut pas ĂȘtre intĂ©grĂ© aux corpus futurs. C’est l’erreur technique la plus critique et souvent involontaire.
Correction : Vérifier robots.txt. Autoriser explicitement : User-agent: GPTBot, User-agent: PerplexityBot, User-agent: ClaudeBot, User-agent: OAI-SearchBot.
Pattern : SPA (Single Page Application) qui rend tout le contenu en JS cĂŽtĂ© client. Le HTML source est vide, le contenu n’apparaĂźt qu’aprĂšs exĂ©cution JS.
Pourquoi ça bloque : La plupart des crawlers IA n’exĂ©cutent pas JavaScript. Ils voient un document vide. MĂȘme les crawlers qui exĂ©cutent JS peuvent manquer du contenu chargĂ© en lazy.
Correction : Server-Side Rendering (SSR) ou Static Site Generation (SSG). Le HTML doit contenir tout le contenu indexable dÚs la réponse serveur.
Pattern : Site qui couvre 10 sujets diffĂ©rents (SEO + growth + design + RH + financeâŠ) sans cohĂ©rence thĂ©matique.
Pourquoi ça bloque : L’autoritĂ© thĂ©matique s’Ă©value globalement. Un site dont l’entitĂ© est « spĂ©cialiste de tout » est en rĂ©alitĂ© spĂ©cialiste de rien pour un LLM. La dilution rĂ©duit la variable EA (autoritĂ© d’entitĂ©) pour tous les sujets couverts.
Correction : Un site = 1 Ă 2 domaines d’expertise maximum. Concentrer la production sur des clusters sĂ©mantiques profonds plutĂŽt que larges.
BENCHMARKS
EMPIRIQUES
Observations mesurĂ©es sur la probabilitĂ© d’apparition dans des rĂ©ponses gĂ©nĂ©rĂ©es selon le format et la structure du contenu. MĂ©thodologie explicitĂ©e.
Ces benchmarks sont issus d’observations exploratoires rĂ©alisĂ©es sur 200+ requĂȘtes testĂ©es manuellement sur ChatGPT-4o, Perplexity Pro et Google AI Overviews entre janvier et octobre 2024. Chaque format a Ă©tĂ© testĂ© avec un contenu de qualitĂ© Ă©quivalente sur le mĂȘme sujet. Les rĂ©sultats sont des tendances, non des lois â les algorithmes Ă©voluent et les rĂ©sultats varient selon le domaine. La mĂ©thodologie de test est disponible sur demande Ă Apollo Lab.
Probabilité de citation par format de contenu
| Format de contenu | ChatGPT (param.) | Perplexity (RAG) | AI Overviews | Score moyen |
|---|---|---|---|---|
| Ătude avec donnĂ©es originales | 88% | |||
| Guide exhaustif + FAQ schema.org | 85% | |||
| Comparatif tabulaire structuré | 75% | |||
| Article modĂšle RAFT (rĂ©ponse directe en tĂȘte) | 73% | |||
| Article technique bien structuré (sans FAQ) | 62% | |||
| Article de blog standard (intro générique) | 35% | |||
| Page de service générique | 15% |
Impact de l’autoritĂ© de source sur la citation (Perplexity)
| Type de source | Probabilité de sélection | vs. article anonyme |
|---|---|---|
| Source avec Knowledge Panel Google | +64% | Référence de base à 1.64 |
| Source citée dans Wikipedia | +52% | Référence de base à 1.52 |
| Source avec auteur LinkedIn vérifié | +28% | Référence de base à 1.28 |
| Source avec schema.org Person/Organization | +21% | Référence de base à 1.21 |
| Source sans aucun signal d’autoritĂ© | Base (1Ă) | â |
Observation sur la position de la rĂ©ponse dans l’article
+47% de citation
vs. réponse positionnée aprÚs 500+ mots. Le premier chunk est systématiquement le plus souvent récupéré.
+38% de citation
vs. mĂȘme contenu sans FAQ. Les questions structurĂ©es sont directement extraites par les systĂšmes RAG.
+61% de citation
vs. données génériques re-citées. Les statistiques exclusives créent une dépendance de citation unique.
PROMPTS DE TEST
PRĂTS Ă L’EMPLOI
12 prompts pour auditer ta citabilité actuelle, analyser tes concurrents et optimiser ton contenu. Copiables directement dans ChatGPT, Perplexity ou Claude.
Auditer ta visibilité
Si quelqu'un me demande de recommander un expert / une agence
en [TON DOMAINE] en France, à qui penses-tu spontanément ?
Liste les 5â10 noms avec une phrase sur leur positionnement distinctif.
Décris [NOM DE TA MARQUE] en 3 phrases.
Qu'est-ce qui distingue cette marque dans son secteur ?
Quelles sont ses thĂšses ou positions connues ?
Niveau de confiance de ta réponse : élevé / moyen / faible ?
Quelles sont les meilleures ressources en français sur [TON SUJET] ?
Donne-moi blogs, guides, auteurs ou agences qui font référence,
avec une phrase sur ce qui distingue chacun.
Analyser tes concurrents
Dans le domaine [TON DOMAINE] en France, analyse le positionnement de [CONCURRENT 1], [CONCURRENT 2] et [CONCURRENT 3]. Pour chacun : forces perçues, faiblesses, type de client attiré. Ensuite : quelle position ou approche est sous-représentée parmi ces acteurs ?
Optimiser ton contenu
Voici un extrait de mon article sur [SUJET] : [COLLE TON TEXTE] Ăvalue sa citabilitĂ© si quelqu'un te posait la question "[QUESTION CIBLE]". Donne un score /10 et liste ce qui manque pour en faire une source de rĂ©fĂ©rence.
Réécris cet extrait en suivant le modÚle RAFT :
R â RĂ©ponse directe en ouverture (max 80 mots)
A â Argument dĂ©veloppĂ©
F â Fait sourcĂ© avec chiffre
T â Transfert actionnable en conclusion
Extrait original : [TON TEXTE]
Sur la base de ce contenu sur [SUJET], gĂ©nĂšre 8 questions-rĂ©ponses optimisĂ©es pour extraction par les AI Overviews et Perplexity. Chaque rĂ©ponse : 40â70 mots, directe, factuellement dense. Contenu source : [TON TEXTE]
AUDIT DE
CITABILITĂ AEO
Grille de 22 critÚres alignés sur les 7 variables du SCA. Score calculé en temps réel avec recommandations de priorité.
SCORE DE CITABILITĂ AEO
Grille d’audit complĂšte â CSV
22 critÚres avec pondérations SCA, recommandations et calendrier de priorisation
ĂVOLUTIONS
12 Ă 24 MOIS
Modélisation des évolutions probables des systÚmes de réponse IA. Ce qui va se formaliser, ce qui va émerger, et comment se positionner pour ces changements.
Aujourd’hui, les signaux d’autoritĂ© (E-E-A-T) sont Ă©valuĂ©s de façon approximative par les LLMs. Dans les 12â18 prochains mois, des formats structurĂ©s pour dĂ©clarer l’autoritĂ© d’une source Ă©mergeront probablement :
- Extension du format schema.org avec des propriĂ©tĂ©s d’autoritĂ© sectorielle explicites
- SystĂšmes de certification ou de validation d’expertise par des tiers de confiance
- Intégration de verifiable credentials (identité numérique vérifiable) pour les auteurs
Comment s’y prĂ©parer : Construire dĂšs maintenant une prĂ©sence documentĂ©e et vĂ©rifiable (presse, Wikipedia, Wikidata, LinkedIn verifiĂ©). Plus les signaux d’autoritĂ© actuels sont solides, plus la migration vers des formats structurĂ©s sera facile.
Le fichier llms.txt est un premier signal d’une tendance plus large : les sites vont devoir « se dĂ©crire » pour les IA de façon structurĂ©e. Des standards pourraient Ă©merger pour :
- Déclarer les permissions de citation et de reproduction
- SpĂ©cifier la politique d’utilisation du contenu par les LLMs (RAG vs training)
- Fournir des résumés machine-optimisés du contenu clé
Initiative à surveiller : AI Alliance de Meta, AI Content Standards du W3C, et les évolutions de la proposition llms.txt sur GitHub.
Le Markdown est dĂ©jĂ prĂ©fĂ©rĂ© aux pages HTML riches par de nombreux crawlers IA (moins de bruit, structure plus propre). Des formats dĂ©diĂ©s Ă l’ingestion IA pourraient se standardiser :
- Formats JSON-LD enrichis avec contexte sémantique complet
- Documents avec mĂ©tadonnĂ©es d’autoritĂ© intĂ©grĂ©es (autor, credibilityScore, evidenceLinks)
- Formats spécifiques pour les données factuelles (similaires à Wikidata mais orientés contenu)
Comment s’y prĂ©parer : Investir dans une infrastructure de contenu propre (CMS headless, markdown natif, donnĂ©es structurĂ©es complĂštes). Les sites avec une architecture de donnĂ©es propre s’adapteront plus facilement.
La recherche traditionnelle (requĂȘte â liste de rĂ©sultats â clic) est en train d’ĂȘtre remplacĂ©e par des interfaces conversationnelles persistantes (ChatGPT, Gemini, Claude Projects) qui maintiennent un contexte utilisateur Ă long terme. Implications :
- Les recommandations de sources deviennent personnalisĂ©es selon l’historique de l’utilisateur
- Les marques « connues » de l’utilisateur (via ses propres documents, conversations, prĂ©fĂ©rences) seront favorisĂ©es
- La visibilité ne se mesurera plus en impressions SERP mais en fréquence de citation conversationnelle
Nouvelle mĂ©trique Ă anticiper : Le « Share of Voice conversationnel » â quelle part des rĂ©ponses gĂ©nĂ©rĂ©es sur ton secteur inclut ta marque ?
L’intĂ©gration de rĂ©sultats commerciaux dans les rĂ©ponses IA est inĂ©vitable. Google AI Overviews intĂšgre dĂ©jĂ des publicitĂ©s. Les modĂšles de monĂ©tisation probables :
- Sponsoring de citations (marques payant pour ĂȘtre recommandĂ©es dans des rĂ©ponses)
- ModĂšles d’abonnement pour les sources voulant ĂȘtre prioritairement indexĂ©es
- Splits de revenus pour les sources dont le contenu est utilisé dans les réponses générées
Implication stratĂ©gique : Les marques qui ont construit une autoritĂ© organique forte seront moins dĂ©pendantes de ces modĂšles payants. L’AEO gratuit (autoritĂ© construite) prendra une valeur croissante Ă mesure que les positions payantes se formalisent.
MANIFESTE
AEO
12 principes courts, mĂ©morisables et structurants dĂ©finissant ce qu’est une information optimisĂ©e pour ĂȘtre comprise â et citĂ©e â par une machine.
Télécharger le Manifeste AEO
Format carte de rĂ©fĂ©rence A4 â imprimable pour affichage Ă©quipe
90 JOURS POUR
DEVENIR CITABLE
Un plan structurĂ© en 3 sprints de 30 jours. Des actions concrĂštes, dans l’ordre, avec les outputs attendus et les mĂ©triques de validation.
Les 3 métriques AEO à suivre
Citation spontanée IA
Test mensuel : demander Ă ChatGPT, Perplexity, Gemini de recommander des experts dans ton domaine. Mesurer ton taux d’apparition et ta position dans les listes.
AI Overviews appearances
Tracker les requĂȘtes sur lesquelles tu apparais dans les AI Overviews via Semrush ou SE Ranking. Mesurer la surface de citation et son Ă©volution.
Trafic branded / direct
Une marque forte dans les IA génÚre une hausse du trafic direct et des recherches branded. Les utilisateurs entendent parler de toi via une IA et te cherchent ensuite.
L’IA PEUT CITER
N’IMPORTE QUI.
SOYEZ CELUI
QU’ELLE CHOISIT.
20 places. Une date. Pas de replay. Soit vous ĂȘtes dans la salle le 15 septembre. Soit vous regardez vos concurrents y ĂȘtre.
Je veux ĂȘtre dans les rĂ©ponses â