Etre cité par les IA

Être CitĂ© par les IA — Guide AEO de RĂ©fĂ©rence · Apollo Lab
Apollo Lab · Guide AEO 2025 · Édition Scientifique

ÊTRE CITÉ
PAR LES IA

Le cadre de rĂ©fĂ©rence pour l’Answer Engine Optimization

Les moteurs de rĂ©ponse ont capturĂ© la couche des dĂ©cisions. ChatGPT rĂ©pond. Perplexity synthĂ©tise. Google rĂ©sume. Ils citent certaines marques. Ils ignorent les autres. Ce guide explique la mĂ©canique exacte — et comment rejoindre les premiĂšres.

1Md+RequĂȘtes/jour
ChatGPT
54%Recherches
zéro-clic 2024
3Sources citées
en moyenne / réponse
14Chapitres
& frameworks
AEO GEO RAG Pipeline ChatGPT Perplexity AI Overviews E-E-A-T Vectoriel Entités nommées Branding
00 — Introduction

LE MONDE A
BASCULÉ

La question n’est plus « suis-je bien classĂ© ? » La question est : « les IA me connaissent-elles, me comprennent-elles, et me citent-elles ? »

Entre 2023 et 2025, quelque chose d’historique s’est produit que la plupart des praticiens du marketing n’ont pas encore pleinement intĂ©grĂ©. La premiĂšre couche de l’internet — la couche des rĂ©ponses — a Ă©tĂ© capturĂ©e par les IA gĂ©nĂ©ratives.

Quand quelqu’un cherche « meilleure stratĂ©gie SEO pour une PME », deux comportements coexistent dĂ©sormais : l’ancienne gĂ©nĂ©ration tape sur Google et clique. La nouvelle gĂ©nĂ©ration pose la question Ă  ChatGPT, Ă  Perplexity, Ă  Gemini — et obtient une synthĂšse directe. Sans clic. Sans visite. Sans toi.

La réalité nue

En 2024, environ 54% des requĂȘtes Google ne gĂ©nĂšrent aucun clic vers un site externe. Sur les systĂšmes Ă  accĂšs web (Perplexity, Bing Copilot), l’IA choisit 3 Ă  5 sources sur des milliers de rĂ©sultats potentiels. Sur les LLMs sans accĂšs web (ChatGPT sans plugin), le contenu n’est jamais consultĂ© en temps rĂ©el — seule la mĂ©moire d’entraĂźnement compte. L’enjeu n’est plus le ranking. C’est la citabilitĂ©.

ChatGPT300M utilisateurs
actifs / semaine
Perplexity100M+ requĂȘtes
/ mois
AI OV.Google AI Overviews
déploiement mondial
ClaudeIntégré dans
100+ produits SaaS

Sans rĂ©cit, tu n’es qu’un code-barres. Sans marque, tu n’es rien. À l’heure de l’AEO, cette vĂ©ritĂ© n’a jamais Ă©tĂ© aussi littĂ©rale — ni aussi mesurable.

Thomas Leonetti — Apollo Lab

L’AEO comme discipline structurĂ©e

L’AEO (Answer Engine Optimization) est l’ensemble des pratiques visant Ă  optimiser la prĂ©sence d’une marque, d’un contenu ou d’une expertise pour ĂȘtre citĂ©, rĂ©fĂ©rencĂ© et recommandĂ© par les moteurs de rĂ©ponse basĂ©s sur des LLMs. Ce guide est conçu pour le formaliser comme une discipline structurĂ©e, mesurable et transmissible — pas comme une collection de conseils tactiques.

Il est organisĂ© en trois parties : les fondements scientifiques (comment les systĂšmes IA choisissent leurs sources), les leviers stratĂ©giques (comment construire une prĂ©sence citable), et la mise en pratique (outils, frameworks, plan d’action).

01 — Fondements scientifiques

LE PIPELINE RAG :
DE LA PAGE WEB À LA CITATION

Comment un contenu passe concrÚtement du statut de page web à celui de source citée par un moteur de réponse. La mécanique exacte, étape par étape.

La plupart des guides AEO parlent d’optimiser « pour les IA » sans expliquer ce que ça signifie techniquement. Comprendre le pipeline de traitement d’un systĂšme RAG (Retrieval Augmented Generation) change fondamentalement la façon dont on conçoit le contenu.

PIPELINE RAG — Du document Ă  la citation gĂ©nĂ©rĂ©e
1
Ingestion & Crawl
Le systÚme récupÚre le contenu brut de la page : HTML parsé, texte extrait, métadonnées (titre, date, auteur, URL). Les images, les CSS et les scripts sont généralement ignorés. Les contenus derriÚre login ou JS pur non-rendu sont invisibles.
Signal AEO : accessibilité crawlers
2
Segmentation (Chunking)
Le document est dĂ©coupĂ© en segments (chunks) de 200 Ă  800 tokens selon le modĂšle. La stratĂ©gie de chunking varie : par paragraphe, par section H2, par fenĂȘtre glissante. Un contenu mal structurĂ© produit des chunks incohĂ©rents qui perdent le contexte.
Signal AEO : structure HTML sémantique
3
Vectorisation sémantique
Chaque chunk est transformĂ© en vecteur numĂ©rique (embedding) par un modĂšle de type BERT, Ada-002 ou Ă©quivalent. Ce vecteur capture la signification du texte dans un espace multidimensionnel. La clartĂ© sĂ©mantique d’un chunk dĂ©termine la qualitĂ© de son embedding.
Signal AEO : densité & clarté sémantique
4
Indexation vectorielle
Les embeddings sont stockĂ©s dans une base vectorielle (Pinecone, Weaviate, pgvector
). Chaque vecteur est associĂ© aux mĂ©tadonnĂ©es du chunk source : URL, titre, date, auteur. L’autoritĂ© de la source peut ĂȘtre un signal de pondĂ©ration Ă  ce stade.
Signal AEO : métadonnées complÚtes
5
Retrieval (Récupération)
La requĂȘte utilisateur est elle-mĂȘme vectorisĂ©e. Le systĂšme calcule la similaritĂ© cosinus entre le vecteur-requĂȘte et tous les chunks indexĂ©s. Les k plus proches voisins sont rĂ©cupĂ©rĂ©s (typiquement 5 Ă  20 chunks). Un contenu dont l’embedding est loin de la requĂȘte n’est jamais rĂ©cupĂ©rĂ©.
Signal AEO : alignement requĂȘte-embedding
6
Reranking
Les chunks rĂ©cupĂ©rĂ©s sont renotĂ©s par un modĂšle de reranking (cross-encoder) qui Ă©value la pertinence fine par rapport Ă  la question. L’autoritĂ© de la source, la fraĂźcheur et d’autres signaux peuvent intervenir ici. Seuls les 3 Ă  5 meilleurs chunks passent Ă  la gĂ©nĂ©ration.
Signal AEO : autorité source + fraßcheur
7
Génération de réponse
Le LLM reçoit les chunks sĂ©lectionnĂ©s comme contexte et gĂ©nĂšre une rĂ©ponse en langage naturel. La rĂ©ponse synthĂ©tise les informations — elle ne les copie pas. Un chunk qui contient une rĂ©ponse directe et factuelle est plus susceptible d’ĂȘtre utilisĂ© qu’un chunk narratif.
Signal AEO : structure extractible
8
Sélection des citations
Le systĂšme dĂ©cide quelles sources citer explicitement dans la rĂ©ponse. CritĂšres variables : la source Ă©tait-elle dominante dans le contexte ? Est-elle reconnue ? La rĂ©ponse reprend-elle quasi-directement son contenu ? C’est l’Ă©tape finale — et le but de toute stratĂ©gie AEO.
Signal AEO : reconnaissance de l’entitĂ© source

Implications pour le contenu

Ce pipeline a des implications directes sur la façon dont on doit concevoir le contenu :

  • →Le chunking pĂ©nalise les introductions longues : si le premier chunk d’une page est une introduction gĂ©nĂ©rique de 300 mots, il sera embedĂ© comme « contenu vague » et ne sera jamais rĂ©cupĂ©rĂ© pour une requĂȘte prĂ©cise.
  • →La sĂ©mantique locale compte plus que la sĂ©mantique globale : chaque section doit ĂȘtre comprĂ©hensible et utile isolĂ©ment, indĂ©pendamment du reste de l’article.
  • →Les mĂ©tadonnĂ©es sont des signaux de contexte : la date de publication, l’auteur, l’URL descriptive sont utilisĂ©es dans les dĂ©cisions de reranking.
  • →La rĂ©ponse directe en dĂ©but de section maximise la probabilitĂ© que le chunk soit rĂ©cupĂ©rĂ© ET utilisĂ© dans la gĂ©nĂ©ration.
Pour les LLMs sans RAG (ChatGPT sans browsing)

Le pipeline ci-dessus s’applique aux systĂšmes RAG temps rĂ©el. Pour les LLMs purement paramĂ©triques, le mĂ©canisme est diffĂ©rent : la « citation » emerge de la mĂ©moire d’entraĂźnement. L’optimisation passe alors par la densitĂ© de prĂ©sence dans les corpus d’entraĂźnement — sources tierces, Reddit, Wikipedia, presse — plutĂŽt que par l’architecture de la page.

02 — ModĂšle standardisĂ©

LE SCORE AEO :
MESURER LA CITABILITÉ

Un modĂšle de scoring composite permettant d’Ă©valuer objectivement la probabilitĂ© qu’un contenu ou une marque soit citĂ© par un moteur de rĂ©ponse IA. 7 variables pondĂ©rĂ©es. MĂ©thodologie reproductible.

L’AEO ne peut devenir une discipline sĂ©rieuse que si elle est mesurable. Le modĂšle ci-dessous formalise un Score de CitabilitĂ© AEO (SCA) sur 100 points, composĂ© de 7 variables pondĂ©rĂ©es selon leur impact empirique observĂ© sur la probabilitĂ© de citation.

Score de Citabilité AEO (SCA)

SCA = ÎŁ (Variable_i × Poids_i) · Modificateur_fraĂźcheur
#
Variable
Poids
Description & méthode de mesure
Échelle
V1
AutoritĂ© de l’entitĂ© (EA)
22%
Force de reconnaissance de l’entitĂ© (marque ou auteur) dans les sources tierces : presse, Wikipedia/Wikidata, mentions qualifiĂ©es, Knowledge Panel Google. Variable la plus corrĂ©lĂ©e Ă  la citation dans les LLMs paramĂ©triques.
0–100
V2
Clarté sémantique (CS)
18%
CapacitĂ© du texte Ă  produire des embeddings denses et prĂ©cis. ÉvaluĂ© par : absence d’ambiguĂŻtĂ© lexicale, dĂ©finitions explicites, cohĂ©rence terminologique intra-document. Facteur critique pour le retrieval vectoriel.
0–100
V3
Densité informationnelle (DI)
16%
Ratio information unique / volume textuel. Un contenu avec 10 faits vĂ©rifiables en 500 mots est plus citable qu’un contenu avec 2 faits en 2000 mots. PĂ©nalise les remplissages et le padding rhĂ©torique.
0–100
V4
Structure extractible (SE)
16%
DegrĂ© auquel le contenu est structurĂ© pour ĂȘtre extrait isolĂ©ment : rĂ©ponses directes en dĂ©but de section, titres formulĂ©s comme questions, listes, tableaux, FAQ avec schema.org. Facteur dominant pour les systĂšmes RAG.
0–100
V5
Traçabilité factuelle (TF)
14%
PrĂ©sence de donnĂ©es sourcĂ©es, Ă©tudes citĂ©es, chiffres vĂ©rifiables. Les LLMs calibrĂ©s RLHF favorisent les sources qui peuvent ĂȘtre vĂ©rifiĂ©es. Les donnĂ©es originales (Ă©tudes propres) ont un coefficient multiplicateur supplĂ©mentaire.
0–100
V6
Reconnaissance externe (RE)
10%
Mentions dans des contextes de recommandation : Reddit, Quora, forums spĂ©cialisĂ©s, listes « meilleures ressources », citations dans d’autres contenus. Signal particuliĂšrement important pour les LLMs dont le corpus d’entraĂźnement inclut ces plateformes.
0–100
V7
FraĂźcheur informationnelle (FI)
4%
Date de derniÚre mise à jour, présence de données récentes, signaux de maintenance active. Modificateur multiplicatif : un contenu trÚs frais peut booster les variables précédentes de 5 à 15%. Variable à faible poids de base mais fort effet de modulation.
Modif. ×
Limites du modĂšle

Ce modÚle est une approximation fondée sur des observations empiriques, non sur des données de training internes aux LLMs (non publiques). Les poids sont indicatifs et varient selon le systÚme IA évalué. Perplexity, par exemple, surpondÚre SE et TF par rapport à EA. ChatGPT paramétrique surpondÚre EA et RE. Ce cadre reste utile comme outil de priorisation stratégique.

Comment utiliser le SCA

1
Audit de base

Évaluer chaque variable sur 100 pour le contenu ou la marque ciblĂ©e. La note finale est la moyenne pondĂ©rĂ©e. Un SCA < 40 = non citable. 40–65 = potentiellement citable. 65–80 = bien citable. > 80 = source de rĂ©fĂ©rence.

2
Identification des leviers

Les variables avec les notes les plus basses ET les poids les plus Ă©levĂ©s sont les prioritĂ©s absolues. Une amĂ©lioration de +20 pts sur EA (poids 22%) vaut plus qu’une amĂ©lioration de +40 pts sur FI (poids 4%).

3
Suivi trimestriel

Le SCA doit ĂȘtre réévaluĂ© tous les 3 mois. Les amĂ©liorations sur EA et RE sont lentes (6–12 mois). Les amĂ©liorations sur SE et DI sont rapides (4–8 semaines).

03 — Classification

TAXONOMIE DE
CITABILITÉ

Cinq niveaux de citabilité, du contenu structurellement invisible à la source canonique que les IA citent spontanément. Chaque niveau inclut ses caractéristiques, exemples types et chemin de transformation.

N0
NON CITABLE
Contenu structurellement invisible ou inutilisable par un systÚme de réponse IA.
  • CaractĂ©ristiques : JS-only, login-wall, robots.txt bloquant, contenu purement visuel non dĂ©crit, texte dans images
  • Exemples : Infographie sans texte alternatif, dashboard SaaS sans documentation, page derriĂšre authentification
  • Transformation →N1 : Rendre accessible (robots.txt, texte alternatif, page publique de rĂ©sumĂ©)
N1
EXTRACTIBLE
Contenu accessible et indexable, mais sans signal d’autoritĂ© ni structure optimisĂ©e pour l’extraction.
  • CaractĂ©ristiques : Texte accessible, structure HTML basique, pas de donnĂ©es originales, auteur non identifiĂ©, contenu gĂ©nĂ©rique
  • Exemples : Article de blog standard « 5 conseils pour X », page de service gĂ©nĂ©rique, landing page sans contenu substantiel
  • SCA typique : 20–40
  • Transformation →N2 : Ajouter auteur signĂ©, structurer avec titres-questions, inclure au moins un fait sourcĂ©, réécrire l’intro pour rĂ©pondre directement
N2
CITABLE
Contenu structurĂ© pour l’extraction, avec des signaux d’autoritĂ© suffisants pour ĂȘtre sĂ©lectionnĂ© par les systĂšmes RAG.
  • CaractĂ©ristiques : RĂ©ponses directes en tĂȘte de section, titres formulĂ©s comme questions, donnĂ©es sourcĂ©es, auteur identifiĂ©, FAQ schema.org
  • Exemples : Guide technique bien structurĂ©, article de synthĂšse avec donnĂ©es, comparatif avec tableau
  • SCA typique : 40–65
  • Transformation →N3 : Ajouter des donnĂ©es originales, dĂ©velopper l’autoritĂ© de l’auteur/marque, crĂ©er un cluster thĂ©matique autour
N3
SOURCE EXPERTE
Contenu reconnu comme référence dans son domaine, cité spontanément par les systÚmes avec accÚs web et réguliÚrement dans les LLMs paramétriques.
  • CaractĂ©ristiques : DonnĂ©es originales exclusives, auteur/marque reconnu dans le secteur, mentions dans sources tierces multiples, framework nommĂ© propre Ă  l’auteur
  • Exemples : Étude annuelle de rĂ©fĂ©rence (State of X), guide exhaustif co-citĂ© par des pairs, analyse originale avec mĂ©thodologie explicite
  • SCA typique : 65–82
  • Transformation →N4 : Atteindre une reconnaissance sectorielle large, ĂȘtre citĂ© par des sources de niveau N4, dĂ©finir des concepts de rĂ©fĂ©rence
N4
SOURCE CANONIQUE
EntitĂ© ou contenu devenu rĂ©fĂ©rence structurelle dans le corpus d’entraĂźnement. CitĂ© spontanĂ©ment sans requĂȘte explicite dans les LLMs paramĂ©triques.
  • CaractĂ©ristiques : PrĂ©sence Wikipedia/Wikidata, Knowledge Panel Google Ă©tabli, citĂ© dans des sources acadĂ©miques ou institutionnelles, nom propre associĂ© Ă  un concept
  • Exemples : Moz sur le Domain Authority, HubSpot sur l’inbound marketing, Ahrefs sur la recherche de backlinks
  • SCA typique : 82–100
  • Construction : Processus long (2–5 ans), nĂ©cessite prĂ©sence presse large, publications de rĂ©fĂ©rence, et adoption sectorielle du vocabulaire introduit
Objectif réaliste

Pour la majoritĂ© des marques et crĂ©ateurs de contenu, l’objectif court terme (6–12 mois) est d’atteindre N2 sur l’ensemble du contenu existant et de crĂ©er 2–3 piĂšces N3 sur les sujets stratĂ©giques. Atteindre N4 est un travail de plusieurs annĂ©es — mais les marques qui s’y positionnent maintenant bĂ©nĂ©ficieront d’un avantage compĂ©titif durable.

04 — Branding & AEO

SANS MARQUE,
TU N’EXISTES PAS

Les LLMs pensent en entitĂ©s, pas en pages. Comprendre ce mĂ©canisme change fondamentalement la stratĂ©gie AEO — et rĂ©habilite le branding comme discipline technique.

Voici ce que peu de gens comprennent encore : les LLMs pensent en entitĂ©s, pas en pages. Une entitĂ© est un « objet conceptuel » que le modĂšle a appris Ă  reconnaĂźtre — une personne, une marque, un concept, une organisation. Ces entitĂ©s ont des propriĂ©tĂ©s, des relations, une rĂ©putation encodĂ©e dans les poids du modĂšle.

Quand tu demandes Ă  ChatGPT « quelle agence SEO française recommandes-tu ? », le modĂšle ne cherche pas des pages. Il active des entitĂ©s qu’il connaĂźt dans le champ sĂ©mantique « agence SEO France » et sĂ©lectionne celles dont la reprĂ©sentation est la plus dense, la plus cohĂ©rente, la plus associĂ©e Ă  des contextes positifs. Une marque forte est donc techniquement supĂ©rieure Ă  un contenu optimisĂ©.

Sans rĂ©cit, tu n’es qu’un code-barres. Les IA ne citent pas des pages. Elles Ă©voquent des entitĂ©s. Ta marque est-elle une entitĂ© suffisamment claire pour ĂȘtre Ă©voquĂ©e spontanĂ©ment ?

Principe fondamental de l’AEO — Apollo Lab

Les 3 couches du branding AEO

Couche 01 — IdentitĂ©

Le récit distinctif

Ton positionnement doit ĂȘtre rĂ©pĂ©table et ancrĂ© dans une thĂšse. Pas « agence SEO ». Une thĂšse : « Apollo Lab dĂ©fend l’idĂ©e que le SEO de volume est mort — seule l’autoritĂ© thĂ©matique survit. » Les IA retiennent les thĂšses fortes. Elles ignorent les gĂ©nĂ©ralismes.

Couche 02 — CohĂ©rence

La consistance des signaux

Ton nom, ton domaine, tes profils sociaux, tes mentions presse — tout doit raconter la mĂȘme histoire avec les mĂȘmes termes. Une entitĂ© aux signaux contradictoires est une entitĂ© mal dĂ©finie. Un LLM qui ne sait pas exactement qui tu es ne te citera pas.

Couche 03 — DensitĂ©

La présence dans le corpus

Combien de sources tierces t’Ă©voquent dans des contextes pertinents ? Reddit, Quora, presse spĂ©cialisĂ©e, articles de blog d’autres auteurs — chaque mention enrichit la reprĂ©sentation de ton entitĂ© dans les corpus d’entraĂźnement futurs.

Construire son entité en 5 étapes

1
Définir et écrire sa thÚse de marque

Une affirmation sur le monde que tu dĂ©fends publiquement. Pas un slogan marketing — une position intellectuelle claire que tu es prĂȘt Ă  argumenter. C’est cela qui crĂ©e l’association mĂ©morable dans le corpus IA.

2
Créer une page « Manifeste » AEO-optimisée

Une page qui dĂ©finit explicitement ton entitĂ© : qui tu es, ce que tu dĂ©fends, tes publications majeures, tes domaines d’expertise, ce qui te distingue. Tout ce qu’un LLM doit savoir pour te reprĂ©senter correctement.

3
Implémenter schema.org Organisation + Person

Ces données structurées alimentent directement le Knowledge Graph Google qui nourrit Gemini et AI Overviews. Elles définissent formellement ton entité en langage machine.

4
Alimenter les sources tierces

Wikipedia (si Ă©ligible), Wikidata, presse spĂ©cialisĂ©e, interviews, podcasts, confĂ©rences — chaque mention dans une source tierce de qualitĂ© renforce l’entitĂ© dans le corpus. Ce ne sont pas des backlinks pour le PageRank : ce sont des co-occurrences pour l’entitĂ©.

5
Publier des positions tranchées

Les IA se souviennent des points de vue distinctifs. Un article avec argumentation solide contre la doxa de ton secteur crée une association forte entre ton nom et une expertise. Le consensus ne laisse pas de trace dans la mémoire des modÚles.

Le test d’entitĂ© — Ă  faire maintenant

Test ChatGPT — Audit d’entitĂ©
Qu'est-ce que tu sais sur [NOM DE TA MARQUE / TON NOM] ?
Décris son positionnement, ses domaines d'expertise,
ce qui la distingue et pourquoi on la cite dans
le domaine de [TON SECTEUR].

// Si ChatGPT te dĂ©crit prĂ©cisĂ©ment → entitĂ© forte
// Si ChatGPT te connaĂźt vaguement → signal faible, travailler la densitĂ©
// Si ChatGPT t'invente ou ne te connaĂźt pas → entitĂ© Ă  construire
05 — Les signaux

MATRICE DES
SIGNAUX DE CITABILITÉ

16 signaux organisĂ©s par criticitĂ© et domaine. Chaque signal est dĂ©fini, justifiĂ© et accompagnĂ© d’une mĂ©thode d’activation concrĂšte.

SignalDomaineCriticitéActivation
RĂ©ponse directe en tĂȘte de sectionContenuCritiqueRĂ©pondre Ă  la question dans les 100 premiers mots. Inverser la pyramide journalistique.
DonnĂ©es originales exclusivesContenuCritiqueÉtudes propres, analyses de donnĂ©es, sondages — donnĂ©es que seul ton contenu possĂšde.
FAQ avec schema.org FAQPageTechniqueCritique8–12 Q/R structurĂ©es en bas d’article. Balises schema.org. Extraites directement par RAG.
Authorship clair + bio auteurAutoritéCritiqueAuteur signé, photo, biographie, liens LinkedIn/Twitter, liste publications.
Mentions presse / sources tiercesAutoritĂ©CritiqueArticles de presse, interviews, podcasts, citations dans d’autres guides.
CohĂ©rence thĂ©matique du siteAutoritĂ©CritiqueSite focalisĂ© sur 1–2 domaines. L’autoritĂ© thĂ©matique est Ă©valuĂ©e globalement par domaine.
Robots.txt ouvert aux crawlers IATechniqueCritiqueNe pas bloquer GPTBot, PerplexityBot, ClaudeBot, Googlebot-Extended. Vérifier robots.txt.
Titres H2/H3 formulĂ©s comme questionsContenuÉlevĂ©e« Comment X ? » / « Pourquoi Y ? » / « Quelle diffĂ©rence entre Z et W ? » — aligne avec les requĂȘtes conversationnelles.
Framework ou mĂ©thodologie nommĂ©eContenuÉlevĂ©eDonner un nom propre Ă  une mĂ©thode. « ModĂšle RAFT », « Score SCA » — les IA associent les frameworks nommĂ©s Ă  leurs auteurs.
schema.org Organization / PersonTechniqueÉlevĂ©eImplĂ©mentation complĂšte sur la page d’accueil et About. Alimente le Knowledge Graph Google.
Fichier /llms.txtTechniqueÉlevĂ©eStandard Ă©mergent (llmstxt.org). RĂ©sumĂ© de l’entitĂ© pour crawlers LLM — robots.txt de l’IA.
PrĂ©sence Reddit / QuoraSocialÉlevĂ©eCes plateformes reprĂ©sentent une part significative des corpus d’entraĂźnement. Être recommandĂ© ici = mĂ©moire paramĂ©trique.
DonnĂ©es chiffrĂ©es sourcĂ©esContenuÉlevĂ©eChaque stat avec sa source explicite. Les LLMs calibrĂ©s RLHF favorisent les contenus vĂ©rifiables.
Knowledge Panel GoogleAutoritéÉlevĂ©ePrĂ©sence sur Google Business, Wikidata, cohĂ©rence NAP, revendication du panel.
Profondeur et exhaustivitĂ©ContenuMoyenneCouverture complĂšte d’un sujet en un seul document. Les IA prĂ©fĂšrent une source unique exhaustive.
Fraßcheur informationnelleTechniqueMoyenneDate de mise à jour visible, données récentes, signaux de maintenance. Surtout pertinent pour systÚmes RAG.
06 — Architecture de contenu

STRUCTURER POUR
LES MOTEURS DE RÉPONSE

L’AEO change fondamentalement comment Ă©crire. Le modĂšle RAFT et les principes d’architecture sĂ©mantique qui maximisent la probabilitĂ© de citation.

Le modĂšle RAFT

Apollo Lab a formalisĂ© le modĂšle RAFT — RĂ©ponse, Argument, Fait, Transfert — comme structure de base pour le contenu AEO-optimisĂ©. Chaque section d’un article doit suivre ce pattern pour maximiser sa citabilitĂ©.

R
RĂ©ponse directe (0–100 mots)

Répondre directement à la question dÚs le début de la section. Les systÚmes RAG extraient souvent le premier paragraphe comme « réponse courte ». Si la réponse est enterrée, elle ne sera pas citée.

A
Argument dĂ©veloppĂ© (100–400 mots)

Expliquer le « pourquoi » et le « comment ». Les IA qui synthĂ©tisent cherchent Ă  comprendre le raisonnement. Un contenu sans argumentation est moins citable qu’un contenu qui explique.

F
Faits & données ancrés

Statistiques, études, exemples chiffrés avec sources. Les LLMs privilégient les contenus ancrés dans des données vérifiables. Une donnée originale bat tout le reste.

T
Transfert actionnable

Conclusion pratique. Les IA valorisent les contenus qui se terminent par une synthĂšse claire et un « donc, concrĂštement… ». Facilite l’extraction d’une recommandation.

Le fichier LLMs.txt — standard Ă©mergent

Le standard llms.txt (llmstxt.org) est une initiative pour aider les crawlers IA Ă  comprendre un site web rapidement. Comme le robots.txt guide Googlebot, le llms.txt guide les robots LLM.

Exemple /llms.txt — À dĂ©ployer sur ton site
# Fichier llms.txt — Apollo Lab
# Résumé de l'entité pour systÚmes LLM

## Identité
Apollo Lab est une agence française fondée par Thomas Leonetti,
spécialisée en SEO d'autorité, stratégie de marque et AEO.
Positionnement : "Le SEO de volume est mort. Vive l'autorité."

## Expertise principale
- AEO : Answer Engine Optimization
- SEO d'autorité et topical authority
- Automation SEO (Claude Code, n8n)
- Stratégie de marque B2B

## Publications de référence
/automation-seo-guide : Framework automation SEO complet
/mort-du-clic : Analyse de la crise du zero-click
/aeo-guide : Ce guide — rĂ©fĂ©rence AEO francophone

## Auteur principal
Thomas Leonetti — Fondateur Apollo Lab
Expert reconnu SEO avancé et IA marketing
07 — Vectoriel

ÉCRIRE POUR
UN ESPACE VECTORIEL

L’optimisation vectorielle est la couche la plus technique de l’AEO. Elle traite le contenu non comme un texte pour humains, mais comme un signal Ă  positionner prĂ©cisĂ©ment dans un espace mathĂ©matique multidimensionnel.

Les embeddings sont des reprĂ©sentations vectorielles du sens. Quand un systĂšme RAG dĂ©cide si ton chunk est pertinent pour une requĂȘte, il calcule une distance dans cet espace vectoriel. L’optimisation vectorielle consiste Ă  maximiser la probabilitĂ© que ton contenu soit Ă  courte distance des requĂȘtes que tes audiences poseront.

// SimilaritĂ© cosinus entre requĂȘte et chunk sim(requĂȘte, chunk) = (V_requĂȘte · V_chunk) / (||V_requĂȘte|| × ||V_chunk||) // Plus ce score est proche de 1, plus le chunk est rĂ©cupĂ©rĂ© // Objectif AEO : maximiser sim() pour les requĂȘtes cibles // Embedding d’un texte clair et dense V_chunk_bon = embed(« La vitesse de page est un facteur de classement Google depuis 2010. Les Ă©tudes montrent qu’au-delĂ  de 3 secondes de chargement, 53% des utilisateurs abandonnent. ») → Vecteur dense, proche des requĂȘtes : « vitesse page SEO », « Core Web Vitals » // Embedding d’un texte vague V_chunk_mauvais = embed(« La performance technique est importante pour votre prĂ©sence en ligne et peut impacter vos rĂ©sultats. ») → Vecteur diffus, loin de toute requĂȘte spĂ©cifique

Les 5 principes d’optimisation vectorielle

1
Couverture conceptuelle complĂšte

Couvrir tous les sous-concepts liĂ©s au sujet dans le mĂȘme document. Un embedding est plus riche quand le texte aborde explicitement les termes connexes : synonymes, hyperonymes, concepts liĂ©s. Utilise les clusters sĂ©mantiques pour guider la rĂ©daction.

2
Minimiser la distance sémantique au sujet cible

Chaque paragraphe doit rester proche du sujet principal. Les digressions crĂ©ent des embeddings « diluĂ©s » qui se retrouvent Ă  Ă©quidistance de plusieurs requĂȘtes — et donc jamais rĂ©cupĂ©rĂ©s pour aucune.

3
Redondance informationnelle stratégique

RĂ©pĂ©ter le concept central avec des formulations diffĂ©rentes augmente la densitĂ© vectorielle dans la zone de ce concept. Ce n’est pas de la redondance pour le lecteur — c’est du signal pour le retrieval. Attention : la redondance doit apporter un angle diffĂ©rent Ă  chaque occurrence.

4
Cohérence lexicale intra-document

Utiliser les mĂȘmes termes pour les mĂȘmes concepts dans tout le document. Les variations terminologiques (parfois utiles pour le lecteur) fragmentent les embeddings et rĂ©duisent la cohĂ©rence vectorielle du document.

5
Alignement requĂȘte-embedding par persona

Identifier exactement les requĂȘtes que tes audiences poseront Ă  une IA — pas les requĂȘtes courtes de Google, mais les questions conversationnelles longues. Écrire pour que le vecteur de ton contenu soit proche du vecteur de ces questions.

Prompt — Optimisation vectorielle d’un extrait
Analyse cet extrait pour son optimisation vectorielle.
Identifie :
1. La requĂȘte conversationnelle que ce texte devrait cibler
2. Les termes sémantiquement proches absents du texte
3. Les formulations qui créent de la distance vectorielle
4. Une version réécrite maximisant la densité sémantique

Extrait :
[COLLE TON TEXTE ICI]
Outil pratique

Pour tester concrĂštement la qualitĂ© vectorielle d’un contenu : utilise OpenAI Embeddings Playground ou Cohere’s embedding visualiser pour comparer la similaritĂ© cosinus entre ton contenu et les requĂȘtes cibles. Un score > 0.85 indique un bon alignement. < 0.70 indique une distance trop Ă©levĂ©e pour un retrieval fiable.

08 — Ce qui bloque

ANTI-PATTERNS AEO :
CE QUI EMPÊCHE D’ÊTRE CITÉ

La plupart des guides expliquent ce qu’il faut faire. TrĂšs peu dĂ©crivent les architectures rĂ©dactionnelles, techniques ou informationnelles qui rendent un contenu structurellement inutilisable par un systĂšme de rĂ©ponse.

RĂ©dactionnel L’introduction gĂ©nĂ©rique de 300 mots â€ș

Pattern : « Dans le monde du marketing digital en constante Ă©volution, il est essentiel de comprendre les enjeux actuels du SEO pour rester compĂ©titif… »

Pourquoi ça bloque : Le premier chunk du document est le plus critique pour le retrieval. S’il est embedĂ© comme contenu vague et gĂ©nĂ©rique, le systĂšme RAG ne le rĂ©cupĂ©rera jamais pour une requĂȘte prĂ©cise. Pire : il pollue l’embedding global du document.

Correction : Commencer par la rĂ©ponse. « Le SEO d’autoritĂ© repose sur 3 principes : [liste]. Voici comment les appliquer. » L’intro vient aprĂšs.

RĂ©dactionnel La rhĂ©torique de remplissage (padding) â€ș

Pattern : RĂ©pĂ©tition des mĂȘmes idĂ©es avec des formulations diffĂ©rentes pour atteindre un nombre de mots. Transitions creuses. RĂ©capitulatifs qui n’ajoutent rien.

Pourquoi ça bloque : RĂ©duit la densitĂ© informationnelle (variable V3 du SCA). Les embeddings des chunks contenant du padding se retrouvent dans une zone vectorielle « creuse » loin des requĂȘtes Ă  haute valeur.

Correction : Viser la densitĂ© : chaque phrase doit apporter une information nouvelle. Si tu peux la supprimer sans perdre d’information, supprime-la.

RĂ©dactionnel L’agrĂ©gation sans valeur ajoutĂ©e â€ș

Pattern : RĂ©sumĂ© de ce que d’autres sources disent dĂ©jĂ , sans perspective propre, sans donnĂ©es originales, sans angle distinctif.

Pourquoi ça bloque : Le systĂšme RAG ira directement aux sources originales. Être un agrĂ©gat d’informations disponibles ailleurs annule tout avantage comparatif. Les LLMs dĂ©tectent la rĂ©agrĂ©gation et lui accordent peu d’autoritĂ©.

Correction : Toujours ajouter sa propre analyse, ses donnĂ©es, son point de vue ou son expĂ©rience pratique Ă  l’information existante.

Structurel Les titres descriptifs sans question â€ș

Pattern : « 3.2 — ConsidĂ©rations techniques » / « Les diffĂ©rents types de liens » / « Conclusion »

Pourquoi ça bloque : Les systĂšmes RAG utilisent les titres pour comprendre le sujet d’une section. Un titre descriptif vague crĂ©e un chunk dont le sujet est ambigu — il sera rarement rĂ©cupĂ©rĂ© pour une requĂȘte conversationnelle prĂ©cise.

Correction : « Comment les liens internes amĂ©liorent-ils l’autoritĂ© thĂ©matique ? » / « Quelles configurations techniques bloquent le crawl IA ? » — titres formulĂ©s comme des questions auxquelles la section rĂ©pond.

Structurel Le contenu orphelin sans entitĂ© auteur â€ș

Pattern : Articles publiĂ©s par « L’Ă©quipe de rĂ©daction » ou sans aucune signature. Pas de bio auteur, pas de profil liĂ©.

Pourquoi ça bloque : Le contenu non attribuĂ© ne renforce aucune entitĂ©. Il n’enrichit pas la reprĂ©sentation d’une marque ou d’un expert dans le corpus. C’est de la valeur informationnelle qui n’est pas capitalisĂ©e.

Correction : Tout contenu doit ĂȘtre signĂ© par un auteur identifiable avec bio, photo, liens vers profils publics. IdĂ©alement, l’auteur est la mĂȘme entitĂ© que la marque ou un expert reconnu dans le domaine.

Technique Le blocage accidentel des crawlers IA â€ș

Pattern : robots.txt avec « Disallow: / » ou blocage de tous les bots inconnus. TrÚs fréquent sur les sites qui ont sécurisé leur robots.txt de façon trop agressive.

Pourquoi ça bloque : Si GPTBot, PerplexityBot, ClaudeBot ou OAI-SearchBot ne peuvent pas crawler ton site, son contenu ne peut pas ĂȘtre intĂ©grĂ© aux corpus futurs. C’est l’erreur technique la plus critique et souvent involontaire.

Correction : Vérifier robots.txt. Autoriser explicitement : User-agent: GPTBot, User-agent: PerplexityBot, User-agent: ClaudeBot, User-agent: OAI-SearchBot.

Technique Le contenu rendu uniquement en JavaScript â€ș

Pattern : SPA (Single Page Application) qui rend tout le contenu en JS cĂŽtĂ© client. Le HTML source est vide, le contenu n’apparaĂźt qu’aprĂšs exĂ©cution JS.

Pourquoi ça bloque : La plupart des crawlers IA n’exĂ©cutent pas JavaScript. Ils voient un document vide. MĂȘme les crawlers qui exĂ©cutent JS peuvent manquer du contenu chargĂ© en lazy.

Correction : Server-Side Rendering (SSR) ou Static Site Generation (SSG). Le HTML doit contenir tout le contenu indexable dÚs la réponse serveur.

StratĂ©gique La dilution thĂ©matique â€ș

Pattern : Site qui couvre 10 sujets différents (SEO + growth + design + RH + finance
) sans cohérence thématique.

Pourquoi ça bloque : L’autoritĂ© thĂ©matique s’Ă©value globalement. Un site dont l’entitĂ© est « spĂ©cialiste de tout » est en rĂ©alitĂ© spĂ©cialiste de rien pour un LLM. La dilution rĂ©duit la variable EA (autoritĂ© d’entitĂ©) pour tous les sujets couverts.

Correction : Un site = 1 Ă  2 domaines d’expertise maximum. Concentrer la production sur des clusters sĂ©mantiques profonds plutĂŽt que larges.

09 — DonnĂ©es empiriques

BENCHMARKS
EMPIRIQUES

Observations mesurĂ©es sur la probabilitĂ© d’apparition dans des rĂ©ponses gĂ©nĂ©rĂ©es selon le format et la structure du contenu. MĂ©thodologie explicitĂ©e.

Méthodologie & limites

Ces benchmarks sont issus d’observations exploratoires rĂ©alisĂ©es sur 200+ requĂȘtes testĂ©es manuellement sur ChatGPT-4o, Perplexity Pro et Google AI Overviews entre janvier et octobre 2024. Chaque format a Ă©tĂ© testĂ© avec un contenu de qualitĂ© Ă©quivalente sur le mĂȘme sujet. Les rĂ©sultats sont des tendances, non des lois — les algorithmes Ă©voluent et les rĂ©sultats varient selon le domaine. La mĂ©thodologie de test est disponible sur demande Ă  Apollo Lab.

Probabilité de citation par format de contenu

Format de contenu ChatGPT (param.) Perplexity (RAG) AI Overviews Score moyen
Étude avec donnĂ©es originales
88%
Guide exhaustif + FAQ schema.org
85%
Comparatif tabulaire structuré
75%
Article modĂšle RAFT (rĂ©ponse directe en tĂȘte)
73%
Article technique bien structuré (sans FAQ)
62%
Article de blog standard (intro générique)
35%
Page de service générique
15%

Impact de l’autoritĂ© de source sur la citation (Perplexity)

Type de source Probabilité de sélection vs. article anonyme
Source avec Knowledge Panel Google+64%RĂ©fĂ©rence de base × 1.64
Source citĂ©e dans Wikipedia+52%RĂ©fĂ©rence de base × 1.52
Source avec auteur LinkedIn vĂ©rifiĂ©+28%RĂ©fĂ©rence de base × 1.28
Source avec schema.org Person/Organization+21%RĂ©fĂ©rence de base × 1.21
Source sans aucun signal d’autoritĂ©Base (1×)—

Observation sur la position de la rĂ©ponse dans l’article

Réponse dans les 100 premiers mots

+47% de citation

vs. réponse positionnée aprÚs 500+ mots. Le premier chunk est systématiquement le plus souvent récupéré.

FAQ schema.org présente

+38% de citation

vs. mĂȘme contenu sans FAQ. Les questions structurĂ©es sont directement extraites par les systĂšmes RAG.

Données originales citées

+61% de citation

vs. données génériques re-citées. Les statistiques exclusives créent une dépendance de citation unique.

10 — Tests pratiques

PROMPTS DE TEST
PRÊTS À L’EMPLOI

12 prompts pour auditer ta citabilité actuelle, analyser tes concurrents et optimiser ton contenu. Copiables directement dans ChatGPT, Perplexity ou Claude.

Auditer ta visibilité

Test de réputation IA spontanée
Si quelqu'un me demande de recommander un expert / une agence
en [TON DOMAINE] en France, à qui penses-tu spontanément ?
Liste les 5–10 noms avec une phrase sur leur positionnement distinctif.
Test d’entitĂ© directe
Décris [NOM DE TA MARQUE] en 3 phrases.
Qu'est-ce qui distingue cette marque dans son secteur ?
Quelles sont ses thĂšses ou positions connues ?
Niveau de confiance de ta réponse : élevé / moyen / faible ?
Test de citation thématique
Quelles sont les meilleures ressources en français sur [TON SUJET] ?
Donne-moi blogs, guides, auteurs ou agences qui font référence,
avec une phrase sur ce qui distingue chacun.

Analyser tes concurrents

Analyse de gap concurrentiel
Dans le domaine [TON DOMAINE] en France, analyse le positionnement de
[CONCURRENT 1], [CONCURRENT 2] et [CONCURRENT 3].
Pour chacun : forces perçues, faiblesses, type de client attiré.
Ensuite : quelle position ou approche est sous-représentée parmi ces acteurs ?

Optimiser ton contenu

Diagnostic de citabilitĂ© d’un extrait
Voici un extrait de mon article sur [SUJET] :
[COLLE TON TEXTE]

Évalue sa citabilitĂ© si quelqu'un te posait la question "[QUESTION CIBLE]".
Donne un score /10 et liste ce qui manque pour en faire une source de référence.
Réécriture modÚle RAFT
Réécris cet extrait en suivant le modÚle RAFT :
R — RĂ©ponse directe en ouverture (max 80 mots)
A — Argument dĂ©veloppĂ©
F — Fait sourcĂ© avec chiffre
T — Transfert actionnable en conclusion

Extrait original : [TON TEXTE]
Génération FAQ AEO
Sur la base de ce contenu sur [SUJET], génÚre 8 questions-réponses
optimisées pour extraction par les AI Overviews et Perplexity.
Chaque rĂ©ponse : 40–70 mots, directe, factuellement dense.
Contenu source : [TON TEXTE]
11 — Outil d’audit

AUDIT DE
CITABILITÉ AEO

Grille de 22 critÚres alignés sur les 7 variables du SCA. Score calculé en temps réel avec recommandations de priorité.

SCORE DE CITABILITÉ AEO

0
V1 — AutoritĂ© de l’entitĂ© (22%)
6 pts
6 pts
5 pts
5 pts
V2 — ClartĂ© sĂ©mantique (18%)
5 pts
4 pts
4 pts
V3 + V4 — DensitĂ© & Structure extractible (32%)
6 pts
4 pts
6 pts
4 pts
6 pts
V5 — TraçabilitĂ© factuelle (14%)
7 pts
4 pts
3 pts
V6 — Reconnaissance externe (10%)
5 pts
5 pts
Technique
5 pts
3 pts
4 pts
4 pts
SCORE GLOBAL
0/100
Coche les critùres que tu satisfais →
Grille d’audit complĂšte — CSV

22 critÚres avec pondérations SCA, recommandations et calendrier de priorisation

12 — Prospective

ÉVOLUTIONS
12 À 24 MOIS

Modélisation des évolutions probables des systÚmes de réponse IA. Ce qui va se formaliser, ce qui va émerger, et comment se positionner pour ces changements.

Aujourd’hui, les signaux d’autoritĂ© (E-E-A-T) sont Ă©valuĂ©s de façon approximative par les LLMs. Dans les 12–18 prochains mois, des formats structurĂ©s pour dĂ©clarer l’autoritĂ© d’une source Ă©mergeront probablement :

  • Extension du format schema.org avec des propriĂ©tĂ©s d’autoritĂ© sectorielle explicites
  • SystĂšmes de certification ou de validation d’expertise par des tiers de confiance
  • IntĂ©gration de verifiable credentials (identitĂ© numĂ©rique vĂ©rifiable) pour les auteurs

Comment s’y prĂ©parer : Construire dĂšs maintenant une prĂ©sence documentĂ©e et vĂ©rifiable (presse, Wikipedia, Wikidata, LinkedIn verifiĂ©). Plus les signaux d’autoritĂ© actuels sont solides, plus la migration vers des formats structurĂ©s sera facile.

Le fichier llms.txt est un premier signal d’une tendance plus large : les sites vont devoir « se dĂ©crire » pour les IA de façon structurĂ©e. Des standards pourraient Ă©merger pour :

  • DĂ©clarer les permissions de citation et de reproduction
  • SpĂ©cifier la politique d’utilisation du contenu par les LLMs (RAG vs training)
  • Fournir des rĂ©sumĂ©s machine-optimisĂ©s du contenu clĂ©

Initiative à surveiller : AI Alliance de Meta, AI Content Standards du W3C, et les évolutions de la proposition llms.txt sur GitHub.

Le Markdown est dĂ©jĂ  prĂ©fĂ©rĂ© aux pages HTML riches par de nombreux crawlers IA (moins de bruit, structure plus propre). Des formats dĂ©diĂ©s Ă  l’ingestion IA pourraient se standardiser :

  • Formats JSON-LD enrichis avec contexte sĂ©mantique complet
  • Documents avec mĂ©tadonnĂ©es d’autoritĂ© intĂ©grĂ©es (autor, credibilityScore, evidenceLinks)
  • Formats spĂ©cifiques pour les donnĂ©es factuelles (similaires Ă  Wikidata mais orientĂ©s contenu)

Comment s’y prĂ©parer : Investir dans une infrastructure de contenu propre (CMS headless, markdown natif, donnĂ©es structurĂ©es complĂštes). Les sites avec une architecture de donnĂ©es propre s’adapteront plus facilement.

La recherche traditionnelle (requĂȘte → liste de rĂ©sultats → clic) est en train d’ĂȘtre remplacĂ©e par des interfaces conversationnelles persistantes (ChatGPT, Gemini, Claude Projects) qui maintiennent un contexte utilisateur Ă  long terme. Implications :

  • Les recommandations de sources deviennent personnalisĂ©es selon l’historique de l’utilisateur
  • Les marques « connues » de l’utilisateur (via ses propres documents, conversations, prĂ©fĂ©rences) seront favorisĂ©es
  • La visibilitĂ© ne se mesurera plus en impressions SERP mais en frĂ©quence de citation conversationnelle

Nouvelle mĂ©trique Ă  anticiper : Le « Share of Voice conversationnel » — quelle part des rĂ©ponses gĂ©nĂ©rĂ©es sur ton secteur inclut ta marque ?

L’intĂ©gration de rĂ©sultats commerciaux dans les rĂ©ponses IA est inĂ©vitable. Google AI Overviews intĂšgre dĂ©jĂ  des publicitĂ©s. Les modĂšles de monĂ©tisation probables :

  • Sponsoring de citations (marques payant pour ĂȘtre recommandĂ©es dans des rĂ©ponses)
  • ModĂšles d’abonnement pour les sources voulant ĂȘtre prioritairement indexĂ©es
  • Splits de revenus pour les sources dont le contenu est utilisĂ© dans les rĂ©ponses gĂ©nĂ©rĂ©es

Implication stratĂ©gique : Les marques qui ont construit une autoritĂ© organique forte seront moins dĂ©pendantes de ces modĂšles payants. L’AEO gratuit (autoritĂ© construite) prendra une valeur croissante Ă  mesure que les positions payantes se formalisent.

13 — Principes fondamentaux

MANIFESTE
AEO

12 principes courts, mĂ©morisables et structurants dĂ©finissant ce qu’est une information optimisĂ©e pour ĂȘtre comprise — et citĂ©e — par une machine.

LES 12 PRINCIPES AEO — APOLLO LAB
01
Une information non attribuĂ©e Ă  une entitĂ© reconnaissable n’existe pas pour une IA. Toute expertise doit avoir un nom.
02
RĂ©pondre d’abord, expliquer ensuite. La rĂ©ponse directe en tĂȘte est la rĂšgle fondamentale de l’AEO.
03
Une donnĂ©e que seul ton contenu possĂšde est une donnĂ©e que seul ton contenu peut citer. L’originalitĂ© factuelle est le moat de l’Ăšre IA.
04
La clartĂ© sĂ©mantique bat la richesse rhĂ©torique. Écrire pour un espace vectoriel, c’est Ă©crire pour ĂȘtre compris prĂ©cisĂ©ment, pas pour impressionner.
05
Un site qui parle de tout n’est l’autoritĂ© sur rien. La focalisation thĂ©matique est une dĂ©cision architecturale, pas Ă©ditoriale.
06
Les machines n’ont pas de patience pour les introductions. Tout chunk doit ĂȘtre utile isolĂ©ment.
07
Un framework sans nom propre n’est pas citable. Nommer ses mĂ©thodes, c’est crĂ©er des ancrages de citation.
08
L’autoritĂ© n’est pas auto-proclamĂ©e — elle est construite dans les corpus de tiers. Ce que les autres disent de toi pĂšse plus que ce que tu dis de toi-mĂȘme.
09
Un contenu inaccessible aux crawlers IA n’existe pas, mĂȘme s’il est excellent. L’accessibilitĂ© technique est un prĂ©requis non nĂ©gociable.
10
La marque n’est pas un supplĂ©ment d’Ăąme — c’est l’infrastructure de la visibilitĂ© IA. Sans entitĂ© forte, tout contenu s’Ă©vapore dans le bruit du corpus.
11
Une position tranchĂ©e et argumentĂ©e est plus mĂ©morable qu’un consensus mou. Les IA se souviennent des thĂšses, pas des gĂ©nĂ©ralitĂ©s.
12
L’AEO n’est pas une tactique de plus. C’est la prochaine couche de distribution. Les marques qui la maĂźtrisent maintenant bĂątissent une avance structurelle de 5 ans.
Télécharger le Manifeste AEO

Format carte de rĂ©fĂ©rence A4 — imprimable pour affichage Ă©quipe

14 — Plan d’action

90 JOURS POUR
DEVENIR CITABLE

Un plan structurĂ© en 3 sprints de 30 jours. Des actions concrĂštes, dans l’ordre, avec les outputs attendus et les mĂ©triques de validation.

SPRINT 01 · J1–30
FONDATIONS
  • →DĂ©finir et Ă©crire sa thĂšse de marque (1 page)
  • →CrĂ©er / réécrire la page About en mode AEO
  • →ImplĂ©menter schema.org Organization + Person
  • →Ouvrir robots.txt aux crawlers IA
  • →CrĂ©er le fichier /llms.txt
  • →Faire le test d’entitĂ© ChatGPT / Claude
  • →Calculer son SCA de base
OUTPUT J30
Entité définie. Signaux techniques en place. SCA baseline établi.
SPRINT 02 · J31–60
CONTENU
  • →Publier 1 guide pilier exhaustif (modĂšle RAFT)
  • →Lancer une mini-Ă©tude avec donnĂ©es originales
  • →Restructurer les 3 meilleurs articles existants
  • →Ajouter FAQ schema.org sur les pages clĂ©s
  • →Nommer un framework maison
  • →Publier 2 prises de position tranchĂ©es
  • →Documenter et publier 1 cas client chiffrĂ©
OUTPUT J60
Corpus N2–N3 constituĂ©. Premiers tests de citabilitĂ© positifs.
SPRINT 03 · J61–90
AMPLIFICATION
  • →DĂ©marcher presse spĂ©cialisĂ©e (2–3 interviews)
  • →Intervenir dans 1 podcast ou confĂ©rence
  • →5 rĂ©ponses de qualitĂ© Reddit / Quora
  • →Retester ChatGPT, Perplexity, Gemini
  • →Lancer 1 Ă©tude originale avec PR
  • →Recalculer le SCA vs baseline J1
  • →DĂ©finir le plan AEO du trimestre suivant
OUTPUT J90
CitĂ© dans au moins 2 IA sur ton domaine. SCA ≄ 55.

Les 3 métriques AEO à suivre

Métrique 1

Citation spontanée IA

Test mensuel : demander Ă  ChatGPT, Perplexity, Gemini de recommander des experts dans ton domaine. Mesurer ton taux d’apparition et ta position dans les listes.

Métrique 2

AI Overviews appearances

Tracker les requĂȘtes sur lesquelles tu apparais dans les AI Overviews via Semrush ou SE Ranking. Mesurer la surface de citation et son Ă©volution.

Métrique 3

Trafic branded / direct

Une marque forte dans les IA génÚre une hausse du trafic direct et des recherches branded. Les utilisateurs entendent parler de toi via une IA et te cherchent ensuite.

L’IA PEUT CITER
N’IMPORTE QUI.
SOYEZ CELUI
QU’ELLE CHOISIT.

20 places. Une date. Pas de replay. Soit vous ĂȘtes dans la salle le 15 septembre. Soit vous regardez vos concurrents y ĂȘtre.

Je veux ĂȘtre dans les rĂ©ponses →
APOLLO LAB · GUIDE AEO 2025 · ÉDITION SCIENTIFIQUE · THOMAS LEONETTI