Référence
Glossaire GEO
Tous les termes du Generative Engine Optimization, de l'AEO et de l'AI Search définis en français avec précision.
A
AEO
Answer Engine Optimization
Optimisation d'un contenu pour apparaître comme réponse directe dans les Featured Snippets Google, les assistants vocaux et les interfaces conversationnelles. Précurseur du GEO, l'AEO cible essentiellement une réponse unique sur Google, là où le GEO vise des synthèses multi-sources sur plusieurs plateformes.
AI Overviews
Anciennement SGE — Search Generative Experience
Résumés générés par Gemini qui apparaissent en tête des résultats Google. Ils sélectionnent trois à cinq sources et construisent une réponse synthétique. Ils réduisent le taux de clic vers les sites référencés car l'utilisateur obtient souvent l'essentiel sans cliquer.
AI Search
Terme générique désignant tout moteur ou interface qui utilise l'intelligence artificielle générative pour répondre à des requêtes, par opposition à la recherche classique par liste de liens. ChatGPT Search, Perplexity et Gemini sont des exemples d'AI Search.
Answer Engine
Moteur qui retourne directement une réponse formulée à une question, plutôt qu'une liste de liens. Perplexity est l'exemple le plus pur. ChatGPT avec recherche activée fonctionne également comme un answer engine. Google tend vers ce modèle avec ses AI Overviews.
Autorité de domaine
Domain Authority, Domain Rating
Mesure de la fiabilité et de l'influence d'un nom de domaine, basée sur le volume et la qualité des backlinks. Métrique popularisée par Moz et Ahrefs, non officielle chez Google. Pour les LLM, l'autorité d'un domaine influence la probabilité d'être cité : les domaines établis sont préférés aux nouveaux sites.
B
Backlink
Lien entrant, lien retour
Lien hypertexte pointant vers votre site depuis un autre domaine. Signal d'autorité majeur pour le SEO classique et pour la confiance accordée par les LLM. Un backlink d'un site reconnu dans votre secteur vaut davantage que des dizaines de liens depuis des sites non pertinents.
Bing Webmaster Tools
Interface de gestion de la présence sur Bing, équivalente à Google Search Console. Essentielle pour le GEO car Bing est l'infrastructure de recherche sous-jacente de ChatGPT et Copilot. Un site non soumis à Bing Webmaster Tools risque une citabilité réduite dans ChatGPT.
Bot de crawl
Crawler, spider, robot d'exploration
Programme automatisé qui parcourt le web pour indexer les contenus. Chaque plateforme IA a le sien : GPTBot (OpenAI), PerplexityBot, ClaudeBot (Anthropic), Google-Extended (Google). Leur accès se contrôle via le fichier robots.txt.
C
Citation IA
Mention d'un contenu, d'une marque ou d'une URL dans la réponse d'un moteur IA génératif. Peut être explicite avec lien (Perplexity), mention du nom sans lien, ou intégration implicite du contenu dans la synthèse. Les citations explicites sont les plus mesurables et bénéfiques.
Citabilité
Capacité d'un contenu à être sélectionné et cité par un LLM dans une réponse synthétique. Dépend de la structure extractible, de l'autorité perçue, de la fraîcheur et de la pertinence. Un contenu excellent peut être peu citable s'il est mal structuré pour l'extraction automatique.
ClaudeBot
Robot d'exploration d'Anthropic, utilisé pour la collecte de données d'entraînement des modèles Claude. Identifiable dans les logs serveur par son user-agent. Peut être autorisé ou bloqué via robots.txt. L'autoriser améliore la représentation de votre contenu dans Claude.
Core Web Vitals
Métriques de performance web définies par Google : LCP (temps d'affichage du plus grand élément), INP (réactivité) et CLS (stabilité visuelle). Influencent le SEO Google et indirectement le GEO : un site lent est crawlé moins fréquemment par les bots LLM.
Crawl budget
Nombre de pages qu'un robot d'exploration accepte de crawler sur un site dans un temps donné. Un site avec un crawl budget mal géré (pages inutiles, erreurs 404, redirections en chaîne) sera partiellement ignoré, ce qui réduit la couverture d'indexation tant pour Google que pour les bots LLM.
D
Données structurées
Structured data, Schema markup
Informations ajoutées au HTML pour décrire explicitement un contenu aux moteurs et aux LLM. Format recommandé : JSON-LD. Vocabulaire standard : Schema.org. Permettent aux LLM d'identifier précisément la nature d'un contenu sans devoir l'inférer depuis le texte.
Domain Rating
DR — métrique Ahrefs
Score de 0 à 100 calculé par Ahrefs mesurant la force du profil de backlinks d'un domaine. Indicateur indirect de l'autorité perçue d'un site. Plus le DR est élevé, plus les contenus du domaine ont de chances d'être cités par les LLM, toutes choses égales par ailleurs.
E
E-E-A-T
Experience, Expertise, Authoritativeness, Trustworthiness
Cadre d'évaluation de la qualité des contenus utilisé par Google dans ses Quality Rater Guidelines. Le premier E (Experience) a été ajouté en 2022 pour valoriser le vécu personnel. Pour le GEO, l'E-E-A-T se traduit concrètement par : auteur identifié avec page bio, sources citées, contenu factuel vérifiable et réputation de domaine établie.
Embedding
Représentation numérique d'un texte sous forme de vecteur dans un espace mathématique de haute dimension. Les LLM comparent les embeddings pour déterminer la pertinence sémantique d'un contenu par rapport à une requête. Deux textes aux significations proches auront des embeddings voisins, même si les mots sont différents.
Extraction d'information
Processus par lequel un LLM identifie et isole des données pertinentes depuis un texte source pour construire une réponse. La structure d'une page (titres H2/H3, listes, réponses courtes en introduction) facilite ou complique cette extraction. Un contenu optimisé pour l'extraction répond à la question dès les premières phrases.
F
Featured Snippet
Extrait enrichi, position zéro
Encadré Google placé au-dessus des résultats organiques qui affiche directement une réponse extraite d'une page web. Précurseur des AI Overviews, il récompense les contenus bien structurés avec une réponse directe. L'optimisation pour les Featured Snippets et l'optimisation GEO partagent les mêmes fondations.
Fraîcheur du contenu
Content freshness
Signal de qualité basé sur la date de publication ou de mise à jour d'un contenu. Particulièrement important pour Perplexity, qui privilégie les sources récentes. Un contenu datant de plus d'un an sur un sujet évolutif sera pénalisé au profit de sources plus récentes, même légèrement moins complètes.
G
GEO
Generative Engine Optimization
Discipline d'optimisation visant à améliorer la visibilité d'un contenu dans les réponses des moteurs IA génératifs (ChatGPT, Perplexity, Gemini, Claude, Copilot). Contrairement au SEO, il n'existe pas encore de critères officiellement documentés. Les pratiques GEO actuelles sont basées sur l'observation et l'expérimentation.
Google-Extended
User-agent spécifique de Google permettant aux propriétaires de sites de contrôler si leurs contenus peuvent être utilisés pour entraîner les modèles IA de Google (Gemini). À distinguer de Googlebot, qui lui gère l'indexation classique. Se bloque indépendamment via robots.txt.
GPTBot
Robot d'exploration d'OpenAI utilisé pour collecter des données d'entraînement pour les modèles GPT. Identifiable par son user-agent. L'autoriser dans robots.txt augmente la probabilité que vos contenus soient représentés dans les futures versions de ChatGPT.
Grounding
Technique consistant à ancrer les réponses d'un LLM sur des sources externes vérifiables, plutôt que sur ses seules données d'entraînement. Un LLM "groundé" cite des pages réelles. Le grounding réduit les hallucinations et est au cœur du fonctionnement de Perplexity et ChatGPT Search.
H
Hallucination
Génération par un LLM d'informations factuellement incorrectes présentées avec assurance. Les hallucinations surviennent quand le modèle comble des lacunes de ses données d'entraînement par des inférences incorrectes. Les moteurs avec grounding (Perplexity, ChatGPT Search) hallucinent moins car ils s'appuient sur des sources en temps réel.
I
Indexation
Processus par lequel un moteur de recherche ou un bot LLM enregistre le contenu d'une page dans sa base de données. Sans indexation, une page n'existe pas pour le moteur. L'indexation Bing est particulièrement critique pour le GEO : sans elle, une page ne peut pas être citée par ChatGPT ou Copilot.
Intention de recherche
Search intent, query intent
Objectif sous-jacent d'une requête : informationnelle (comprendre), navigationnelle (trouver un site), transactionnelle (acheter), ou commerciale (comparer). Les LLM sont particulièrement performants pour les requêtes informationnelles. Aligner son contenu sur l'intention de recherche est la première étape de l'optimisation GEO.
J
JSON-LD
JavaScript Object Notation for Linked Data
Format de balisage pour les données structurées, intégré dans une balise <script> dans le <head> d'une page. Recommandé par Google pour son implémentation propre (sans modifier le HTML visible). C'est le format le plus lisible pour les LLM et le plus facile à maintenir.
L
LLM
Large Language Model — Grand modèle de langage
Modèle d'intelligence artificielle entraîné sur de larges corpus textuels pour comprendre et générer du langage naturel. GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic) et Llama (Meta) sont des LLM. Leur comportement de citation est au cœur de la discipline GEO.
llms.txt
Fichier texte placé à la racine d'un domaine (domaine.com/llms.txt) pour communiquer aux LLM des informations sur le site : description, pages clés, règles d'utilisation. Standard non officiel, initié par Perplexity. Son adoption améliore la représentation d'un site dans les réponses des moteurs IA qui le supportent.
LCP
Largest Contentful Paint
Métrique Core Web Vitals mesurant le temps nécessaire pour afficher le plus grand élément visible d'une page. Google recommande un LCP inférieur à 2,5 secondes. Un LCP élevé nuit au SEO classique et signale aux bots un site lent, pouvant réduire la fréquence de crawl.
M
Modèle génératif
Generative AI model
Modèle d'IA capable de produire du contenu original (texte, images, code) en réponse à une requête, par opposition aux modèles discriminatifs qui classifient uniquement. Dans le contexte GEO, les modèles génératifs sont ceux qui construisent des réponses synthétiques à partir de sources — ChatGPT, Gemini, Claude, Perplexity.
Maillage interne
Internal linking
Ensemble des liens hypertextes reliant les pages d'un même site. Un bon maillage distribue l'autorité entre les pages, facilite le crawl des bots et aide les LLM à comprendre la structure thématique d'un site. Les pages orphelines (sans liens entrants internes) sont moins bien indexées.
Métadonnées
Meta title, meta description, balises Open Graph
Informations structurées dans le <head> d'une page, non visibles dans le corps de la page mais lues par les robots. Le titre (title tag) et la description (meta description) influencent le CTR dans les résultats classiques. Les balises Open Graph (og:title, og:description) contrôlent l'apparence des partages sur les réseaux sociaux et sont lues par certains LLM.
N
NLP
Natural Language Processing — Traitement automatique du langage naturel
Branche de l'IA qui permet aux machines de comprendre, interpréter et générer du langage humain. Les LLM reposent entièrement sur le NLP. Pour le GEO, écrire dans un langage naturel et conversationnel (plutôt que du jargon SEO optimisé en mots-clés) est mieux aligné avec la façon dont les LLM traitent le langage.
O
Organique (trafic)
Organic traffic, SEO traffic
Visites générées par les résultats naturels (non payants) des moteurs de recherche. Par extension, dans le contexte GEO, on parle de "visibilité organique dans les IA" pour désigner les citations obtenues sans achat de placement. Contrairement au SEO classique, il n'existe pas encore d'outil de mesure standardisé pour le trafic organique issu des LLM.
P
PerplexityBot
Robot d'exploration de Perplexity qui indexe le web en temps réel pour alimenter ses réponses. Contrairement aux bots d'entraînement (GPTBot, ClaudeBot), PerplexityBot fait des requêtes en continu. L'autoriser dans robots.txt est essentiel pour être citable dans Perplexity, qui est le moteur IA le plus transparent sur ses sources.
Prompt
Instruction ou question soumise à un LLM pour déclencher une génération de texte. Dans le contexte GEO, la façon dont une question est formulée influence les sources que le LLM va chercher et citer. Comprendre les types de prompts que vos clients utilisent est la base de toute stratégie de contenu GEO.
PageRank
Algorithme original de Google (1998) qui mesure l'importance d'une page en fonction du nombre et de la qualité des liens qui pointent vers elle. Toujours actif sous une forme évoluée, il est l'un des fondements de l'autorité de domaine. Les LLM tendent à citer des pages ayant un PageRank implicitement élevé, c'est-à-dire des pages bien référencées sur Google.
R
RAG
Retrieval-Augmented Generation
Architecture qui combine la recherche de documents externes (retrieval) et la génération de texte par un LLM. Le modèle récupère d'abord des passages pertinents depuis une base de données ou le web, puis les utilise pour générer sa réponse. Perplexity et ChatGPT Search fonctionnent selon ce principe. Comprendre le RAG est fondamental pour optimiser la citabilité.
robots.txt
Fichier texte placé à la racine d'un domaine qui indique aux robots quelles pages peuvent ou ne peuvent pas être crawlées. Chaque bot LLM (GPTBot, PerplexityBot, ClaudeBot, Google-Extended) peut être autorisé ou bloqué individuellement. Un robots.txt mal configuré peut accidentellement empêcher l'indexation par les moteurs IA.
Rich Results
Résultats enrichis, rich snippets
Affichages améliorés dans les résultats Google activés par les données structurées : étoiles d'avis, FAQ déroulante, fil d'Ariane, prix produit. Ils augmentent le CTR et signalent aux LLM que la page est bien structurée et fiable. L'outil Google Rich Results Test permet de valider leur implémentation.
S
Schema.org
Vocabulaire standardisé de données structurées créé en 2011 par Google, Bing, Yahoo et Yandex. Définit des types (Organization, Article, FAQPage, Product...) et des propriétés pour décrire le contenu d'une page de façon sémantiquement précise. C'est le langage que les LLM lisent le mieux pour comprendre la nature d'une page.
SEO
Search Engine Optimization
Ensemble des techniques visant à améliorer le positionnement d'un site dans les résultats organiques des moteurs de recherche classiques (principalement Google). Le SEO et le GEO partagent de nombreuses fondations : autorité de domaine, qualité du contenu, performance technique. Un bon SEO est un prérequis au GEO, pas son concurrent.
SERP
Search Engine Results Page — Page de résultats
Page affichée par un moteur de recherche en réponse à une requête. La SERP classique liste des liens organiques, des annonces et des résultats enrichis. Avec l'intégration des AI Overviews, la SERP Google évolue vers un format hybride où une synthèse IA coexiste avec les liens classiques.
SERP zéro
Position zéro
Résultat placé avant la première position organique classique dans Google, sous forme de Featured Snippet ou d'AI Overview. Obtenir la SERP zéro est l'objectif de l'AEO. Pour le GEO, c'est un indicateur que le contenu est bien structuré pour l'extraction directe par les LLM.
Sitemap XML
Fichier XML listant toutes les URLs d'un site avec des métadonnées (date de modification, fréquence de mise à jour, priorité). Il guide les robots vers toutes les pages à indexer. Un sitemap à jour soumis à Google Search Console et Bing Webmaster Tools est la première étape technique de l'optimisation GEO.
Recherche sémantique
Semantic search
Approche de recherche qui comprend l'intention et le sens d'une requête, pas seulement les mots-clés exacts. Les LLM sont fondamentalement sémantiques : ils comprennent qu'une question sur "meilleur comptable Lausanne" et "fiduciaire recommandée Vaud" cherchent la même information. L'optimisation sémantique (couvrir un sujet en profondeur) est plus efficace que l'optimisation par mots-clés isolés.
T
Token
Unité de base traitée par un LLM, correspondant approximativement à un mot ou une partie de mot (en français, un token ~ 0,7 mot). Les LLM ont une fenêtre de contexte limitée en tokens : ils ne peuvent analyser qu'un certain nombre de tokens à la fois. Pour le GEO, cela signifie que les informations importantes doivent apparaître tôt dans la page.
Topical authority
Autorité thématique
Perception par les moteurs qu'un site est une référence sur un sujet donné, basée sur la profondeur et la cohérence de sa couverture thématique. Un site qui couvre exhaustivement un sujet (plusieurs articles, guide complet, glossaire, FAQ) sera considéré comme plus fiable qu'un site avec un article isolé sur le même sujet.
Z
Zéro clic
Zero-click search
Requête où l'utilisateur obtient sa réponse directement sur la page de résultats sans cliquer sur un lien. Les Featured Snippets et les AI Overviews de Google génèrent du zéro clic. Perplexity et ChatGPT Search sont structurellement des moteurs à zéro clic. Ce phénomène rend la visibilité dans les IA génératrices plus importante que le simple positionnement Google.