Com seleccionen els LLMs les fonts que citen
GPT-4, Claude, Gemini o Llama no citen fonts de manera aleatòria. Cada model segueix un procés de selecció que determina quins continguts acaben com a fonts citades i quins queden fora de la resposta. Conèixer aquest procés és el punt de partida per dissenyar una estratègia de citacions efectiva en l’era del GEO.
El mecanisme de citació varia segons la plataforma. Perplexity AI realitza cerques web en temps real, selecciona els resultats més rellevants i construeix una resposta integrada amb notes al peu que referencien cada font. ChatGPT Search utilitza l’índex de Bing combinat amb navegació web per identificar documents rellevants i els presenta com a enllaços al final de cada bloc de resposta. Google AI Overviews accedeix al seu propi índex de cerca i presenta les fonts en targetes laterals amb enllaços al lloc web original.
Malgrat les diferències operatives, tots els motors generatius comparteixen un conjunt de criteris de selecció de fonts. En primer lloc, la rellevància semàntica: el contingut de la font ha de coincidir de manera precisa amb la consulta de l’usuari, no només a nivell de paraules clau sinó a nivell de significat. En segon lloc, l’autoritat del domini: segons l’informe 2025 AI Citation & LLM Visibility Report publicat per The Digital Bloom, els dominis amb un Domain Rating (DR) superior a 50 tenen entre 2 i 3 vegades més probabilitat de ser citats per ChatGPT que els dominis amb DR inferior a 30. En tercer lloc, la frescor del contingut: els motors generatius prioritzen fonts amb dates de publicació recents, especialment per a consultes que impliquen dades actuals o tendències.
Per a les empreses catalanes que volen ser citades en respostes d’IA, la qualitat i l’autoritat del contingut són els factors decisius. Publicar no és suficient: cal publicar contingut que els motors generatius considerin prou fiable per referenciar. Per a una visió completa de l’ecosistema GEO, consulta la nostra guia central sobre optimització per a motors generatius.
El factor de consens: per què la presència múltiple importa
Un dels descobriments més rellevants de la investigació en GEO és el que s’anomena factor de consens. Quan un LLM processa una consulta, no només cerca la millor font individual: avalua si la informació és consistent entre múltiples fonts independents. Si diversos dominis fiables diuen el mateix, el model té més confiança per incloure aquesta informació a la seva resposta i citar les fonts que la sustenten.
Segons dades d’anàlisi publicades per investigadors de la Universitat de Princeton en el seu estudi fundacional sobre GEO, els continguts que apareixen referenciats en tres o més fonts de qualitat tenen un 67% més de probabilitat de ser inclosos en respostes generatives que els continguts presents en una única font. Això té implicacions directes per a l’estratègia de citacions: el teu propi lloc web no n’hi ha prou; necessites que la mateixa informació (o informació complementària que reforci la teva posició) existeixi en altres fonts reconegudes.
El factor de consens s’assembla al link building en SEO, però amb un matís clau. En SEO, un backlink és un vot de confiança explícit d’un domini cap a un altre. En GEO, el consens és un vot de confiança implícit: si la teva informació coincideix amb la d’altres fonts autoritzades, el model la considera fiable. No necessites un enllaç directe; necessites concordança temàtica.
Per a les empreses catalanes, això obre una via estratègica clara: participar en publicacions sectorials, col·laborar amb mitjans de comunicació locals, contribuir a directoris professionals i publicar investigació pròpia que altres fonts puguin referenciar. Cada menció de la teva marca o la teva informació en una font externa és un node més en la xarxa de consens que els motors generatius utilitzen per decidir a qui citen.
Anàlisi per plataforma: què cita cada motor generatiu
No tots els motors d’IA generativa citen les mateixes fonts ni segueixen els mateixos criteris de selecció. Una estratègia de citacions robusta ha de considerar les particularitats de cada plataforma per maximitzar la cobertura.
Perplexity AI: el citador més transparent
Perplexity AI és la plataforma que ofereix més transparència en les seves citacions. Cada fragment de la seva resposta inclou una nota numerada que enllaça a la font original. Segons anàlisis de patrons de citació, Perplexity tendeix a prioritzar fonts amb alt contingut factual, dades específiques i estructura clara. Les pàgines amb llistats, taules comparatives i definicions precises tenen una probabilitat desproporcionadament alta de ser citades.
Per a contingut en català i castellà, Perplexity mostra una bona capacitat de processament, però la competició per ser citat és menor que en anglès. Això representa una oportunitat: crear contingut factual i ben estructurat en català sobre temes on la informació en aquesta llengua és escassa augmenta significativament les possibilitats de citació.
ChatGPT Search: autoritat de domini com a factor dominant
ChatGPT amb funció de cerca web pondera fortament l’autoritat del domini en les seves decisions de citació. Segons l’informe de The Digital Bloom, els dominis amb DR superior a 70 acumulen més del 60% de les citacions de ChatGPT per a consultes informacionals. Això no significa que els dominis petits no puguin ser citats, però sí que necessiten compensar amb contingut excepcionalment rellevant i ben estructurat.
Google AI Overviews: l’ecosistema tancat
AI Overviews té l’avantatge únic d’accedir a tot l’ecosistema de Google: Search, Maps, Business Profile, Shopping i News. Això significa que les estratègies de citació per a AI Overviews són inseparables de l’estratègia SEO global. Si ja tens un bon posicionament orgànic a Google, tens una base sòlida per a AI Overviews. Però afegir dades estructurades, millorar la citabilitat del contingut i optimitzar el Google Business Profile amplifica la probabilitat de ser seleccionat com a font en les respostes generades.
Construir contingut citable: el fonament de l’estratègia
El contingut citable és aquell que un motor d’IA pot extreure i incorporar a la seva resposta sense perdre significat ni context. Construir contingut amb aquesta característica requereix una metodologia que va més enllà de la redacció convencional.
Un passatge citable té entre 40 i 60 paraules, és autocontingut (comprensible sense llegir la resta de l’article), inclou un fet, dada o definició específica, i preferiblement cita o referencia una font externa. Segons l’estudi de Princeton sobre GEO, incloure estadístiques amb citacions a fonts incrementa la visibilitat en respostes generatives en un 40%, mentre que les afirmacions sense suport factual tenen un impacte molt inferior.
Per a empreses catalanes, la construcció de contingut citable implica un canvi de mentalitat en la redacció. En lloc d’escriure paràgrafs llargs i discursius, cal crear fragments densos d’informació que funcionin com a unitats independents. Cada secció d’un article hauria de contenir almenys un passatge que pugui ser extret i citat de manera autònoma. Per a una metodologia completa sobre com crear contingut citable, consulta la nostra guia sobre contingut citable per a AI Overviews.
Estructures que maximitzen la citabilitat
Les estructures de contingut amb major taxa de citació en motors generatius són:
- Definicions clares al principi de cada secció, que responen directament a la pregunta que l’usuari podria formular.
- Llistes numerades o amb vinyetes, que els models extreuen amb facilitat.
- Taules comparatives, que proporcionen informació estructurada que els LLMs referencien freqüentment.
- Estadístiques contextualitzades, que combinen una dada numèrica amb la seva font i el seu significat.
El nou link building: estratègia de presència en fonts autoritzades
Si el link building tradicional consistia a aconseguir que altres webs enllacessin a la teva, el link building de l’era GEO consisteix a aconseguir que la teva marca, les teves dades i la teva expertesa apareguin en fonts que els motors generatius consideren autoritzades. Aquesta distinció és fonamental perquè l’objectiu ja no és obtenir un enllaç HTML, sinó obtenir una menció, una citació o una referència en un context fiable.
Les estratègies més efectives per construir presència en fonts autoritzades inclouen diverses vies complementàries. La publicació de contingut expert en mitjans sectorials, on la teva marca apareix com a font de coneixement. La col·laboració amb universitats i centres d’investigació, especialment rellevant a Barcelona amb institucions com la UB, la UPC o l’IESE. La participació en directoris professionals de qualitat, tant generals (LinkedIn, Crunchbase) com sectorials. I la generació d’investigació pròpia amb dades originals que altres fonts puguin referenciar.
Per al context català, les oportunitats són especialment interessants. Els mitjans de comunicació en català (Vilaweb, Ara, El Nacional, CCMA) són fonts que els motors generatius rastregen i citen. Les associacions professionals catalanes (Col·legi d’Economistes, Col·legi d’Enginyers, cambres de comerç) ofereixen plataformes de publicació amb autoritat sectorial. I les institucions públiques catalanes (Generalitat, Ajuntament de Barcelona, ACC1Ó) publiquen informes on la col·laboració empresarial pot generar mencions valuoses.
La clau és pensar en termes de xarxa de presència: cada punt on la teva marca apareix com a font fiable és un node que reforça la probabilitat que un motor generatiu et consideri una font autoritzada quan construeixi la seva resposta.
Mètriques de citació: com mesurar l’eficàcia de l’estratègia
Mesurar l’eficàcia d’una estratègia de citacions en motors generatius requereix mètriques específiques que van més enllà dels KPIs tradicionals del SEO. Les tres mètriques fonamentals són la freqüència de citació, la posició de citació i la quota de veu generativa.
La freqüència de citació mesura quantes vegades el teu domini apareix com a font en respostes generatives per a un conjunt definit de consultes rellevants. Es calcula mitjançant mostreig sistemàtic: llançant un conjunt de consultes a cada motor d’IA periòdicament i registrant si el teu domini és citat. Una freqüència de citació del 15% (citat en 15 de cada 100 consultes rellevants) és un punt de partida sòlid per a la majoria de nínxols.
La posició de citació indica on apareix la teva font dins d’una resposta amb múltiples citacions. Les primeres fonts citades reben significativament més atenció i clics que les darreres. Segons anàlisis de comportament d’usuari, la primera font citada en una resposta de Perplexity rep entre 3 i 5 vegades més clics que la tercera font citada. Treballar per millorar la posició de citació, no només la presència, és essencial per maximitzar el retorn.
La quota de veu generativa (Share of Generative Voice) mesura el percentatge de respostes en el teu nínxol on la teva marca o domini és citat, en comparació amb els competidors. Aquesta mètrica proporciona una visió competitiva que permet identificar oportunitats i amenaces en l’ecosistema de citacions. Per a una explicació completa de totes les mètriques GEO, pots consultar la guia sobre mètriques GEO per mesurar visibilitat en IA.
Eines de monitoratge de citacions
Per monitoritzar les citacions, existeixen eines especialitzades com Otterly.ai, que permet rastrejar mencions del teu domini en ChatGPT, Perplexity i AI Overviews de manera automatitzada. Profound ofereix anàlisi de percepció de marca en LLMs. I per a equips amb pressupost limitat, el monitoratge manual amb un full de càlcul sistemàtic segueix sent viable i efectiu.
Estratègia multilingüe: citacions en català, castellà i anglès
Per a empreses que operen a Catalunya, l’estratègia de citacions ha de considerar la dimensió multilingüe. Els motors generatius processen consultes en català, castellà i anglès de manera independent, i les fonts citades per a cada llengua poden ser completament diferents.
El contingut en català té un avantatge estratègic en GEO: la competència per ser citat és significativament menor que en castellà o anglès. Quan un usuari pregunta a Perplexity en català sobre un tema especialitzat, les fonts disponibles en català són limitades. Si el teu contingut és l’únic (o un dels pocs) que aborda el tema en català amb qualitat, la probabilitat de citació augmenta dràsticament.
Aquesta oportunitat no implica abandonar el castellà ni l’anglès, sinó afegir el català com a capa addicional de l’estratègia. Un enfocament recomanat és crear contingut pilar en les tres llengües, assegurant que cada versió no sigui una traducció literal sinó una adaptació amb referències locals i fonts específiques de cada context lingüístic. Aquesta estratègia multilingüe amplifica la presència total de la marca en l’ecosistema de citacions generatives i maximitza la cobertura de consultes en els tres idiomes.
Casos d’ús: patrons de citació observats al mercat català
L’anàlisi de patrons de citació en el mercat català revela tendències específiques que les empreses poden aprofitar per dissenyar estratègies més efectives. Aquests casos d’ús, basats en l’observació sistemàtica de respostes de motors generatius per a consultes en català i castellà relacionades amb sectors rellevants a Catalunya, il·lustren com funcionen les citacions a la pràctica.
En el sector turístic, un dels més consultats a Catalunya, els motors generatius tendeixen a citar una combinació de fonts institucionals (Turisme de Barcelona, Generalitat) i fonts editorials (guies de viatge, blogs especialitzats). Les empreses turístiques que publiquen contingut amb dades específiques sobre la seva oferta i la seva zona geogràfica aconsegueixen citacions amb més freqüència que les que només tenen una web corporativa genèrica. Per exemple, un hotel que publica una guia detallada sobre activitats al barri on està ubicat genera un actiu citable que els LLMs poden referenciar quan un usuari pregunta sobre allotjament i activitats en aquella zona.
En el sector tecnològic, les empreses que publiquen estudis amb dades originals sobre el seu àmbit d’especialització són citades amb molta més freqüència que les que només publiquen contingut promocional. Un informe sobre tendències de desenvolupament web a Catalunya, amb dades pròpies i metodologia transparent, és el tipus de contingut que Perplexity i ChatGPT seleccionen com a font quan responen consultes relacionades. La clau és que el contingut aporti informació única i verificable que no es trobi fàcilment en altres fonts.
En el sector de serveis professionals, l’autoritat individual dels professionals té un impacte directe en les citacions. Un advocat o un consultor amb articles publicats en mitjans de referència, participació en conferències documentada i un perfil professional complet té més probabilitat de ser citat que un professional equivalent sense visibilitat pública. Les citacions en aquest sector funcionen a nivell de persona, no només de marca.
Pla d’acció: de la teoria a la implementació
Transformar aquesta comprensió teòrica en resultats tangibles requereix un pla d’acció sistemàtic amb fases definides, responsabilitats clares i mètriques de seguiment. El pla que es presenta a continuació està dissenyat per a empreses catalanes que volen construir una estratègia de citacions robusta en un termini de tres mesos.
Fase 1: Auditoria de citacions actual (setmanes 1-2)
Definir un conjunt de 50-100 consultes rellevants per al teu negoci en català, castellà i anglès. Llançar cada consulta als tres principals motors generatius (ChatGPT, Perplexity, AI Overviews) i registrar si el teu domini és citat, en quina posició i amb quin context. Aquesta línia base permet mesurar el progrés futur. És recomanable documentar també quins competidors apareixen citats per identificar les seves estratègies i les llacunes que la teva empresa pot cobrir.
Fase 2: Optimització del contingut existent (setmanes 3-6)
Revisar el contingut publicat per incorporar passatges citables, dades amb fonts i estructura optimitzada per a extracció per part de LLMs. Cada article existent hauria de rebre almenys tres passatges citables nous amb dades verificables i fonts referenciades. Implementar schema.org en totes les pàgines prioritàries, seguint les recomanacions de la guia sobre schema.org com a pont entre SEO i GEO. Verificar que l’atribut de llengua estigui correctament configurat per a cada versió idiomàtica. Afegir seccions de FAQ amb marcatge FAQPage als articles més rellevants.
Fase 3: Construcció de presència en fonts externes (setmanes 7-12)
Identificar 10-20 publicacions autoritzades en el teu sector on publicar contingut expert. Establir col·laboracions amb institucions i associacions professionals catalanes. Generar almenys un recurs amb dades originals que altres fonts puguin referenciar. Buscar oportunitats de publicació en mitjans catalans de referència com Ara, Vilaweb, El Nacional o publicacions sectorials específiques del teu àmbit. Cada aparició en una font autoritzada és un node addicional en la xarxa de consens que els motors generatius utilitzen per validar la teva autoritat.
Fase 4: Monitoratge i iteració contínua (mensual)
Repetir l’auditoria de citacions mensualment per mesurar el progrés. Ajustar l’estratègia segons els resultats, reforçant els canals que generen més citacions i abandonant els que no ofereixen retorn. Actualitzar el contingut existent amb noves dades i fonts per mantenir la frescor que els motors generatius valoren. Documentar els patrons de citació observats per construir un coneixement acumulatiu que permeti refinar l’estratègia amb cada cicle de mesurament.
L’objectiu final és construir un ecosistema de presència digital on la teva marca sigui percebuda pels motors d’IA com una font autoritzada, fiable i citable. Això no s’aconsegueix amb una acció puntual, sinó amb una estratègia consistent i ben executada al llarg del temps, integrada amb la resta d’accions GEO descrites al hub central de GEO.