Saltar al contingut principal
Guia pràctica

Com Crear Contingut Citable per a AI Overviews i Motors d'IA

Què és el contingut citable

Quan Perplexity respon una pregunta, no llegeix l’article com ho faria un humà. Extreu fragments. Busca passatges autocontinguts, verificables i precisos que pugui incorporar directament a la resposta. El contingut citable és exactament això: text dissenyat estructuralment perquè un algoritme d’IA el seleccioni, sense que perdi significat fora del seu context original.

Quan un usuari pregunta a ChatGPT, Perplexity o Google AI Overviews una qüestió com “què és la taxa de rebot en SEO”, el motor generatiu no respon únicament des de la seva memòria d’entrenament. Realitza una cerca web, identifica documents rellevants i extreu els passatges que millor responen a la pregunta. Després, sintetitza aquests passatges en una resposta coherent i afegeix citacions a les fonts originals. El teu objectiu com a creador de contingut és que els teus passatges siguin els seleccionats en aquest procés.

La citabilitat té un impacte quantificable. L’estudi de GEO de Princeton i Georgia Tech va mesurar que les tècniques d’optimització de citabilitat poden incrementar la visibilitat en respostes generatives entre un 30% i un 115%, amb un increment mitjà del 40%. La tècnica amb major impacte individual va ser la inclusió de cites i estadístiques amb fonts verificables, amb increments del 33% al 41% en la taxa de selecció.

En el context del mercat català, la citabilitat adquireix una dimensió estratègica molt particular. El contingut web en català sobre marketing digital, tecnologia o negocis és notablement escàs comparat amb l’equivalent en castellà o anglès. Aquesta escassetat, lluny de ser un desavantatge, crea una oportunitat extraordinària: els pocs continguts en català que estiguin optimitzats per a citabilitat tindran una competència mínima per ser seleccionats com a fonts per part dels motors generatius quan processin consultes en català. Si vols entendre el panorama complet de l’optimització per a motors generatius, la nostra guia completa de GEO cobreix tots els fonaments.

Citabilitat vs. llegibilitat

Citabilitat i llegibilitat no s’oposen, però tampoc són el mateix. Un text molt llegible per a humans pot ser poc citable si manca d’estructura, dades i autonomia en els seus passatges. Un text hiperoptimitzat per a IA però il·legible per a humans perd autoritat i no serà enllaçat per altres fonts. L’objectiu és el punt d’intersecció: contingut que un lector humà trobi útil i que un model de llenguatge pugui extreure amb facilitat.

Anatomia d’un passatge citable

Un passatge citable és la unitat mínima de contingut que un motor generatiu pot extreure i inserir en una resposta mantenint coherència i valor informatiu. Comprendre la seva estructura és fonamental per crear contingut que les IAs seleccionin de forma consistent.

Llargada òptima

Les anàlisis de passatges citats per AI Overviews, Perplexity i ChatGPT Search revelen un patró consistent: els fragments més freqüentment seleccionats tenen entre 40 i 60 paraules. Aquesta llargada és prou extensa per contenir una afirmació completa amb dades de suport, però prou concisa per integrar-se en una resposta generada sense dominar el text circumdant.

Els passatges inferiors a 30 paraules tendeixen a ser massa genèrics perquè el model els consideri valuosos com a citació. Els superiors a 80 paraules requereixen que el model retalli o parafraseji, cosa que redueix la probabilitat de citació directa amb enllaç a la font.

Estructura interna

El patró estructural més citat segueix el model definició-explicació-dada. Primer, una afirmació clara que respongui a una pregunta implícita. Després, una breu explicació que contextualitzi aquella afirmació. Finalment, una dada específica que la recolzi. Aquest patró és el que els models de llenguatge processen amb major eficàcia perquè replica l’estructura d’una resposta ideal.

Exemple de passatge citable ben construït: “La taxa de rebot és el percentatge de sessions d’una sola pàgina en què l’usuari abandona el lloc sense interacció addicional. Una taxa de rebot elevada no sempre indica un problema: en pàgines informacionals, taxes del 65-75% són habituals. Segons dades de Semrush de 2025, la taxa mitjana de rebot en llocs B2B és del 61%.”

Autonomia informativa

Un passatge citable ha de funcionar com una unitat independent d’informació. Si un lector (humà o IA) extreu aquell paràgraf de l’article i el llegeix aïllat, n’ha d’entendre el significat complet sense necessitat de paràgrafs previs o posteriors. Això significa evitar referències internes com “com hem esmentat més amunt”, “aquest mètode” (sense explicar quin) o “segons la taula anterior”.

L’autonomia informativa és el criteri més infravalorat de la citabilitat. Molts redactors creen textos fluids on cada paràgraf depèn de l’anterior, cosa que produeix una lectura agradable però passatges no extraibles. La solució no és escriure paràgrafs inconnexa, sinó assegurar que cada bloc temàtic contingui la informació suficient per sostenir-se per si sol.

Tècniques per crear contingut que les IAs citin

Les següents tècniques tenen suport empíric en estudis de visibilitat GEO i en l’anàlisi sistemàtica de passatges citats pels principals motors generatius.

Tècnica 1: Incloure dades quantificables amb font

La inclusió de dades quantificables amb font identificable és la tècnica de major impacte individual en la citabilitat. L’estudi de GEO de Princeton va calcular increments mitjans del 33% al 41% en la taxa de citació quan un passatge inclou cites o estadístiques amb atribució a una font reconeguda.

No qualsevol dada val. Les dades més citades compleixen tres condicions: són específiques (no “molts usuaris” sinó “el 73% dels usuaris”), són recents (dades dels darrers 12-24 mesos), i la seva font és verificable (un estudi acadèmic, un informe de consultora reconeguda o dades oficials). Les dades sense font no incrementen la citabilitat perquè el model de llenguatge no pot verificar-ne l’origen.

Per al context català, incloure dades específiques del mercat local augmenta la rellevància contextual. Una dada com “segons l’IDESCAT, el 36,1% de la població catalana utilitza habitualment el català a internet” és més citable per a consultes en català que una estadística genèrica global. Per aprofundir en com construir una estratègia de citacions sòlida, consulta la nostra guia sobre estratègia de citacions i fonts per a LLMs.

Tècnica 2: Emprar el patró pregunta-resposta directa

Els motors generatius processen consultes que freqüentment tenen forma de pregunta. Estructurar seccions del teu contingut seguint el patró pregunta explícita seguida de resposta directa facilita l’extracció. Els subtítols en forma de pregunta (H2 o H3) seguits d’un paràgraf que respon directament són altament citables perquè coincideixen amb el patró de consulta de l’usuari.

Aquesta tècnica és especialment efectiva per a consultes informacionals de tipus “què és”, “com funciona”, “quina és la diferència entre” i “quant costa”. El primer paràgraf rere l’encapçalament ha de contenir la resposta completa i concisa; els paràgrafs següents poden ampliar, contextualitzar i proporcionar exemples.

Tècnica 3: Estructurar amb llistes i taules

Les llistes numerades, llistes amb vinyetes i taules comparatives tenen una taxa de citació superior als paràgrafs narratius. La raó és doble: d’una banda, els models de llenguatge poden extreure elements individuals d’una llista sense trencar la coherència; de l’altra, les llistes i taules solen contenir informació densa i estructurada, que és el que el motor generatiu necessita per construir respostes eficients.

Una taula comparativa amb tres o quatre columnes i cinc a deu files és un dels formats més citats, especialment per a consultes de tipus “X vs. Y” o “millors eines de Z”. Si el teu contingut inclou comparacions, expressar-les en format tabular incrementa significativament la probabilitat de citació.

Tècnica 4: Definicions clares a l’inici de cada secció

Els models de llenguatge cerquen definicions quan processen consultes que comencen amb “què és”. Si el teu article conté una definició clara del concepte a l’inici de la secció corresponent, aquella definició té alta probabilitat de ser extreta com a resposta. La definició ideal segueix el patró: terme + “és” + categoria genèrica + especificació diferencial.

Tècnica 5: Contextualitzar amb el mercat català

Per a consultes en català, els motors generatius prioritzen contingut que sigui rellevant per al context geogràfic i lingüístic de l’usuari. Esmentar dades específiques del mercat català, regulació europea aplicable, hàbits de consum a Catalunya o exemples d’empreses locals incrementa la rellevància contextual i la probabilitat de citació per a usuaris catalanoparlants. Aquesta contextualització gairebé no existeix en el contingut en català sobre marketing digital, que sol ser inexistent o bé traduccions directes del castellà.

Com selecciona contingut AI Overviews

Google AI Overviews, denominat “Vistes Creades amb IA” al mercat espanyol des del seu llançament el març de 2025, opera amb un sistema de selecció de fonts que combina l’índex de Google Search amb un procés addicional d’avaluació de qualitat per a respostes generatives.

El procés de selecció

Quan AI Overviews s’activa per a una consulta, el sistema primer identifica els documents més rellevants de l’índex de Google. No parteix de zero: utilitza la mateixa base de documents que els resultats orgànics clàssics. Això significa que el SEO tècnic continua sent fonamental: si la teva pàgina no està indexada o té problemes de rastreig, no serà candidata per a AI Overviews.

Un cop identificats els documents candidats, un model de llenguatge avalua la qualitat dels passatges disponibles en cada document. Aquesta avaluació considera la rellevància semàntica respecte a la consulta, la completesa de la resposta, la fiabilitat percebuda de la font i la presència de dades estructurades que facilitin l’extracció.

El resultat és una resposta generada que integra informació d’entre dues i sis fonts, presentades com a targetes amb títol, URL i fragment al costat del text generat. L’usuari pot fer clic en qualsevol d’aquestes fonts per accedir al contingut original.

Factors de selecció documentats

Google ha confirmat oficialment que AI Overviews utilitza criteris de qualitat de contingut coherents amb les seves directrius generals de qualitat. Això inclou E-E-A-T, rellevància temàtica, frescor del contingut i absència de contingut de baixa qualitat o correu brossa. A més, la presència de dades estructurades schema.org facilita la identificació del tipus de contingut, autor i data.

Les anàlisis de tercers realitzades amb eines com Semrush i Ahrefs suggereixen que els llocs amb major Domain Authority tenen major probabilitat de ser citats, però no de forma exclusiva. Llocs amb autoritat mitjana però contingut excepcionalment ben estructurat i citable també apareixen com a fonts, cosa que demostra que la citabilitat del contingut pot compensar parcialment una autoritat de domini inferior. Per a una comprensió més àmplia de com cada motor generatiu selecciona fonts, llegeix la nostra anàlisi de Perplexity, ChatGPT i el nou SEO.

Tipus de consulta que activen AI Overviews

AI Overviews no s’activa per a totes les cerques. Segons dades d’anàlisi de SERPs a Google.es, apareix predominantment en consultes informacionals (què és, com funciona, per què) i en consultes comparatives (X vs. Y, millor eina per a Z). Rarament s’activa per a consultes transaccionals directes (comprar X) o navegacionals (web de l’empresa X).

Això té implicacions estratègiques: el contingut informacional i educatiu és el que major potencial de citació té a AI Overviews. Els articles de blog, guies, glossaris i recursos educatius són els formats amb major taxa d’aparició com a font. Per connectar la teva estratègia d’E-E-A-T amb la visibilitat en IA, revisa la nostra guia sobre optimitzar E-E-A-T per a IA generativa.

Formats que maximitzen la citació

No tots els formats de contingut tenen la mateixa probabilitat de ser citats. Les dades d’anàlisi de respostes generatives revelen patrons clars sobre quins formats funcionen millor en cada context.

Definicions i explicacions conceptuals

Les definicions són el format més citat en consultes de tipus “què és”. Una definició clara, concisa i autocontinguda en el primer paràgraf d’una secció té una taxa de citació significativament superior a les definicions embegudes en paràgrafs narratius. L’estructura òptima és: H2 amb el terme + primer paràgraf amb la definició completa en 40-60 paraules.

Llistes de passos (How-To)

Per a consultes de tipus “com fer”, les llistes numerades de passos són el format dominant en citacions. Cada pas ha de ser una acció concreta amb prou detall per executar-se. Els motors generatius poden citar una llista completa o passos individuals, segons la complexitat de la consulta.

Taules comparatives

Les taules són el format més eficaç per a consultes comparatives. Una taula amb criteris clars en files i opcions en columnes permet al motor generatiu extreure comparacions precises. Les taules amb 3-5 criteris i 2-4 opcions són les més freqüentment citades perquè són prou completes sense ser excessivament complexes.

Dades resumides amb context

Els blocs de dades amb context (per exemple, “segons l’informe X de 2025, el sector Y va créixer un Z%”) són altament citables per a consultes que busquen dades específiques. La clau és que la dada i la seva font estiguin al mateix passatge, sense requerir que el lector cerqui la referència en un altre lloc de l’article.

Extractes de preguntes freqüents

Les seccions de FAQ amb format pregunta-resposta són extraordinàriament citables perquè la seva estructura coincideix exactament amb el patró de consulta de l’usuari. Implementar FAQPage schema.org a més del contingut visible reforça la senyalització al motor generatiu.

Errors comuns que redueixen la citabilitat

Evitar errors és tan important com aplicar bones pràctiques. Els següents patrons redueixen significativament la probabilitat que el teu contingut sigui citat per motors generatius.

Paràgrafs excessivament llargs

Els blocs de text superiors a 150 paraules sense estructura interna són difícils de processar per als models de llenguatge. El model necessita extreure un fragment coherent, i en un paràgraf llarg amb múltiples idees, no existeix un punt de tall natural. Divideix els paràgrafs llargs en unitats temàtiques de 50-80 paraules.

Absència de dades quantitatives

El contingut purament d’opinió o narratiu, sense dades que el recolzin, té baixa citabilitat. Els motors generatius cerquen informació verificable per construir respostes fiables. Un article que afirma “moltes empreses estan adoptant IA” és significativament menys citable que un que diu “el 67% de les empreses catalanes han integrat almenys una eina d’IA en els seus processos de marketing, segons l’informe de la Cambra de Comerç de Barcelona de 2025”.

Dependència contextual entre paràgrafs

Els paràgrafs que comencen amb “a més”, “d’altra banda”, “com hem vist” o “en relació amb l’anterior” depenen del context previ per tenir sentit. Si un motor generatiu extreu aquell paràgraf aïllat, el lector no n’entendria la referència. Cada paràgraf ha de començar establint el seu propi context.

Manca d’estructura jeràrquica

Un article sense H2, H3 ni separació temàtica clara dificulta que el model de llenguatge identifiqui on comença i acaba cada tema. Els encapçalaments actuen com a delimitadors semàntics que guien tant lectors humans com models d’IA.

Contingut duplicat o parafrasejat

Si el teu article és una reescriptura de contingut ja existent en altres dominis, els motors generatius preferiran la font original o la més autoritativa. L’originalitat, entesa com aportar dades pròpies, anàlisis diferenciades o perspectives noves, és un factor de selecció. No n’hi ha prou amb parafrasejar: cal aportar valor nou.

Mesurar la teva taxa de citació en IA

Mesurar la citabilitat del teu contingut requereix una combinació d’eines especialitzades i metodologia sistemàtica. Encara que l’ecosistema de mesura GEO encara està madurant, existeixen enfocaments pràctics que permeten avaluar el teu rendiment.

Metodologia de mostreig manual

El mètode més accessible consisteix a definir un conjunt de 20-50 consultes rellevants per al teu negoci, executar-les en cada motor generatiu principal (Google amb AI Overviews actiu, Perplexity, ChatGPT Search) i registrar si el teu domini apareix com a font. Repetint aquest procés mensualment, s’obté una sèrie temporal que mostra l’evolució de la teva visibilitat en IA.

Per a cada consulta, registra: data de la consulta, motor emprat, si el teu domini va ser citat (sí/no), posició de la citació (primera, segona, etc.), i el passatge exacte del teu contingut que va ser citat. Aquesta darrera dada és especialment valuosa perquè t’indica quins tipus de passatges del teu lloc són els més citables, informació que pots fer servir per optimitzar la resta del teu contingut.

Eines de monitorització automatitzada

Plataformes com Otterly.ai automatitzen aquest procés de mostreig, executant consultes predefinides en múltiples motors d’IA i generant informes de visibilitat. Semrush ha incorporat funcionalitats de seguiment d’AI Overviews que mostren per a quines de les teves keywords apareixen respostes generatives i si el teu domini és citat.

Mètriques clau a rastrejar

Les mètriques fonamentals per avaluar la teva citabilitat són: la taxa de citació (percentatge de consultes on el teu domini apareix com a font), la quota de veu generativa (la teva presència enfront dels competidors en respostes d’IA), el trànsit referit des de motors generatius (identificable a Analytics pels dominis referrers com perplexity.ai o chatgpt.com), i l’evolució temporal d’aquestes mètriques.

L’objectiu no és assolir un nombre absolut, sinó establir una línia base i demostrar progrés. En un mercat on la majoria de competidors en català encara no monitoritzen la seva visibilitat en IA, simplement mesurar ja dona un avantatge analític real. Per a un desglossament complet de mètriques i eines, consulta la nostra guia de mètriques GEO per mesurar visibilitat en IA.

Com fer que el teu contingut sigui citat per AI Overviews?

Perquè AI Overviews citi el teu contingut, inclou dades específiques amb fonts verificables, estructura la informació amb schema.org, escriu passatges autocontinguts de 40-60 paraules que responguin directament a preguntes freqüents, i reforça la teva autoritat temàtica (E-E-A-T) amb autor identificat i fonts externes de qualitat.

Preguntes freqüents sobre contingut citable AI Overviews

Quina llargada ha de tenir un passatge citable?

Els passatges més citats pels motors d'IA tenen entre 40 i 60 paraules. Són prou concisos per inserir-se en una resposta generada i prou complets per aportar valor sense context addicional.

AI Overviews ja funciona a Catalunya?

Sí. Google va llançar AI Overviews a Espanya (incloent Catalunya) al març de 2025, sota el nom 'Vistes Creades amb IA'. Segons dades de Semrush (abril-juliol 2025), apareix en aproximadament un 14-16% dels SERPs d'escriptori a Google.es, amb predomini en cerques informacionals (~88% dels casos).

Les imatges poden ser citades per AI Overviews?

Sí. AI Overviews pot incloure imatges amb la seva respectiva atribució. Les imatges amb alt text descriptiu, context en caption i dades estructurades ImageObject tenen major probabilitat de ser seleccionades.