Què són les dades estructurades i per què importen ara més que mai
Schema.org va néixer el 2011 com un vocabulari estandarditzat per ajudar Google, Microsoft, Yahoo i Yandex a entendre el contingut web. La idea original era simple: en lloc que els cercadors infereixin el significat d’una pàgina, l’autor l’explica de manera explícita. Quinze anys després, l’aparició dels motors d’IA generativa ha transformat schema.org en un component molt més estratègic del que els seus creadors probablement van imaginar.
Quan GPT-4, Claude o Gemini processa una pàgina web, no la llegeix com un humà. El model analitza l’estructura del document, identifica entitats, relacions i atributs, i decideix quins fragments incorporar a la resposta. Sense schema.org, el model ha d’inferir tota la informació a partir del text pla, amb un marge d’error. Amb schema.org, disposa d’anotacions explícites que redueixen l’ambiguitat i augmenten la confiança del model en la font.
Segons estudis del sector sobre Generative Engine Optimization, les pàgines que implementen dades estructurades mostren una precisió significativament superior en les respostes dels motors generatius que les citen, comparades amb pàgines sense cap tipus de marcatge schema. La diferència és substancial: les dades estructurades són un factor determinant en la qualitat amb que els motors generatius interpreten i citen contingut.
Per a les empreses catalanes i espanyoles, aquesta dada té implicacions directes. El mercat de contingut en català i castella presenta un nivell d’implementació de schema.org significativament inferior al del mercat anglosaxó. Segons la nostra anàlisi interna amb Screaming Frog (2025–2026) sobre mostres de dominis .cat i .es, una proporció molt baixa de les pàgines comercials en català implementen marcatge schema més enllà del bàsic Organization. Això genera una bretxa d’oportunitat: les empreses que adoptin dades estructurades avançades estaran en una posició privilegiada per ser citades per motors d’IA. Per comprendre el context complet d’aquesta transformació, consulta la nostra guia completa sobre GEO i optimització per a motors generatius.
Tipus de schema.org més rellevants per a GEO
No tots els tipus de schema.org tenen el mateix impacte en la visibilitat dins dels motors generatius. La investigació disponible i l’experiència pràctica permeten identificar quins marcatges ofereixen el retorn més alt en termes de citabilitat per part de models d’IA.
FAQPage: el tipus amb major impacte GEO
El marcatge FAQPage és, segons múltiples anàlisis, el tipus de schema amb major correlació amb la citació en respostes d’IA generativa. La raó és estructural: una FAQ proporciona parells pregunta-resposta autocontinguts que un model de llenguatge pot extreure i incorporar directament a les seves respostes sense necessitat de reelaborar el contingut.
Quan implementes FAQPage schema, estàs proporcionant al motor d’IA fragments de text ja formats com a respostes. Si un usuari pregunta a ChatGPT o Perplexity una qüestió que coincideix amb una de les teves FAQs, el model pot seleccionar la teva resposta com a font directa. Segons dades d’anàlisis de visibilitat, les pàgines amb FAQPage schema tenen entre 2 i 3 vegades més probabilitat d’aparèixer com a font citada en respostes de Perplexity que pàgines equivalents sense aquest marcatge.
Article i NewsArticle
El marcatge Article proporciona informació crítica sobre autoria, data de publicació, data de modificació i organització editora. Aquests atributs són fonamentals per als motors generatius perquè els permeten avaluar la frescor i l’autoritat del contingut. Un article amb datePublished recent, un autor identificat amb schema Person i una organització verificable amb schema Organization transmet senyals de confiança que els LLMs utilitzen en el seu procés de selecció de fonts.
HowTo i pas a pas
El marcatge HowTo estructura contingut instruccional en passos seqüencials clars. Els motors generatius processen molt bé aquest tipus de contingut perquè les respostes a consultes del tipus “com fer…” requereixen exactament aquesta estructura. Implementar HowTo schema facilita que el model extregui els passos de manera ordenada i els presenti com a part de la seva resposta.
Organization i LocalBusiness
Per a empreses que volen ser reconegudes com a entitats autoritzades, el marcatge Organization i LocalBusiness proporciona informació verificable sobre nom, adreça, telèfon, àrea de servei i altres atributs que els motors generatius utilitzen per validar la identitat i l’autoritat d’una font. Especialment per a negocis locals a Catalunya, el marcatge LocalBusiness amb coordenades geogràfiques, horaris i àrea de servei és fonamental per aparèixer en consultes locals processades per IA. Per a més detalls sobre GEO local, consulta la nostra guia sobre GEO per a negocis locals a Catalunya.
Review i AggregateRating
Les valoracions estructurades amb schema Review i AggregateRating proporcionen als motors generatius dades quantificables sobre la qualitat percebuda d’un producte, servei o empresa. Quan Perplexity o ChatGPT responen consultes com “millor agència SEO a Barcelona”, els aggregateRating de les pàgines rastreiades influeixen en quines empreses es mencionen i amb quin grau de recomanació.
JSON-LD: el format preferit per als motors generatius
Existeixen tres formats per implementar dades estructurades: JSON-LD, Microdata i RDFa. De tots tres, JSON-LD (JavaScript Object Notation for Linked Data) és el format recomanat tant per Google com per la comunitat tècnica, i és també el que els motors generatius processen de manera més eficient.
L’avantatge principal de JSON-LD és que se separa completament del codi HTML visible. S’insereix com un bloc <script type="application/ld+json"> dins del <head> de la pàgina, sense modificar l’estructura del DOM ni afectar l’experiència visual de l’usuari. Aquesta separació té conseqüències pràctiques importants: implementar o modificar schema.org amb JSON-LD no requereix canvis en el disseny ni en el contingut visible de la pàgina.
Per als equips de desenvolupament que treballen amb Astro, React o altres frameworks moderns, JSON-LD s’integra de manera nativa. En el cas d’Astro, per exemple, es pot crear un component dedicat que rebi les propietats de l’esquema com a props i generi el bloc JSON-LD durant el procés de build, garantint que cada pàgina tingui el marcatge adequat sense intervenció manual.
Un exemple bàsic de marcatge Article en JSON-LD per a un recurs GEO en català seria el següent: l’objecte @context apunta a schema.org, el @type indica Article, headline contindria el títol de l’article, author referenciaria un objecte Person amb el nom de l’autor, datePublished la data de publicació en format ISO 8601, publisher l’organització editora, i inLanguage el codi de llengua “ca” per indicar que el contingut és en català. Aquesta estructura permet als motors generatius identificar immediatament de què tracta el contingut, qui l’ha escrit, quan es va publicar i en quina llengua està redactat.
La clau és que els motors d’IA no només llegeixen el text visible d’una pàgina: també processen les metadades estructurades. Un contingut amb JSON-LD complet proporciona al model una representació rica i desambiguada del document, reduint la probabilitat d’errors en la citació i augmentant la confiança del model en utilitzar-lo com a font.
Com els motors generatius utilitzen schema.org
Comprendre el mecanisme pel qual els motors d’IA generativa processen les dades estructurades és essencial per optimitzar la implementació. El procés segueix un patró definit que pot dividir-se en tres fases diferenciades.
Fase de rastreig i extracció
Durant el rastreig, els bots dels motors generatius (GoogleBot per a AI Overviews, PerplexityBot per a Perplexity, i els crawlers de Bing per a ChatGPT) processen tant el contingut visible com els blocs JSON-LD. Les dades estructurades s’extreuen i s’indexen de manera separada al contingut textual, creant una representació dual del document: el text per a comprensió semàntica i l’esquema per a comprensió estructural.
Fase de validació i confiança
Quan el motor generatiu avalua una pàgina com a candidata per a citació, les dades estructurades funcionen com a mecanisme de validació. Si una pàgina afirma, en el seu text, que va ser escrita per un expert amb 15 anys d’experiència, però no té cap marcatge Person amb credencials verificables, el motor té menys confiança en aquesta afirmació. En canvi, si l’autoria està corroborada amb schema Person enllacat a un perfil verificable, la confiança augmenta.
Segons investigacions del sector sobre l’impacte de les dades estructurades en respostes d’IA, les pàgines amb marcatge coherent (on el schema coincideix amb el contingut visible) reben un percentatge significativament superior de citacions que les pàgines on el schema és incomplert o incoherent amb el text. Això subratlla la importància de mantenir la coherència entre el contingut visible i les metadades estructurades.
Fase de citació i presentació
En el moment de generar la resposta, el motor d’IA utilitza les dades estructurades per formatar la citació. Si una pàgina té marcatge Article amb un headline clar, el motor pot presentar la citació amb el títol de l’article. Si té marcatge Organization, pot incloure el nom de l’empresa com a font. Si té AggregateRating, pot mencionar la valoració mitjana. Les dades estructurades no només influeixen en si ets citat, sinó també en com ets citat.
Implementació pràctica: pas a pas per a webs catalanes
La implementació de schema.org per a GEO segueix un procés sistemàtic que qualsevol equip tècnic pot abordar, des de desenvolupadors experimentats fins a responsables de marketing amb coneixements bàsics de HTML.
Pas 1: Auditoria de l’estat actual
El primer pas és avaluar quines dades estructurades ja té la teva web. Eines com el Rich Results Test de Google, Schema Markup Validator o Screaming Frog permeten rastrejar el teu lloc i identificar quines pàgines tenen schema, quins tipus estan implementats i quins errors existeixen. Per a webs en català, és especialment important verificar que l’atribut inLanguage estigui configurat correctament com a “ca”.
Pas 2: Definició de l’estratègia de marcatge
No totes les pàgines necessiten el mateix tipus de schema. La recomanació és seguir aquesta priorització per a una estratègia GEO:
Primer, implementar Organization o LocalBusiness a la pàgina principal i a les pàgines de contacte. Segon, afegir Article o BlogPosting a totes les publicacions de contingut. Tercer, implementar FAQPage a totes les pàgines que continguin preguntes i respostes. Quart, afegir HowTo a les guies pas a pas. Cinquè, implementar BreadcrumbList per a la navegació. I sisè, considerar Product, Service o Review segons el tipus de negoci.
Pas 3: Implementació amb JSON-LD
La implementació més eficient utilitza components reutilitzables. En un projecte Astro, per exemple, es poden crear components com AuraArticleSchema, AuraFAQSchema o AuraOrganizationSchema que reben les propietats necessàries i generen el JSON-LD corresponent. Aquest enfocament garanteix coherència en tota la web i facilita el manteniment.
Pas 4: Validació i monitoratge
Després d’implementar, cal validar que el marcatge és correcte i monitoritzar-ne l’impacte. El Rich Results Test de Google verifica la sintaxi i l’elegibilitat per a resultats enriquits. Per mesurar l’impacte en GEO, cal monitoritzar les citacions del teu domini en motors generatius utilitzant eines com Otterly.ai o Profound. Per a més informació sobre mètriques de seguiment, consulta la guia sobre mètriques GEO per mesurar visibilitat en IA.
Errors comuns en la implementació de schema per a GEO
L’experiència amb projectes d’implementació de dades estructurades a Catalunya i Espanya revela una sèrie d’errors recurrents que redueixen l’eficàcia del marcatge tant per a SEO com per a GEO.
Marcatge incomplet o parcial
L’error més freqüent és implementar schema amb els camps mínims obligatoris sense aprofitar els atributs opcionals que aporten valor als motors generatius. Un marcatge Article només amb @type i headline és tècnicament vàlid, però no proporciona al motor d’IA la informació que necessita per avaluar l’autoritat del contingut. Afegir author, datePublished, dateModified, publisher, inLanguage i description multiplica l’eficàcia del marcatge.
Incoherència entre schema i contingut visible
Si el schema indica que l’autor és “Joan Garcia” però la pàgina no mostra cap menció d’aquest autor, els motors generatius detecten la incoherència i redueixen la confiança en la font. El marcatge ha de reflectir fidelment el que és visible a la pàgina. Aquesta coherència és un senyal de qualitat que els LLMs ponderen en el seu procés de selecció de fonts.
Abús dels marcatges no rellevants
Afegir tipus de schema que no corresponen al contingut real de la pàgina és una pràctica que pot perjudicar tant el SEO com el GEO. Per exemple, implementar Review schema en una pàgina que no conté cap ressenya o Product schema en una pàgina purament informativa genera senyals confusos que els motors generatius interpreten com a falta de fiabilitat.
Oblidar el marcatge en català
Per a webs en català, cal que l’atribut inLanguage estigui configurat com a “ca” i no com a “es” o “ca-ES”. Aquesta distinció ajuda els motors generatius a servir el contingut correcte quan un usuari formula consultes en català. Amb la creixent capacitat dels LLMs per processar contingut en català, assegurar la correcta identificació de la llengua maximitza les oportunitats de citació.
Schema.org i E-E-A-T: la connexió que potencia el GEO
Les dades estructurades i els criteris E-E-A-T (Experiència, Perícia, Autoritat, Confiança) estan intricament connectats en l’ecosistema GEO. Schema.org proporciona el mecanisme tècnic per comunicar els senyals E-E-A-T de manera explícita als motors d’IA generativa.
L’Experiència es pot demostrar amb marcatge Person que inclogui informació sobre trajectòria professional, certificacions i especialitzacions. La Perícia es reforça amb marcatge Article que inclogui datePublished (demostrant actualització) i references (citant fonts autoritzades). L’Autoritat es comunica amb Organization schema que vinculi l’empresa amb premis, certificacions sectorials i àrees d’especialització. I la Confiança es reforça amb marcatge transparent que inclogui polítiques, dades de contacte verificables i vincles a perfils professionals.
Segons anàlisis de correlació entre senyals E-E-A-T estructurats i citacions en motors generatius, les pàgines que combinen contingut d’alta qualitat amb dades estructurades E-E-A-T completes tenen significativament més probabilitat de ser citades per motors com Perplexity en consultes YMYL (Your Money, Your Life) que les pàgines amb contingut equivalent però sense marcatge E-E-A-T. Per aprofundir en aquest tema, consulta la nostra guia sobre com optimitzar E-E-A-T per a IA generativa.
Per a les empreses catalanes, especialment aquelles que operen en sectors regulats com la salut, les finances o els serveis legals, implementar dades estructurades E-E-A-T no és opcional: és un requisit per competir en el nou ecosistema de cerca generativa.
Estratègia d’implementació per a empreses a Catalunya
Dissenyar una estratègia d’implementació de schema.org per a GEO adaptada al context català requereix considerar factors específics del mercat local, la infraestructura tècnica habitual i els objectius de negoci.
Priorització per tipus d’empresa
Per a empreses de serveis professionals (advocats, consultors, agències), la prioritat és implementar Organization, LocalBusiness, ProfessionalService i Person schema per a cada professional de l’equip. Per a ecommerce, la prioritat són Product, Offer, AggregateRating i BreadcrumbList. Per a mitjans de comunicació i blogs, Article, NewsArticle, FAQPage i Author schema són prioritaris.
Integració amb l’ecosistema tècnic local
Moltes empreses catalanes utilitzen plataformes com WordPress (amb plugins com Rank Math o Yoast que faciliten la implementació de schema), Shopify, PrestaShop o solucions a mida. L’estratègia d’implementació ha d’adaptar-se a la plataforma tècnica existent. Per a projectes amb frameworks moderns com Astro, Next.js o Nuxt, la implementació via components reutilitzables és l’enfocament més eficient.
Monitoratge i iteració
La implementació de schema per a GEO no és un projecte puntual: és un procés continu. Les necessitats dels motors generatius evolucionen, nous tipus de schema apareixen, i l’estratègia ha d’adaptar-se. Es recomanable establir un cicle trimestral de revisió que inclogui auditoria del marcatge existent, anàlisi de noves oportunitats de schema, verificació de la coherència amb el contingut actualitzat i mesurament de l’impacte en citacions de motors d’IA.
Conclusions i pròxims passos
Schema.org ha passat de ser una eina opcional de SEO tècnic a un component central de qualsevol estratègia de visibilitat digital. En l’era dels motors generatius, les dades estructurades actuen com el pont que connecta el contingut web amb la capacitat dels models d’IA per comprendre’l, validar-lo i citar-lo.
Per a les empreses catalanes, l’oportunitat és clara: el nivell d’adopció de schema.org avançat al mercat local és baix, cosa que significa que una implementació completa i estratègica pot generar un avantatge competitiu significatiu en citacions de motors d’IA. La combinació de contingut de qualitat en català amb dades estructurades robustes posiciona les empreses com a fonts autoritzades en un ecosistema on la competència és encara limitada.
Els passos immediats: auditar l’estat actual del marcatge, prioritzar els tipus de schema segons el negoci, implementar JSON-LD de manera sistemàtica, validar la coherència amb el contingut visible i mesurar l’impacte en citacions de motors d’IA. Amb una implementació ben executada, schema.org passa de ser un ítem de checklist a ser l’aliat tècnic que amplifica totes les altres accions GEO del hub central de GEO.