Saltar al contingut principal
SEO 9 min

SEO programàtic: escalar pàgines amb plantilles | Ighenatt

Airbnb genera milions de pàgines amb plantilles i dades úniques. Aprèn el framework del SEO programàtic per escalar sense que l'HCU de Google ho penalitzi.

EG

Elu Gonzalez

Autor

Airbnb no té un equip de redactors escrivint pàgines sobre “cases de fusta als Alps austríacs” o “apartaments amb terrassa a l’Eixample de Barcelona”. Aquestes pàgines existeixen perquè hi ha una plantilla, un dataset i un motor que els combina automàticament. El resultat, multiplicat per milions de combinacions geogràfiques i de tipus d’allotjament, és un dels projectes de SEO programàtic més exitosos documentats: trànsit orgànic que cap equip editorial podria generar de forma manual.

El SEO programàtic no és nou. El que sí ha canviat des de l’actualització de Contingut Útil (HCU) de setembre de 2023 és el cost de l’error. Abans de l’HCU, un projecte de 50.000 pàgines thin podia generar trànsit modest amb un impacte limitat en la resta del domini. Després de l’HCU, Google aplica un senyal a nivell de lloc: si el percentatge de pàgines “unhelpful” supera un llindar, les pàgines de qualitat del mateix domini també perden visibilitat. El SEO programàtic del 2026 es juga amb regles més exigents: més dades úniques, menys text variable, validació de demanda abans de generar.

Què és el SEO programàtic (i què no és)

El SEO programàtic és la metodologia de crear pàgines web a escala combinant plantilles amb dades estructurades. La plantilla defineix l’estructura visual i el marc textual; el dataset aporta les dades variables que fan única cada pàgina. Cada fila del dataset produeix una URL independent que respon a una consulta de cerca específica.

El que distingeix el SEO programàtic de l‘“spam de pàgines auto-generades” que Google penalitza no és la tecnologia sinó la utilitat del resultat. Google prohibeix explícitament en les seves polítiques el contingut “generated primarily to manipulate search rankings” —text produït massivament sense valor per a l’usuari, on el template és el 95% del contingut i les dades variables són el nom d’una ciutat. Això no és SEO programàtic: és keyword stuffing a escala.

El SEO programàtic legítim produeix pàgines amb dades úniques i verificables per fila del dataset. Per a Airbnb: preu mitjà de la zona, disponibilitat real de l’inventari, valoracions verificades d’hostes. Per a Zapier: instruccions funcionals pas a pas per configurar la integració entre dues aplicacions específiques, amb casos d’ús reals. Per a un portal immobiliari espanyol com Idealista: preu per metre quadrat al barri, historial de variació de preus, nombre de propietats disponibles. Cada dada és funcional: l’usuari pot prendre una decisió amb ella sense sortir de la pàgina.

La distinció pràctica per saber si el teu projecte és SEO programàtic o spam: si elimines les dades variables i només queda el template, té valor la pàgina? Si la resposta és sí perquè el text informatiu és substancial, pot funcionar. Si la resposta és no perquè sense les dades la pàgina és un esquelet buit, el projecte depèn completament de la qualitat d’aquestes dades.

Empreses que ho fan bé: Airbnb, Zapier i Idealista

Els tres casos de referència comparteixen el mateix patró: un dataset amb dades reals i actualitzades, una plantilla que els presenta en format funcional i una estratègia d’URL que captura consultes de long tail específiques.

Zapier va construir aproximadament 75.000 pàgines d’integració, cadascuna descrivint com connectar dues aplicacions específiques: “Connectar Slack amb Google Sheets”, “Automatitzar Trello amb Gmail”, i desenes de milers de combinacions més. Cada pàgina conté instruccions funcionals reals: triggers disponibles, accions possibles, passos de configuració, casos d’ús documentats. El format és sempre el mateix (la plantilla); les dades són sempre úniques (les especificacions tècniques de cada integració). Segons anàlisi d’Ahrefs, aquestes pàgines representen la major part dels més de 4 milions de visites orgàniques mensuals que Zapier genera.

Airbnb opera a una escala diferent: milions de pàgines que combinen tipus d’allotjament, nombre d’hostes, característiques (amb piscina, a prop de l’aeroport, pet-friendly) i ubicació geogràfica. El senyal de “helpfulness” que salva aquestes pàgines del filtre HCU és la dada en temps real: disponibilitat real, preus actualitzats, valoracions verificades d’usuaris que hi han estat. Sense aquestes dades dinàmiques, les pàgines serien idèntiques excepte pel nom del lloc.

A Espanya, Idealista aplica el mateix model al sector immobiliari: pàgines de /[tipus-immoble]/[ciutat]/[barri]/ amb preu mitjà per metre quadrat actualitzat, nombre de propietats disponibles i filtres de cerca funcionals. La combinació de dades pròpies del mercat + plantilla estructurada + URL semàntica és el patró que genera trànsit per a cerques com “pisos en venda a Gràcia Barcelona” sense necessitat de redacció manual.

El dataset com a avantatge competitiu

El dataset és l’actiu diferencial del SEO programàtic. No és el template, que pot copiar-se; no és l’arquitectura URL, que pot replicar-se. És la font de dades única que cap competidor pot duplicar exactament amb la mateixa qualitat i actualització.

Els tipus de datasets més efectius per al SEO programàtic es divideixen en tres categories. Les dades pròpies de negoci: inventari de productes amb preus, disponibilitat i especificacions tècniques; historial de serveis prestats amb resultats verificables; dades operatives pròpies. Són les més valuoses perquè només tu les tens.

Les dades de tercers amb llicència: APIs de preus de mercat (immobiliari, financer, viatges), dades governamentals obertes (estadístiques d’ocupació, dades d’empreses registrades), bases de dades de referència sectorials. Són accessibles per a qui pagui la llicència, cosa que redueix l’avantatge competitiu però manté la qualitat de la dada.

Les dades de co-creació: contingut generat per usuaris (valoracions, preguntes freqüents verificades, testimonis), dades d’ús de producte. Requereixen una comunitat activa però són d’alta qualitat i difícils de replicar.

L’error més freqüent en projectes programàtics fallits és usar text variable com a substitut de dades reals. Canviar “La ciutat de Barcelona té una gran demanda immobiliària” per “La ciutat de Madrid té una gran demanda immobiliària” en 50 pàgines de ciutats no produeix dades úniques: produeix 50 variacions de la mateixa afirmació genèrica. Google ho detecta amb senyals d’engagement: si els usuaris de totes les ciutats abandonen la pàgina en els mateixos 8 segons sense interacció, el senyal de qualitat del contingut és idèntic en totes elles.

HCU: quan Google premia i quan penalitza el contingut programàtic

L’actualització de Contingut Útil de setembre de 2023 i els seus reforços posteriors han establert dues categories de resposta per al SEO programàtic. Els projectes que van sobreviure o créixer tenen en comú dades úniques per pàgina, profunditat funcional (l’usuari pot completar una tasca), senyals d’E-E-A-T verificables i demanda real documentada per a cada combinació. Els projectes que van perdre trànsit massivament tenien en comú text variable sense dades reals, combinacions sense volum de cerca, i zero senyals d’experiència o autoritat.

El senyal de domini és el mecanisme més perillós per a projectes programàtics. Google no tan sols avalua pàgina per pàgina: avalua la proporció de pàgines “helpful” en el domini complet. Un lloc que genera 100.000 pàgines thin i té 10 articles de blog d’alta qualitat pot veure aquestes 10 pàgines de qualitat perdre posicions per la contaminació de les 100.000 pàgines deficients. Aquest mecanisme, documentat al blog de Google Search Central, explica per què projectes programàtics mal executats poden perjudicar el SEO de contingut preexistent de bona qualitat.

L’estratègia de mitigació és el noindex selectiu: abans de llançar totes les pàgines programàtiques com a indexables, publicar-les amb <meta name="robots" content="noindex"> i monitorar durant 4-8 setmanes quines reben trànsit orgànic real (visible a Search Console fins i tot amb noindex). Les combinacions amb zero impressions en aquest període són candidates a eliminar-se del sitemap o mantenir-se permanentment en noindex.

Implementació tècnica: del dataset a la URL indexada

L’arquitectura tècnica d’un projecte programàtic té quatre capes que han de funcionar correctament de forma coordinada.

La primera és el dataset: la font de dades en format JSON, CSV o base de dades relacional. Cada fila correspon a una pàgina. Els camps mínims són: slug (per a la URL), títol, dades variables úniques, i metadades SEO (descripció, imatge). El dataset ha de tenir mecanismes d’actualització: dades estàtiques que no s’actualitzen generen pàgines que perden rellevància.

La segona és el motor de plantilles. Per a projectes amb Astro (com aquest lloc), getStaticPaths() consumeix el dataset i genera una ruta per fila, amb el slugificat correcte i trailing slash. La plantilla defineix l’estructura que rep les dades del dataset com a props. La separació clara entre dades i presentació és fonamental: si modifiques la plantilla, totes les pàgines es regeneren automàticament amb el nou disseny.

La tercera és l’estructura d’URLs. El patró /[tipus]/[modificador]/ és el més estès per a projectes programàtics. Les URLs han de ser semàntiques, descriptives i evitar paràmetres de consulta per a pàgines indexables. El canonical ha d’auto-generar-se per a cada pàgina apuntant a si mateixa, evitant duplicats si la mateixa combinació de dades pot accedir-se per múltiples rutes.

La quarta és el sitemap segmentat. Per a projectes amb més de 10.000 URLs, un sol sitemap no és eficient. L’estructura recomanada és un sitemap index amb sitemaps fills per tipus de pàgina (p. ex.: sitemap-ciudades.xml, sitemap-servicios.xml), cadascun amb màxim 50.000 URLs. Els sitemaps s’han d’actualitzar automàticament amb cada build o deploy.

Per al projecte Ighenatt, aquesta arquitectura ja està implementada a les pàgines d’arquitectura web i SEO estructural que generem per a les 49 ciutats i 10 serveis combinats. El mateix patró és extensible a qualsevol dataset de dades pròpies.

Validar la demanda i mesurar l’èxit

L’error més evitable en el SEO programàtic és generar pàgines per a combinacions sense volum de cerca. Abans de llançar el projecte, la validació de demanda és el filtre de qualitat més important: per a cada combinació [tipus] + [modificador] del dataset, verificar a Ahrefs, Google Keyword Planner o Google Trends si existeix volum de cerca real.

El llindar mínim depèn de l’escala del projecte. Per a projectes que generen 500-2.000 pàgines, un volum de 50 cerques mensuals per combinació és suficient. Per a projectes que generen més de 10.000 pàgines, fins i tot 10 cerques mensuals per combinació poden ser rendibles si el cost de generació és baix. Per a projectes que generen més de 100.000 pàgines, la validació és especialment crítica: les combinacions amb volum zero activen el senyal HCU de domini.

Les mètriques d’èxit per a un projecte programàtic van més enllà del trànsit agregat. Les més importants són: taxa d’indexació (pàgines generades vs. pàgines indexades a Search Console), rànquing per template (posició mitjana de totes les pàgines del mateix tipus), senyals d’engagement per col·lecció (temps a la pàgina, taxa de rebot, esdeveniments de conversió), i l’evolució del crawl budget (peticions de Googlebot als registres dividides entre el nombre de pàgines generades).

El content pruning aplicat al SEO programàtic significa revisar trimestralment la taxa d’indexació per col·lecció i eliminar o consolidar les pàgines que porten més de 90 dies sense impressions a Search Console. Un projecte programàtic ben mantingut no tan sols creix; també poda activament les combinacions que no funcionen per protegir el senyal de qualitat del domini.

La connexió amb l’Entity SEO tanca el cercle: les pàgines programàtiques d’alta qualitat són les que els bots de recuperació de LLMs prioritzen per citar-les com a fonts en cerques específiques. Dades úniques + estructura clara + entitat reconeguda = la fórmula de citabilitat per al 2026. I abans de publicar aquell contingut a escala, la recerca de paraules clau amb mètode determina exactament quines combinacions del dataset tenen demanda real abans de generar ni una sola URL.

Comparteix aquest article

Si t'ha resultat útil aquest contingut, comparteix-lo amb els teus col·legues.

Twitter LinkedIn

Preguntes Freqüents

¿Con qué frecuencia publican contenido nuevo?

Publicamos artículos nuevos semanalmente, enfocados en las últimas tendencias de SEO técnico, casos de estudio reales y mejores prácticas. Suscríbete a nuestro newsletter para no perderte ninguna actualización.

¿Los consejos son aplicables a cualquier tipo de sitio web?

Nuestros consejos se adaptan a diferentes tipos de sitios: ecommerce, blogs, sitios corporativos y aplicaciones web. Siempre indicamos cuándo una técnica es específica para cierto tipo de sitio o requerimientos técnicos.

¿Puedo implementar estas técnicas yo mismo?

Muchas técnicas básicas puedes implementarlas tú mismo siguiendo nuestras guías paso a paso. Para optimizaciones avanzadas o auditorías completas, recomendamos consultar con especialistas en SEO técnico como nuestro equipo.

¿Ofrecen servicios de consultoría personalizada?

Sí, ofrecemos servicios de consultoría SEO técnica personalizada, auditorías completas y optimización integral. Contáctanos para discutir las necesidades específicas de tu proyecto y cómo podemos ayudarte.

Mantén-te actualitzat

Rep al teu email els últims articles, consells i estratègies sobre SEO, rendiment web i màrqueting digital.

Enviem un butlletí cada setmana, i pots donar-te de baixa en qualsevol moment.

Tags: #SEO programàtic #pàgines programàtiques #plantilles SEO #Helpful Content Update #escalar contingut SEO #long tail programàtic #dataset SEO #thin content penalització
EG

Elu Gonzalez

Expert SEO & Optimització Web