Resumen El presente artículo lleva a cabo una revisión sistematizada sobre el concepto SEO semántico y búsquedas semánticas, para configurar un framework de trabajo aplicado a sitios intensivos en contenido. Se pretende crear un procedimiento de trabajo capaz de ayudar a posicionar contenido web en los buscadores de manera enriquecida (semántica). Se revisa de forma teórica los principales elementos que caracterizan el SEO semántico: el gráfico de conocimiento, el algoritmo colibrí, el RankBrain, el LSI (Indexación Semántica latente), y los datos estructurados. Seguidamente se analizan las diferentes búsquedas semánticas que se reproducen en índice de Google, y se estudia la iniciativa Schema.org cómo el marcador semántico estandarizado por los principales motores de búsqueda. Finalmente estos elementos se configuran como componentes propios del Framework Integral de SEO Semántico (por sus siglas ISS).
Palabras clave SEO semántico, entidades, búsquedas semánticas, Google, Optimización en motores de búsqueda, Marcado semántico, sitios intensivos en contenido.
Semantic SEO: ISS Framework for content-intensive web sites optimization
Abstract This article carries out a systematic review of the concept of semantic SEO and semantic searches, to configure a framework of work applied to content-intensive sites. It is intended to create a working procedure capable of helping to position web content in search engines in an enriched way (semantics). The main elements that characterize semantic SEO are theoretically reviewed: the knowledge graph, the hummingbird algorithm, the RankBrain, the LSI (latent Semantic Indexation), and the structured data. Next, the different semantic searches that are reproduced in Google’s index are analyzed, and the Schema.org initiative is studied as the semantic marker standardized by the main search engines. Finally, these elements are configured as components of the Integral Framework of Semantic SEO (ISS).
Keywords Semantic SEO, entities, semantic searches, Google, search engine optimization, semantic markup, content intensive sites.
Introducción
El objeto de estudio de este trabajo es el concepto de SEO semántico y cómo afecta a los resultados de búsqueda. Se analizan los principales elementos que intervienen en el SEO semántico: Gráfico de conocimiento, algoritmo colibrí, RankBrain, LSI, Datos estructurados y Schema.org.
La motivación principal para este trabajo es explorar las posibilidades de desarrollar una propuesta de trabajo, o Framework, de optimización de SEO semántico para sitios intensivos en contenido, para lo cual hemos adoptado ejemplos de sitios vinculados con el sector educativo.
Los objetivos de este informe son:
- Caracterizar el SEO semántico e identificar sus principales componentes.
- Determinar cómo afectan los componentes del SEO semántico a los resultados de búsqueda.
- Proponer un Framework de optimización de SEO semántico que pueda ser aplicable a sitios intensivos en contenidos.
De acuerdo con estos objetivos principales, las preguntas de investigación son las siguientes:
- ¿Es posible identificar el SEO semántico como una nueva tendencia en el posicionamiento web?
- En caso de respuesta afirmativa del punto anterior, ¿es factible caracterizar esta tendencia e identificar sus componentes principales de un modo operativo?
- En caso de respuesta afirmativa del punto anterior, ¿es factible proponer un framework aplicable a sitios intensivos en contenido?
Para poder presentar una respuesta a las tres preguntas anteriores, la metodología utilizada ha consistido en aplicar una revisión sistematizada (Hart, 2008; Booth et al., 2012), de acuerdo con la cual se ha procedido a identificar primero el grupo de fuentes de información cualificadas, después se ha procedido a crear un banco de documentos sobre el tema, como tercer paso se ha llevado cabo una operación de análisis de las referencias seleccionadas y finalmente, hemos procedido a presentar los resultados en forma de la síntesis narrativa crítica que seguirá a continuación y que constituye el grueso de este trabajo.
Para la selección de los documentos hemos utilizado las bases de datos Scopus y Web of Science, cuyos resultados se han completado con el uso de Google Scholar, además hemos utilizado informes y trabajos producidos por organismos y actores de la máxima importancia en este ámbito, por ejemplo, hemos utilizado documentación oficial de buscadores como Google.
En el anexo se indican las ecuaciones utilizadas para las búsquedas en las bases de datos y en Google Scholar y las fuentes adicionales consultadas.
Para el análisis de los ítems que han formado el banco de documentos (ver bibliografía) de esta revisión hemos utilizado este esquema de análisis (Hart, 2008):
- ¿Cuáles son las teorías y conceptos clave en el ámbito considerado?
- ¿Cuáles son las principales bases ontológicas y epistemológicas de la disciplina?
- ¿Cuáles son los temas y debates principales sobre el ámbito de estudio?
- ¿Cuáles son los principales problemas abordados por la disciplina?
- ¿Cómo se estructuran y organizan los conocimientos sobre la disciplina?
- ¿Qué huecos u oportunidades de investigación ofrece el ámbito analizadas
Con este motivo, se realiza un breve recorrido por la historia de este concepto, prestando especial atención a los elementos que lo conforman: gráfico de conocimiento (knowledge graph), algoritmo Colibrí, Rankbrain, Latent Semantic Indexing (LSI), y datos estructurados (Chong, 2017; Google, 2012, 2012a, 2012b, 2018, 2018a, 2018b).
Adicionalmente, se han realizado repetidas pruebas de búsqueda con diferentes palabras clave con el fin de analizar las páginas de resultados, y se ha llevado a cabo un registro sistemático de los diferentes tipos de resultados afectados por el SEO semántico.
Con todo ello pretendemos aportar indicaciones sobre el rol del SEO semántico y cómo afecta a los llamados rich snippets o resultados enriquecidos. Recordemos que el snippet es como se denomina a los fragmentos de información sobre los sitios web que forman parte de las páginas de resultados.
Por tanto, se denominan rich snippets o resultados enriquecidos a los resultados que incorporan elementos adicionales a los resultados estándar. Un resultado enriquecido, por ejemplo, añade iconos o enlaces de navegación al snippet convencional.
Como resultado de esta nueva clase de snippets, las SERPs (Search Engine Result Page) o Páginas de Resultados de los Buscadores están cambiando. Cada vez es más frecuente encontrar resultados de búsqueda más refinados que responden mejor a la intención de búsqueda del usuarios (Codina et al. 2017; Crestodina. 2015).
Estos resultados semánticos están colonizando el así llamado top 10 (los resultados de la primera página), relegando a un segundo plano los resultados clásicos, es decir, aquellos que no se presentan con componentes enriquecidos.
Como resultado las estrategias tradicionales de SEO en cibermedios ya no son del todo válidas si se desea que los motores de búsqueda muestren sus resultados de manera enriquecida. Como cualquier otra clase de sitio web, necesitan marcar los contenidos de manera semántica para que éstas se posicionen de manera más eficiente en las SERPs.
Ante esto, surgen una serie de retos a los que los cibermedios deberán enfrentarse en los próximos años para tener mayor visibilidad:
- Por un lado, la web semántica afecta al trabajo del SEO en general. Por tanto los sitios intensivos en contenido, como una clase más de sitios web, también tendrán que adaptarse también a ellas.
Por otro lado, la web semántica afecta a las representaciones de los resultados de búsqueda, ofreciendo mayor inmediatez y mayor competencia en el escalado de posiciones en los buscadores.
Antecedentes: La web semántica
Tim Berners-Lee, creador de la web y promotor del W3 Consortium (W3C), escribió lo que podría considerarse el ensayo fundacional de la web semántica en mayo de 2001 junto con James Hendler y Ora Lassila (2001).
Por aquel entonces estábamos ante el auge de la web 2.0, una web multidireccional (emisor y receptor podían comunicarse bidireccionalmente) pensada para humanos, pero no para que los ordenadores fueran capaces de entendernos.
Bajo esta premisa, Berners-Lee y el resto de investigadores que publicaron el mencionado trabajo plantearon una web que sería una extensión de la web 2.0 capaz de hacer que un ordenador fuera capaz de entender los contenidos de una forma que imitar el comportamiento inteligente (Codina et al,. 2009; Lacy, 2005).
Para lograrlo, teorizaron sobre la posibilidad de usar un conjunto de lenguajes y protocolos estándar que fueran capaces de añadir metadatos que, a su vez, hicieran explícitos los significados de las páginas web y, al mismo tiempo, pudieran ser interpretados por programas de ordenadores.
La web 2.0 que se caracterizaba por ser un medio de interacción entre documentos y personas, y entre personas y personas, gracias a la web social y la computación en la nube, a la web semántica, un medio en el que los ordenadores podrían entenderse entre ellos utilizando el significado marcado y especificado en las páginas web.
De las ideas originales de Berners- Lee y del proyecto de la web semántica del W3C surgen tres elementos fundamentales que caracterizan a esta nueva web: los lenguajes para la descripción de metadatos, las ontologías, y los agentes de usuario.
Lenguajes para la descripción de metadatos
Los metadatos son un conjunto de lenguajes capaces de estructurar y de describir otros datos (p,e, metadatos para describir una página web) o cualquier elemento que tenga característica de entidad, siendo estas últimas cualquier cosa, literalmente, capaz de ser identificada mediante sus propiedades (Codina et al., 2009).
De este modo, gracias a los metadatos y al uso de programas capaces de procesarlos, las máquinas pueden usar, gestionar, recuperar y buscar recursos online (Berners-Lee et al., 2001). De este modo esta clase de lenguajes son uno de los elementos fundamentales de la web semántica.
Como hemos señalado, se caracterizan por ser información y datos al mismo tiempo, y se encargan de representar y describir de forma explícita los contenidos de los documentos asociados.
Los lenguajes para la descripción de metadatos esenciales de la web semántica son:
- XML -extensible Markup Languaje –
- RDF -resources Description Framework- y
- OWL -Lenguaje de Ontologías Web- (Lacy, 2005).
Probablemente, el modelo de representación de metadatos más utilizado en la web semántica es RDF, sin embargo como este lenguaje tiene ciertas limitaciones suele utilizarse de forma combinada con OWL, con RDF Schema, Skos, y RSS y Atom.
Ontologías, entidades y esquemas
Las ontologías, en el contexto de la web semántica, son esquemas conceptuales para representar entidades del mundo real o simbólico. Estas pueden incluir conceptos y reglas para que los ordenadores sean capaces de realizar razonamientos automáticos a partir de reglas de las reglas de inferencia y de las propiedades y relaciones representada en las ontologías (Codina et al., 2009).
Adicionalmente, las ontologías favorecen la interoperabilidad entre sistemas informáticos con el fin de alcanzar un razonamiento automático, y por tanto conseguir que las máquinas puedan representar el contenido web (Codina et al., 2009).
En el ámbito de la web, el desarrollo principal de las ontologías y otras estructuras relacionadas (como las taxonomías) ha girado en torno al concepto de entidad y, más concretamente, el de tipo de entidad.
Como hemos señalado, las entidades son objetos concretos o abstractos que pueden identificarse y que tienen propiedades. Los tipos de entidad son las clases abstractas que reúnen a entidades que comparten alguna propiedad.
En el caso de los protocolos de trabajo de la web adoptados por los buscadores, el concepto de tipo de entidad se identifica con el concepto de esquema, lo que ha dado lugar a Schema.org que es la estructura del conjunto de esquemas (tipos de entidades) que pueden reconocer los buscadores.
(…)
Acceso al artículo completo:
Bibliografía citada en el artículo
- Berners-Lee, T.; Hendler, J.; Lassila, O. The semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities// Scientific American, (2001). 01-03.
- Berners-Lee. Long live the web//Scientific American, (Dic. 2010).80-85.
- Bing. (2011) Marking up your site: Overview. https://www.bing.com/webmaster/help/marking-up-your-site-with-structured-data-3a93e731 (2018-01-15).
- Booth, Andrew; Papaionnou; Sutton, Anthea (2012). Systematic Approaches to a Successful Literature Review. London: Sage, 2012.
- Brown, Matthew. (2013). 5 Questions About Semantic SEO. https://moz.com/blog/semantic-seo-questions (2018-01-17).
- Briggs, Justin. (2012) Entity Search Results. https://www.briggsby.com/entity-search-results-the-on-going-evolution-of-search/ (2018-01-17).
- Chong, Joanne. (2017). The Ultimate Semantic SEO Guide: How To Do SEO Like An Expert. https://seopressor.com/blog/semantic-seo-guide-how-to-do-seo/ (2018-01-22).
- Codina L, Gonzalo-Penela C, Pedraza-Jiménez R, Rovira C. (2017) Posicionamiento web y medios de comunicación ciclo de vida de una campaña y factores SEO. Barcelona: Serie Digital Digidoc. Proyecto Comunicación Interactiva, 2017.
- Codina L, Iglesias-García M, Pedraza R, García-Carretero L. (2016) Search engine optimization and online journalism: the SEO-WCP framework. Barcelona: Serie Editorial DigiDoc. Active audiences and journalism, 2016.
- Codina,Lluís; Mari-Carmen, Marcos; Pedraza, Rafael (2009). Web semántica y sistemas de información. Ediciones TREA, 2009.
- Crestodina, Andy. (2015). How to Future-Proof Your Search Engine Marketing: 5 Tips for Semantic SEO. https://www.orbitmedia.com/blog/semantic-seo/ (2018-01-22).
- DiSilvestro; Amanda. (2013) Semantic Search Means Semantic CEO: What It Means for you. https://www.highervisibility.com/blog/semantic-search-means-semantic-seo-what-it-means-for-you/ (2018-01-30).
- Doszkocs, Tamas. (2010) Semantic a search engines mean well // Online, 34(2010) 36-42.
- Edward, Tony. (2015). Leveraging Wikidata To Gain A Google Knowledge Graph Result. https://searchengineland.com/leveraging-wikidata-gain-google-knowledge-graph-result-219706 (2018-02-07).
- Enge, Eric. (2015). The Definitive Guide to Google’s Rich Answers. https://www.stonetemple.com/the-growth-of-rich-answers-in-googles-search-results/ (2018-02-30).
- Fiorelli, Gianluca. (2013). Hummingbird Unleashed. https://moz.com/blog/hummingbird-unleashed (2018-02-07).
- Giomelakis, Dimitrios; Veglis, Andreas. (2015). Employing Search Engine Optimization Techniques in Online News Articles// Studies in Media and Communication, ISSN 2325-8071. 3:1 (June, 2015) 22–33. doi:10.11114/smc.v3i1.683
- Giomelakis, Dimitrios; Veglis, Andreas. (2016) Investigating Search Engine Optimization Factors in Media Websites// Digital Journalism. 4:3 (2016) 379-400. DOI: 10.1080/21670811.2015.1046992
- González, Juan. (2016). El Futuro del SEO: ¿Cómo afectarán RankBrain y las búsquedas por voz? http://useo.es/busquedas-voz-rank-brain/ (2018-02-13).
- Google (2018). A reintroduction to Google’s featured snippets. https://www.blog.google/products/search/reintroduction-googles-featured-snippets/ (2018-02-14).
- Google. (2018a) Introduction to Structured Data. https://developers.google.com/search/docs/guides/intro-structured-data#structured-data-guidelines (2018-02-14).
- Google. (2018b) Search Gallery. https://developers.google.com/search/docs/guides/search-gallery (2018-02-14).
- Google. (2012). Introducing the Knowledge Graph: things, not strings. https://googleblog.blogspot.com.es/2012/05/introducing-knowledge-graph-things-not.html (2018-02-15).
- Google. (2012a). Pagina web oficial del Gráfico de Conocimiento de Google. (2018-02-15). https://www.google.es/intl/es/insidesearch/features/search/knowledge.html
- Google. (2012b) Patente: Using concepts as contexts for query term substitutions. https://www.google.com/patents/US9104750 (2018-02-16).
- Hart, Chris (2008). Doing a Literature Review: Releasing the Social Science Research Imagination. London: Sage, 2008.
- Hernández, Chris. (2014). El uso de Knowledge Graph en Google. https://www.adrenalina.es/knowledge-graph-google/ (2018-01-22).
- Hurley, Sam. (2017). Smashing Semantic SEO in 2017 & Beyond: The Ultimate Guide. https://www.digitalcurrent.com/seo-engine-optimization/semantic-seo-guide/ (2018-01-30).
- Kosaka, Kim. (2016). Semantic SEO: How to Change Your Game to Win in Search. https://blog.alexa.com/semantic-seo-how-to-change-your-game-to-win-in-search/ (2018-02-13).
- Lacy, Lee W. (2005). OWL: Representing Information Using the web Ontology Language. Canadá: Ed. Trafford, 2005.
- Mashable. (2012). How Google’s Semantic Search Will Change SEO. https://mashable.com/2012/03/22/google-semantic-search-seo/#whzognAiIGqV (2018-02-14).
- Meyers, Peter. (2016). Posic Ranking #0: SEO for Answers. https://moz.com/blog/ranking-zero-seo-for-answers (2018-01-30).
- Nastic, Roko. (2010). What Is Latent Semantic Indexing. https://www.searchenginejournal.com/what-is-latent-semantic-indexing-seo-defined/21642/ (2018-01-22).
- Nogales, Alberto; Sicilia, Miguel-Angel; Sánchez-Alonso, Salvador; Garcia-Barriocanal, Elena (2015). Linking from Schema.org microdata to the Web of Linked Data: An empirical assessment, Computer Standards & Interfaces// Computer Standards & Interfaces. 45 (Marzo 2016) 90-99. doi: 10.1016/j.csi.2015.12.003
- Paolini, Massimo. (2017). What is Semantic SEO? https://online-sales-marketing.com/what-is-semantic-seo/ (2018-01-22).
- Pedraza, Beau. (2017). How the Google Hummingbird Update Changed Search https://www.searchenginejournal.com/google-algorithm-history/hummingbird-update/ (2018-01-30).
- Rovira, Cristòfol; Codina, Lluís; Monistrol, Ricard (2013). Rich snippets: información semántica para la mejora de la identidad digital y el SEO // El profesional de la información, 22:1 (2013) 554-561. http://dx.doi.org/10.3145/epi.2013.nov.08
- Schachinger, Kristine. (2015). How RankBrain Changes Entity Search. https://searchengineland.com/rankbrain-changes-entity-search-234345 (2018-02-13).
- Schema.org. (2018) Documentation. http://schema.org/docs/documents.html (2018-02-27).
- Schema.org. (2018a) Organization of Schemas. http://schema.org/docs/schemas.html (2018-02-27).
- Schubert, Kathrin. (2017). Semantic SEO Guide https://en.ryte.com/magazine/semantic-seo-guide (2018-01-23).
- Stetzer, Adam. (2015). RankBrain: SEO friend or foe? https://searchenginewatch.com/sew/opinion/2434672/rankbrain-seo-friend-or-foe (2018-02-13).
- Sulé Duesa, Andreu (2015). Schema.org, la mejora de la visualización de los resultados en los buscadores y mucho más. // BiD textos universitaris de biblioteconomia i documentació, 34 (Junio 2015) 1-7.
- Tort, Albert; Olivé, Antoni Olivé (2015). An approach to website schema.org design. // Data & Knowledge Engineering table of contents archive. ISSN: 0169-023X. 99, (2015) 3-16. doi>10.1016/j.datak.2015.06.011
- Yandex. (2018) Schema.org. https://yandex.com/support/webmaster/schema-org/what-is-schema-org.xml (2018-02-27).
- Yu, Wells. (2017). How to Use Semantic SEO for Higher Rankings https://www.searchenginejournal.com/content-semantic-seo/201596/ (2018-01-23).
Referencia
Lopezosa, C.; Codina, L.; Caldera-Serrano, J. «SEO semántico: Framework ISS para la optimización de sitios intensivos en contenidos». Cuadernos de Documentación Multimedia, v. 29, n. 1, Junio 2018. Acceso en: <http://revistas.ucm.es/download>. DOI http://dx.doi.org/10.5209/CDMU.60607