•
Lectura de 17 minutos
•
La indexación semántica latente es una técnica de recuperación de información inventada mucho antes de que se utilizara Internet. En algún momento, cuando Google comenzó a mejorar sus algoritmos de clasificación, surgió la controversia sobre las palabras clave LSI y si son beneficiosas para el SEO del sitio web.
En este artículo, me centraré en los orígenes de la indexación semántica latente y el concepto de palabras clave LSI. Y mostraré un par de herramientas generadoras de palabras clave LSI para usar en redacción publicitaria. ¡Disfrutar!
La indexación semántica latente, LSI para abreviar, es una técnica matemática que encuentra relaciones entre palabras en una colección de documentos. Usando LSI, podemos comparar una docena de textos y concluir que algunos de ellos son similares en tema. El algoritmo genera similitud incluso si la palabra clave del tema principal no se utiliza directamente en algunos textos.
En otras palabras,
La necesidad de un análisis semántico latente surgió en un momento en que crecían las capacidades de las computadoras y los programadores buscaban mejorar el acceso de los usuarios a la información. El procesamiento de información relacionada con el texto exigía un análisis semántico más eficiente. La técnica LSI tenía como objetivo abordar varias cuestiones del análisis de texto, a saber, la sinonimia y la polisemia.
¿Qué son los sinónimos?
La sinonimia es un término lingüístico que describe la existencia de diferentes palabras para una misma cosa o concepto. Por ejemplo, para el camino que vas, tienes una serie de palabras para describirlo como una ruta, un camino, un camino, un pasaje.
¿Qué es la polisemia?
Polisemia es un término lingüístico para una palabra que tiene más de un significado. Los polisemas tienen significados diferentes, aunque relacionados. Tomemos como ejemplo la palabra conducir : puedes conducir un vehículo, o puedes llevar a tu amigo a casa desde un pub, o simplemente puedes conducir durante mucho tiempo. Otra cosa es que puedes volver loco a alguien. La palabra puede significar una determinación, un viaje, un pase amplio para vehículos, una pieza de ordenador, etc.
¿Qué es la homonimia?
Un fenómeno ligeramente diferente es la homonimia cuando las palabras se escriben igual (homógrafos) o suenan igual (homófonos), pero significan conceptos diferentes, no relacionados por origen. Por ejemplo, hay que ser o no ser como verbo, y hay una abeja como insecto.
Estos fenómenos lingüísticos son la fuerza impulsora de todos los juegos de palabras y el humor en el arte y la literatura.
Sin embargo, la sinonimia y la polisemia son la razón principal por la que la concordancia exacta de palabras clave no es adecuada para los motores de búsqueda.
LSI revela estructuras semánticas subyacentes que pueden ocultarse u oscurecerse debido a la variabilidad de la redacción. Esta técnica permite encontrar similitudes entre varios documentos en una colección de textos y recuperar los más relevantes para la investigación del buscador.
LSI es una tecnología patentada, publicada en 1988 (y la patente expiró en 2008).
LSI utiliza una matriz de términos-documentos y la descomposición de valores singulares (SVD), una técnica común de álgebra lineal, para aprender correlaciones conceptuales en un cuerpo de textos. A menos que esté familiarizado con las operaciones con matrices y vectores propios, le llevará tiempo comprender la idea de cómo funciona, pero he aquí un breve intento.
Los cálculos identifican coocurrencias en el cuerpo de los textos, lo que ayuda a revelar conceptos comunes a varios documentos de la colección de textos. El beneficio de LSI es que ayuda a eliminar el ruido y transformar una matriz TDM muy escasa en una aproximada de bajo rango que revela estructuras comunes. La desventaja de LSI es la complejidad del cálculo.
Esta es una animación del ejemplo de LSA de la introducción a los tutoriales de modelado de temas.
LSI se puede utilizar para comparar términos con términos, documentos con documentos y términos con documentos. Como caso más específico, sirve para encontrar los términos vecinos (esos son los términos más cercanos por su peso), encontrando un grupo de palabras muy relacionadas con un concepto. Estos pueden ser no sólo sinónimos sino también opuestos o simplemente palabras que a menudo van de la mano con el tema principal. Gracias a la agrupación de palabras que realiza LSI, es eficaz para la búsqueda y categorización de documentos.
Las palabras clave LSI son palabras que están relacionadas semánticamente con la palabra clave del tema principal de la página y se pueden encontrar en una variedad de textos similares.
Para comprender fácilmente qué son las palabras clave LSI, echemos un vistazo a una consulta aleatoria, por ejemplo, "cambio climático". Primero, piensa en las asociaciones que tienes con la palabra frase.
Si lo escribes en la barra de búsqueda, obtendrás un montón de páginas de varios tipos. Google extrae la definición del término de Wikipedia en un fragmento destacado, resaltando en negrita los términos más importantes asociados con el cambio climático: "derretimiento del hielo", "calentamiento de los océanos", "aumento del nivel del mar" y "acidificación de los océanos".
En la página de resultados de búsqueda, encontraremos un par de términos más relevantes, como "calentamiento global", "emisiones de gases de efecto invernadero", etc. Estas son palabras y frases que aparecen junto a nuestro término clave principal en la mayoría de los textos.
La pregunta complicada sobre LSI es...
Para todos aquellos que preguntan si Google utiliza palabras clave LSI, hay una breve respuesta del representante de Google, John Mueller, de una vez por todas:
Entonces, ¿por qué se asocia a Google con el análisis semántico latente? Sabemos con certeza que el buscador de Google distingue polisemas y sinónimos. Para consultas populares, al menos varios resultados en el SERP deberían cubrir aproximadamente el mismo aspecto del tema, ya que Google identifica con éxito la palabra clave y distingue los polisemas (por supuesto, cuando usted lo especifica, pero también según su historial de búsqueda), e incluso interpreta el Intención de la consulta para extraer los textos más relevantes.
Es más, cada día Google recibe el 15% de búsquedas que nunca antes había realizado. ¿Cómo los maneja?
La verdad es que difícilmente se puede mencionar ningún trabajo de investigación de Google sobre palabras clave de LSI que muestre en qué etapa se podría haber implementado LSI en sus algoritmos. Sin duda, hoy en día Google utiliza algoritmos de procesamiento de lenguaje natural más avanzados para escanear la web en constante expansión. Bill Slawski deja claro aquí por qué Google apenas utiliza LSI para la búsqueda y cita patentes de 2017, indicando como ejemplo que un nuevo algoritmo de Google, RankBrain, se basa en un enfoque de vector de palabras.
A partir de las últimas actualizaciones algorítmicas, Google utiliza BERT para mejorar la relevancia de los resultados de búsqueda para las consultas de los usuarios. La red neuronal para el procesamiento del lenguaje natural se utiliza para clasificar pasajes o para comprender la semántica profunda de los vídeos, lo que parece ser mucho más complicado que LSI.
Lectura relacionada MUM de Google: actualizaciones de búsqueda e implicaciones para SEO
LSI se inventó con el auge de Internet. Para una web tan grande como es hoy, LSI no es práctico, y mucho menos suficiente.
Una cosa a tener en cuenta es que LSI es sólo una de las muchas técnicas de análisis semántico, junto con el análisis semántico latente probabilístico, el análisis de componentes principales, la asignación de Dirichlet latente, Word2Vec, etc.
Si bien la técnica LSI se descarta por ser demasiado antigua y simple para las necesidades de búsqueda modernas, los especialistas en marketing de contenidos utilizan el término "palabras clave LSI" para describir el alcance del trabajo de optimización realizado en una página. Entonces, ¿cuál es el valor de las palabras clave LSI para SEO?
El principal beneficio de las palabras clave LSI es que puede utilizarlas para mejorar el SEO en la página. Las herramientas LSI no están destinadas a modificar los algoritmos de Google. Se centran en el análisis de texto para encontrar palabras y frases que ocurren naturalmente una al lado de la otra en función de los textos ya disponibles en el SERP.
LSI le permite enriquecer el contexto con palabras clave relacionadas semánticamente. El uso de palabras clave LSI debería ayudarle a crear el contexto natural para la consulta y cubrir el tema con mayor profundidad. Puede tratarlo como una especie de ayuda en la redacción de contenidos.
El término "redacción LSI" se utiliza en marketing de contenidos para indicar el proceso de agregar términos relacionados a su contenido. En términos generales, la redacción SEO tiende a alejarse de técnicas obsoletas y antinaturales de relleno de palabras clave. Más bien se centra en crear contenido fácil de usar: los redactores deben hacer que los textos se escriban de forma natural y aportar valor añadido a los usuarios (lo mismo por lo que se esfuerzan los ingenieros de búsqueda).
Entonces, cuando hablamos de palabras clave LSI, nos referimos a encontrar palabras clave relacionadas relevantes que puedan agregarse para mejorar el contenido. En ese caso, hablamos de él como un concepto de marketing utilizado por los creadores de contenido.
Primero, piensa. Si eres un experto, tendrás muchas ideas que desarrollar en tu artículo. ¿Qué pasa si te quedas sin ideas? Utilice herramientas de palabras clave.
El primer método que le viene a la mente cuando está preparado para buscar palabras clave LSI es utilizar las sugerencias de palabras clave de Google. Sin embargo, cuando hablamos de las herramientas habituales de palabras clave de Google, no podemos utilizarlas para referirnos a generadores de palabras clave LSI, ya que los algoritmos de Google no tratan de indexación semántica latente.
Si bien el autocompletado de Google es sin duda la mejor fuente para el descubrimiento de palabras clave, esto no siempre es lo que entendemos por palabras clave LSI. Además, observe la diferencia entre palabras clave de cola larga y palabras clave semánticas LSI. Las palabras clave de cola larga ya incorporan su palabra clave principal, lo más probable es que encajen en su contenido y probablemente desee realizar un seguimiento de ellas como sus frases de palabras clave objetivo. Mientras que es posible que las palabras clave LSI ni siquiera incluyan la palabra clave objetivo.
En el SERP, siempre verá el resultado de búsqueda universal conocido como cuadro La gente también pregunta. Es más probable que este lugar le brinde un par de excelentes temas relacionados semánticamente.
Verás más preguntas y respuestas mientras desenvuelves la caja. Cuantas más preguntas veas, más preguntas sugiere Google. Sin embargo, los temas sugeridos se alejarán cada vez más de su tema principal.
Las pistas que se encuentran en el cuadro de PPA son una excelente opción de palabras clave LSI para optimizar para la búsqueda por voz móvil y los cuadros de preguntas frecuentes.
Aquí hay otra herramienta gratuita de generación de palabras clave de Google. En la página de resultados de búsqueda, vaya a inspeccionar los resultados de búsquedas relacionadas, los temas que resultan ser los más frecuentes junto a su término de búsqueda principal. En búsquedas similares, encontrará un par de buenos subtemas para agregar a su contenido principal y hacer que su artículo sea más profundo. Los sinónimos y términos relacionados son una buena manera de enriquecer su contenido.
Google Imágenes es otro método sencillo para encontrar palabras clave con la ayuda de etiquetas. La herramienta sugiere las palabras clave de cola corta más populares, estrechamente relacionadas semánticamente con la palabra clave objetivo y representadas en abundancia en los resultados de las imágenes.
Lectura relacionada: Más de 20 herramientas gratuitas de investigación de palabras clave
Una herramienta sencilla generadora de palabras clave LSI para investigación académica es XLSTAT, un complemento para Excel. XLSTAT ofrece una prueba gratuita de dos semanas para probarlo y una hoja de cálculo de demostración que muestra cómo aplicar LSI en su matriz de términos de documentos.
Primero, deberá crear su MDT con valores binarios para la aparición de palabras en sus textos. Luego, con XSTAT activado en Excel, vaya a Funciones avanzadas (presionando el botón +) y seleccione Minería de texto > Análisis semántico latente. Proceda a establecer la configuración que desee para sus datos y haga clic en Aceptar para aplicar.
La herramienta le proporcionará la lista de temas que la herramienta LSI obtiene de sus datos. Para interpretar rápidamente la calidad de los resultados, la herramienta genera un diagrama de scree, midiendo la importancia de los temas a través de valores propios y porcentaje de variabilidad acumulada. También hay visualizaciones de relaciones entre términos y entre documentos.
LSI Graph es una buena herramienta semántica de palabras clave que habla por sí sola. Permite realizar 10 búsquedas por día de forma gratuita. Simplemente vaya al sitio web, pegue su palabra clave inicial y obtendrá una lista de palabras clave LSI, acompañada de estadísticas de SEO que lo ayudarán a elegir las frases de palabras clave más prometedoras. Los resultados traerán un montón de ideas para enriquecer su contenido con más temas o funciones.
En LSI Graph, puede ver el volumen de búsqueda de la palabra clave, los costos por clic y las tendencias durante un período de tiempo. LSIGraph realiza una búsqueda de palabras clave LSI utilizando su propia medida patentada conocida como valor semántico latente (LSV). En el espacio de trabajo de la derecha, verá el contenido de mejor rendimiento con enlaces activos para verlos rápidamente.
LSI Graph también ofrece funciones premium, incluida la gestión masiva de palabras clave y la herramienta Semantic Writer. La herramienta le permite optimizar el contenido en la aplicación, generar palabras clave LSI y verlas junto a su contenido, midiendo el recuento de palabras, la densidad de palabras clave, etc. De hecho, Semantic Writer ofrece una ayuda a los redactores SEO, con especial enfoque en la investigación. Palabras clave LSI.
Keysearch es otra herramienta gratuita para descubrir palabras clave LSI para su contenido. El algoritmo de búsqueda de palabras clave detrás de la herramienta recorre la primera página de resultados de búsqueda de Google para su palabra clave principal y analiza todas las páginas de clasificación para encontrar las palabras y frases que se usan con más frecuencia en ellas.
Nuevamente, obtendrá todas las estadísticas de investigación de palabras clave, como tendencias de búsqueda, costos de CPC e incluso la solidez de la clasificación de los dominios en el SERP para la palabra clave, junto con sus enlaces, tráfico orgánico y popularidad en las redes sociales.
Keysearch ofrece una herramienta Asistente de contenido que utiliza el algoritmo de función de análisis profundo. Agrega otro nivel a la búsqueda de palabras clave LSI. La herramienta incluye búsquedas relacionadas de Google más las palabras clave mejor posicionadas para el primer resultado de Google. De esta manera encontrará los términos clave más rentables de la mejor página que atraen la mayor cantidad de tráfico orgánico al sitio web.
Por lo tanto, Keysearch combina características de una herramienta de investigación de palabras clave con una herramienta de redacción de contenido que ayuda a crear contenido basado en análisis SERP. Esta es una forma sencilla y fácil de generar palabras clave LSI para agregar a su contenido, que se obtienen mediante análisis automático de los resultados de mayor clasificación, las búsquedas relacionadas de Google y los cuadros de preguntas.
Content Editor forma parte de WebSite Auditor, una herramienta del software SEO PowerSuite que combina las funciones de un rastreador de sitios y una aplicación de optimización de contenido en una. Para la creación de contenido, WebSite Auditor tiene un módulo separado para auditar páginas individuales y la herramienta de asistente de escritura inteligente para optimizar las páginas dentro de la aplicación.
Para encontrar palabras clave LSI, inicie WebSite Auditor y vaya al módulo Auditoría de página > Editor de contenido. Presione el botón + para agregar la URL de la página que optimizará (la página existente o una nueva), luego proceda a agregar su palabra clave objetivo para la página.
La herramienta Editor de contenido analizará el SERP en busca de páginas de alto rango y brindará consejos de optimización en la página.
En la ventana principal, tendrá el espacio de edición donde podrá crear su contenido y ver cómo mejora el puntaje de optimización en el lado derecho de la aplicación.
Alternativamente, para los creadores de contenido, existe una opción para exportar recomendaciones en un archivo PDF y entregarlas para usarlas en alguna otra herramienta de escritura.
El campo de recuento de palabras clave es editable. Puede ver la frecuencia de las palabras clave existentes en la página y cómo mejorarla utilizando más o menos palabras clave. Puede editar este campo manualmente (y también puede agregar más palabras clave LSI manualmente).
Hay una herramienta TF-IDF especial en WebSite Auditor que significa "Frecuencia de términos - Frecuencia de documentos inversa". TF-IDF mide la importancia de una frase de palabras clave comparándola con la frecuencia del término en un gran conjunto de documentos. Básicamente, esta técnica de análisis de contenido sigue los mismos pasos que LSI antes de aplicar SVD. Mientras que LSI descubre qué temas son comunes para qué documentos en una colección de textos, TF-IDF simplemente sopesa los términos contenidos en ellos.
La belleza de la herramienta TF-IDF en Content Editor es que muestra el uso de las palabras en gráficos claros y visualizados. Muestra el recuento promedio de palabras clave en las páginas de la competencia y calcula el recuento de palabras clave que debe utilizar en su página. La herramienta de sugerencias rápidas recomienda agregar una nueva palabra clave o usar menos palabras clave para evitar el exceso de palabras clave.
El Editor de contenido proporciona una cantidad recomendada de palabras clave para usar en su contenido, extraídas del contenido de sus mejores competidores y filtradas por el parámetro TF-IDF. Puede desenvolver la lista de competidores y ver las URL, junto con el tráfico que la página ha obtenido a partir de la búsqueda orgánica de la palabra clave objetivo. Puede obtener una vista previa de la versión de texto sin formato de la página directamente en la herramienta o acceder al sitio mediante un enlace rápido desde la herramienta.
Realizada con análisis de contenido, la herramienta sugiere temas y preguntas en los que debe centrarse en su contenido, extraídos directamente de Google SERP (sección 'La gente también pregunta' ). Esto le ayudará a generar más ideas de temas y a cubrir su tema principal con mayor profundidad.
A medida que continúa agregando contenido nuevo, el peso de cada palabra clave frente al recuento total de palabras cambia. Un widget especial de nube de Word ilustra el peso de sus palabras clave en el contenido.
¿Mencionar palabras y frases relacionadas puede mejorar la clasificación? No exactamente, el efecto no está garantizado. Agrega palabras clave relevantes a su contenido y amplía el tema, lo cubre más en profundidad. Mientras tanto, obtendrá más palabras clave en su página y sus palabras clave objetivo estarán respaldadas por un contexto mejorado. Los algoritmos de búsqueda pueden revelar algunas consultas adicionales a las que están dirigidas sus páginas. Esto genera tráfico orgánico más relevante a su sitio y contribuye a su visibilidad en línea en general. Pero, ¿qué palabras clave adicionales son mejores para la optimización de la página?
Ya sea que los motores de búsqueda utilicen LSI hoy en día o no, los SEO utilizan el concepto de palabras clave LSI para ayudar en la creación de contenido. Al comprender el papel de las palabras clave LSI, puede convertirlas efectivamente en parte de su estrategia de palabras clave. Solo tenga en cuenta que los algoritmos de Google utilizan cientos de factores de clasificación donde el contenido es el rey.
Cualquiera que sea la herramienta o técnica de búsqueda de palabras clave que aplique, concéntrese en crear contenido de alta calidad. No dudes del valor de las lecturas largas porque el contenido excelente obtiene el voto de los usuarios y los motores de búsqueda lo ven.