Saltar al contenido principal

TF*IDF

Con la fórmula TF*IDF puedes repasar la importancia que disponen ciertas palabras de un texto o de un portal web en comparación con todos los documentos disponibles. Esta fórmula se utiliza no solo para el cálculo de la densidad de las palabras clave sino además, para la Optimización OnPage: incrementar la relevancia de un portal web en los motores de búsqueda.

TF

Las siglas TF provienen de la expresión en inglés Term Frequency, Frecuencia de término en español, y determina la frecuencia relativa de una definición específico, una palabra o una combinación de palabras, en un documento. Este valor se compara con la frecuencia relativa de todos los demás términos de un texto, documento o portal web. La fórmula se compone por un logaritmo y se escribe del siguiente modo:

Formelbild1b.png

El logaritmo evita que un incremento sustancial del uso de la palabra clave específica no afecte al valor final del cálculo. Mientras la densidad de una palabra clave calcula solo el porcentaje de distribución de una palabra comparado con el número total de palabras en un texto, la frecuencia de término, TF, contempla además la proporción de todas las palabras usadas en el texto.

IDF

El término IDF proviene del inglés Inverse Document Frequency y significa Frecuencia Inversa de Documento. Esta segunda parte de la fórmula completa el análisis de evaluación de los términos y actúa como el corrector del TF. La Frecuencia Inversa de Documento es muy importante dado que incluye en el cálculo la frecuencia de documento de términos específicos: compara el número de todos los documentos disponibles con el número de documentos que contienen el término. Y para culminar, el logaritmo se encarga de comprimir los resultados:

Formel1aaa.png

Finalmente: el IDF determina la relevancia de un texto en cuanto a una palabra clave específica.

Las fórmulas anteriores calculan la relevancia de un documento en comparación con los demás documentos que contienen esa misma palabra clave. Para conseguir resultados útiles, la fórmula debe calcularse para todas las palabras relevantes de un texto.

Quizás te interesa >>>  Posicionamiento

Cuanto mayor sea la base de datos usada para el cálculo del valor TF*IDF, más preciso será el resultado.

Relevancia para el SEO

Cuando se habla del TF*IDF aplicado al SEO, los usuarios de herramientas SEO buscan la creación de textos únicos para impulsar el posicionamiento del portal web en los resultados de búsqueda. Hasta ahora, la densidad de término se ha usado como único referente para la optimización de textos, a pesar de todo, la fórmula TF*IDF ofrece un modo mucho más preciso de aprovechar al máximo el contenido.

Puesto que los motores de búsqueda analizan la vinculación semántica entre los términos es muy importante aprovechar al máximo semánticamente el contenido del portal web. Este procedimiento se llama Indexación de la Semántica Latente.

La herramienta TF*IDF determina las palabras clave que deberías usar para crear un contenido único para tu portal web. Esta herramienta no solo optimiza tus textos en vinculación a una palabra clave, sino además te aporta los términos que te ayudarán a crear un texto verdaderamente único.

Desventajas de la herramienta TF*IDF

Para aprovechar al máximo tu contenido con al análisis de la Frecuencia de Término, deberás asegurarte de incluir todos los items que componen tu portal web: los títulos de las categorías y las descripciones de producto son muy importantes.

Para tiendas online con solo un producto en la web, la fórmula TF*IDF no es la más adecuada dado que este tipo de optimización OnPage requiere mucho texto. Esto se debe a que esta fórmula es muy potente y calcula el valor de cada término que se encuentra en el documento.

Para culminar, la fórmula TF*IDF no contempla la oportunidad de que los términos aparezcan agrupados, que se apliquen normas de lexema o que se usen sinónimos.

Enlaces

Nuestra innovadora función: TF*IDF Ryte Magazine

error: Atención: Contenido protegido.