Google registra patente para identificar conteúdo transitório

por Ronan Paulo



O objetivo dessa patente é provavelmente refinar ainda mais a indexação do conteúdo, identificando melhor cada elemento da página e assim conseguindo perceber conteúdos que sempre estão trocando como por exemplo propagandas, informações relativas ao clima ou algum widget que sempre aparece com a mesma estrutura mas seu conteúdo constantemente troca.

O crawler “quebra” o HTML em cada tag para poder identificar um padrão e em uma segunda passagem pela página, compara cada parte, achando o que de fato mudou e, dependendo do caso, indexando ou não esse conteúdo com atualizações constantes.

O que fica no ar é, qual será o critério para definir se esse conteúdo é relevante ou não? Mesmo os conteúdo com atualização constante tem sua importância e nem sempre são descartáveis. As possibilidade são muitas, o que aprofunda ainda mais a avaliação das páginas, checando elemento por elemento e suas respectivas mudanças e relevância com o resto do conteúdo da página.

Deixe um comentário

Previous post:

Next post: