21 Mai 2012
Emile
La sémantique revient souvent sur le tapis lorsqu’on parle de SEO. Voici une explication d’une méthode d’analyse des contenus web (mais pas uniquement), loin d’être récente mais qui permet de mieux réaliser la puissance de l’informatique dans la gestion et la recherche d’informations.
Il s’agit de la méthode très évoluée d’analyse sémantique qui peut être utilisée aussi bien pour la recherche de documents sur votre PC que pour le classement des pages web dans les SERPs. C’est selon 3 grands principes que les robots parviennent à évaluer la relation des mots les uns envers les autres et ainsi à déterminer à quel point un sujet est développé : les formes de mots, leurs sens et les syntagmes (groupes de mots). Parmi chacun de ces éléments, la technologie CIRCA analyse les rapports des mots les uns avec les autres, la richesse du texte.
Sont recherchés dans un texte les synonymes des mots lus par les robots, leur similarité, et leur appartenance (cuisiner appartient à cuisine). Mais ce sont aussi l’hyperonymie (catégorie regroupant un ensemble de mots), la métonymie (rapport entre un tout et ses parties : voiture et portière par exemple) qui sont décortiquées : elles indiquent l’expertise du thème abordé dans le but de garantir un résultat qui correspond aux requêtes des cybernautes. Ensuite, la substance (la farine est une substance du pain), la causalité (les études aboutissent à un diplôme) et les attributs. On sait aussi que la succession logique d’actions est prise en compte (laver, puis essuyer etc.) pour évaluer un site. Enfin les liens connexes et les termes relatifs à une même marque sont repérés et jouent eux aussi un rôle dans la classification des résultats.
La technologie CIRCA est capable d’identifier les relations que les mots d’un même texte ont entre eux : sur le net, cela s’applique aussi bien au corps de texte qu’aux balises html, aux nombres qu’à la ponctuation… Ce ne sont pas uniquement des robots qui organisent tout cela : des linguistes chevronnés agissent à l’aide d’outils très élaborés eux-aussi.
Voilà donc une des pistes d’analyse sémantique à laquelle se fie un moteur de recherche : on comprend mieux pourquoi la SEO ne peut vivre sans un texte optimisé, mais surtout bien rédigé, développé et d’un vocabulaire bien exploité.