Google procède à une certaine forme de déduplication des articles de tête et des résultats Web dans certaines situations.

Du contenu dupliqué dans Google

John Shehata a publié des données provenant de son produit Newzdash, qui montrent que 67 % de toutes les recherches Google comportent des doublons entre les URL des articles vedettes et celles des résultats Web, et qu’environ 12 % des URL des articles vedettes sont doublés dans les résultats de recherche Web.

Voici comment Google dédouble les top stories et les résultats web. Danny Sullivan de Google a indiqué que cela pourrait changer. Google déduira une URL des résultats Web si un lien apparaît comme premier lien dans les top stories et si le cadre des top stories apparaît avant les résultats Web. En revanche, si elle apparaît après, Google ne déduira pas l’URL.

John Shehata a ajouté que « les positions 6 et 7 des top stories sont les plus dupliquées dans les résultats de recherche web en positions 4 et 5. John a ajouté que les « chiffres sont très stables au cours des 30 derniers jours et qu’il a examiné 5,1 millions d’URL dans 15 pays.

[Lire: Création de site internet]

Déduplication par Google des articles les plus importants dans les résultats de recherche sur le Web

Nous savons que Google déploie des efforts de déduplication lorsqu’un extrait vedette est affiché afin de pouvoir le retirer des principaux résultats Web. Google peut faire de même, dans certains cas, lorsqu’une URL est répertoriée dans la section « Top stories » et qu’elle n’apparaît pas dans les principaux résultats Web.

Dans certains cas, Google peut supprimer le résumé du résultat de la recherche sur le Web lorsqu’il affiche ce même résultat dans la section des meilleures histoires des résultats de recherche Google.

C’est ce qu’a déclaré Danny Sullivan, de Google, sur Twitter, après une plainte de The Verge.

Danny a déclaré que « si le résultat est affiché dans les Top Stories, il est dédupliqué du reste de la page. La déduplication peut souvent être utile. En effectuant cette recherche de la manière dont un utilisateur pourrait le faire en utilisant des termes de recherche de solutions plutôt que des termes inhabituels dans le titre, vous vous retrouvez en haut de la page dans les Top Stories et la déduplication signifie qu’il y a plus de variété provenant d’autres publications. Dans ce type de recherche, nos systèmes cherchent généralement à afficher les informations les plus utiles et les plus fiables possibles. C’est pourquoi vous ne voyez pas apparaître beaucoup de doublons de votre article. Les doublons existent certainement, mais il n’est pas très utile de les afficher. Cela conduit à des recherches orientées vers les titres. Comme je l’ai déjà dit, c’est très courant chez les auteurs. J’avais l’habitude de le faire tout le temps, moi-même. Mais les recherches axées sur les titres contiennent généralement beaucoup de termes, et nos systèmes renvoient les pages qui contiennent ces termes. Cela signifie que les auteurs sont plus susceptibles de trouver des doublons, même s’il est peu probable que ceux-ci apparaissent dans les recherches typiques des lecteurs. Mais notre fonction de déduplication peut intervenir même dans ce cas, comme c’était le cas ici. Comme je l’ai dit, la déduplication peut être utile. Mais nous comprenons aussi les inquiétudes que cela peut susciter. C’est ce que nous faisons avec les Top Stories depuis mai dernier, mais nous allons réexaminer cette question pour voir si nous devons continuer ou peut-être apporter d’autres changements. En outre, je vérifie encore, mais je crois que cette déduplication est particulièrement unique en ce sens qu’elle ne se produit avec les Top Stories que si une seule histoire est diffusée ou peut-être seulement pour la toute première histoire diffusée. »

Donc vous pouvez voir, Danny donne cette excuse pour expliquer pourquoi d’autres publications sont dans les résultats web et pas The Verge pour cette requête. Mais comme vous pouvez également le voir, il semble expliquer que parfois cela ne fonctionne pas de cette façon.

Ce qui est intéressant, c’est qu’il semble bien que Google procède à des déductions lorsqu’il s’agit d’articles de premier plan. J’ai effectué quelques recherches et il semble que Google supprime un article récent de ce site de la liste des meilleurs articles et l’affiche dans les résultats Web, tout en supprimant ces articles de la liste des meilleurs articles des résultats Web.

On ne sait donc pas exactement quand et pourquoi Google déduplique une URL pour l’empêcher de s’afficher dans les recherches sur le Web alors qu’elle s’affiche également dans les articles principaux. Il peut s’agir d’un problème de timing ou d’autre chose.

[Lire: Les changements d’URL sont compliqués pour Google]

Danny Sullivan a déclaré : « Je vérifie encore, mais je pense que cette déduplication est particulièrement unique en ce sens qu’elle ne se produit qu’avec les Top Stories si une seule histoire est affichée ou peut-être seulement pour la toute première histoire affichée. »

déduplication url Google

SEO Inside est une agence SEO.

 

--

 

SEO Inside est une agence web et SEO - en savoir plus sur nous:

Agence web / Audit SEO / Conseil SEO / Création de site internet / Refonte de site internet optimisé pour le SEO / Référencement naturel / Référencement local /Netlinking / Formation SEO / E-Réputation et avis

Voici nos implantations :
Lille / Dunkerque / Amiens – ce sont nos 3 bureaux historiques.

Puis voici nos zones géographiques d’intervention :
Paris / Abbeville / Rouen / Compiègne / Reims / Metz / Caen / Evreux / Nancy / Colmar / Rennes / Le Mans / Orléans / Dijon / Besançon / Angers / Nantes / La Rochelle / Poitiers / Limoges /Clermont-Ferrand / Lyon / Annecy / Grenoble / Valence / Bordeaux / Montauban / Toulouse / Biarritz / Montpellier / Marseille / Cannes / Nice / Avignon / Monaco

SEO INSIDE est une agence web spécialiste en référencement naturel qui se veut proche de vous. Contactez-nous pour discuter de vos projets.