Articles sur l'algorithme

Techniques Black Hat

Algorithme Google

  1. Le fonctionnement de google
  2. Google est multidimensionnel
  3. Google et le temps reel
  4. Google et son algorithme sont simples

Utilisation

L'algorithme est particulièrement adapté à des textes rédigés avec un haut niveau de langage et du vocabulaire très varié, dont les structures grammaticales sont très simples. Il se comporte en moyenne comme un appauvrisseur de vocabulaire. Les résultats n'ont que peu d'intérêt s'ils se basent sur un billet de blog avec des phrases rédigées commes des phrases orales, ou de nombreuses abbréviations. Le texte original doit être exempt de fautes de frappe.

Cet algorithme n'a en soit pas d'utilité directe s'il n'est pas spécialisé sur un secteur particulier. Il est développé à titre d'exercice pour comprendre quelles pourraient être les applications futures de la génération automatique de texte sans représentation formelle de contenu.

Cependant, de nombreux webmasters souhaitent générer des textes uniques afin de proposer du contenu comme faire valoir à de la publicité ciblée, comme le programme Adsense de google. On peut comparer ces pratiques à celles utilisées pour les articles creux des journaux publicitaires gratuits. Alors que ces derniers proposent des encarts publicitaires et des annonces gratuites encadrés par quelques textes sans intérêt, les MFA (Made for Adds ou Made For Adsense, c'est à dire sites fait pour la pub) se doivent de fournir un maximum de textes aux moteurs de recherche pour faire illusion et ne pas passer pour une page parking. Il s'agit cependant bien d'une page de parking améliorée puisqu'elle ne propose aucun élément nouveau. Cet outil permet de générer sur base de textes existants des documents pouvant passer facilement le filtre du duplicate content établi par google, mais ceci en diminuant la lisibilité du texte pour les visiteurs humains si le niveau de mélange est trop élevé. Une solution pourrait être d'utiliser ces textes générés facilement pour remplir des pages satellites qui drainent du traffic vers une page plus importante, chaque page satellite ayant comme titre une requete de la longue traine.