intraordinaire 

michel v mange des enfants.

par Michel Valdrighi, 3X ans, bonne à tout faire du web le jour, superhéros injustement méconnu la nuit.

2008 06 17

c’est un long roman d’amitié

…qui commence entre Wikio et moi, mais pas comme une histoire d’amour.

En effet, via le blog d’Aymeric Jacquet, (qui développe les mêmes arguments que moi, en plus diplomate), j’apprends que Wikio emploie des techniques de spammeurs pour récupérer le texte complet des posts quand on publie un flux tronqué : leur robot va directement extraire les posts à partir du source HTML de votre site.

En feignant d’ignorer ce choix de l’auteur ; en prétendant même qu’ils font ça pour le bien du blogueur (qui sera forcément ravi de voir son contenu trouvable en intégralité sur Wikio).
Je peux comprendre cette technique quand il s’agit de sites d’actualités pas encore au point question syndication (et encore, c’est plus que discutable quand on habille le contenu tiers avec ses propres pubs), mais le faire quand on fournit délibérément ce qu’on veut dans son flux, c’est un manque de respect flagrant pour la propriété intellectuelle.

Je suis sur le cul… Vive le web des profiteurs 2.0 !

00:12 | tags :
24 commentaires
  • 2008 06 17 07:01 Xavierwww.liteweb.fr

    Google fait ça depuis toujours et que ça gêne personne pas plus que ça, c’est le principe de l’indexation… Exemple pour ton site: http://www.google.fr/search?hl=fr&q=site%3Aintraordinaire.com&btnG=Recherche+Google&meta=

    Avec les liens ‘en cache’. Y’a carrément tout ton site en cache chez Google. et alors ?

  • 2008 06 17 10:26 bramawww.google.fr

    pourquoi ttu demande pas d’être desindexé de Wikio? si tu orefere avoir moins des visite…faut assumer

  • 2008 06 17 10:59 michel vintraordinaire.com

    Xavier : vous insultez mon intelligence et celle de mes lecteurs en faisant une comparaison entre le service de Google et celui de Wikio. Les deux sont bien distincts sur au moins ces quelques points :

    <ol><li>Google est un moteur de recherche, Wikio est un agrégateur de 55000 flux.</li><li>Ce que fait Wikio avec le contenu n’est pas que de l’indexation&nbsp;: l’indexation permet de retrouver le contenu mais ne force personne à le republier tel quel, ou pire, modifié et habillé de pub.</li><li>Google ne modifie pas le contenu, à part pour surligner les termes recherchés.</li><li>Google n’ajoute pas ses propres pubs autour du contenu en cache.</li><li>Quand vous faites une recherche qui devrait arriver sur votre site, vous ne tombez pas sur le cache Google de votre site, alors qu’il arrive souvent pour de petits blogs que Wikio soit mieux référencé que l’auteur du contenu affiché : dans ces cas là Wikio reçoit les visites et les affichages de pub qui auraient du échoir à l’auteur du contenu, celui qui a fait l’effort de création. Osez me dire que ce n’est pas un cas de profit indû.</li><li>Et dernier élément : comme je le dis dans le post, si un auteur fournit un flux tronqué, c’est justement pour éviter de retrouver son contenu republié en intégralité sur des agrégateurs. Wikio ne respecte pas cette volonté, de quel droit&nbsp;?</li></ol>

    Brama : Wikio ne m’apporte quasiment aucune visite (10 par jour dans les bons jours), sauf quand j’utilise le tag "2.0", ce qui peut te donner une idée de l’absence de variété dans la base utilisateurs du site. Ces visiteurs commentent très très rarement, et souvent à côté de la plaque comme tu viens de le faire. J’assume parfaitement de pouvoir me passer de ces visiteurs là. :)

  • 2008 06 17 11:08 Brama

    donc tu va demander de te faire enlever de l’index de Wikio? :-q

  • 2008 06 17 11:16 michel vintraordinaire.com

    Brama : mes nouveaux posts ne sont déjà plus indexés (mais le robot passe toujours, étrange). Je compte demander à ce que les anciens disparaissent aussi de leur index… ça te choque ?

  • 2008 06 17 11:22 Michel

    Mais, j’ai du mal à comprendre où tu vois le contenu repris dans son intégralité ? Il est capturé et indexé en full text (comme tous les autres moteurs concurrents), mais le contenu n’est pas accessible complètement, si ?
    Tu me montres s’il te plaît ?

  • 2008 06 17 11:32 michel vintraordinaire.com

    Michel : le post d’Aymeric Jacquet en lien dans ce billet, explique bien le problème du contenu scrappé, copies d’écran de Wikio à l’appui.

  • 2008 06 17 11:44 brama

    ok, donc je viendras qdmeme sur ton blog sans passer par Wikio ok.

    Selon moi il y a plusieurs façon de voir la chose:

    -j’aime bien
    -j’aime pas je me desindexe
    -j’aim pas je propose un meilleur système
    -j’aime pas mais c’est pas grave
    -je me balade pied nu dans le parc

    mais d’abord il faut connaitre de quoi on arle et la beaucoup des bloggers parlent ans connaitre la chose, et les gens des WIkio font ‘enorme erreur de pas comuniquer la dessous ou de comuniquer par le biais d’un technicien içi ou d’un chappaz la bas, sans avoir un rapport direct chez les blogs (barcamp, mixblog, twitter, etc etc).

    :-p

  • 2008 06 17 11:47 Michel

    "Michel : le post d’Aymeric Jacquet en lien dans ce billet, explique bien le problème du contenu scrappé, copies d’écran de Wikio à l’appui."

    En aucun cas il ne dit que le contenu est republié dans son intégralité, par contre tu dis le contraire, haut et fort.
    Si c’est exactement ca le problème, peux tu me montrer du contenu plein texte, repris dans son intégralité ?

  • 2008 06 17 11:57 Xavierwww.liteweb.fr

    Houla, t’es sacrément énervé dis moi !

    Personnellement voilà comment je vois les choses: Google est effectivement un moteur de recherche MAIS il fait aussi de l’agrégation dans sa partie Actualités, et Wikio fait de l’agrégation ET il est aussi un moteur de recherche. Au final on en revient "au même", de mon point de vue… Les deux ont le contenu ou une partie, et tout le monde fait comme cela depuis maintenant un bon paquet d’années maintenant…(Yahoo, MSN Search, Lycos, etc…)

    Pour les points 2 & 3: Wikio/Google font techniquement la même chose, (point 4) moins la pub chez Google qui peut se le permettre :-)
    Pour le 5: au final les lecteurs arriveront toujours sur le blog et ne liront pas le post chez Wikio…

    Bref, tout est une question de point de vue. Le plus simple étant de se faire dé-référencer si ça porte préjudice…

  • 2008 06 17 12:19 michel vintraordinaire.com

    Xavier : surligner quelques termes, et carrément enlever tout lien du contenu en le saupoudrant de liens internes à l’agrégateur, c’est la même chose ? Je persiste, vous prenez les gens pour des jambons. :)
    (Et à la lecture de votre blog, j’ai l’impression que vous travaillez chez Wikio ou en êtes un partenaire. Il serait sympathique de le préciser si c’est le cas.)

    Michel : je ne peux pas vous aider à mieux comprendre ce qu’Aymeric et moi voulons dire. La présence sur un site agrégateur de tout ou partie des contenus d’un site qui ont été récupérés par des bots et non par le flux fourni par le site va à l’encontre de la volonté de l’auteur. C’est si compliqué ?
    (Et aussi, je n’aime pas les anonymes.)

  • 2008 06 17 12:31 Aymeric jacquetwww.ajblog.fr

    michel v : nous n’avons juste pas les mêmes méthodes. ;)

    A savoir, de nombreux outils de blogs proposent leurs flux en deux versions : une version courte ou par défaut tous les liens sont retirés (pour répondre aux problématiques de certains agrégateurs comme technorati et google blog search si mes souvenirs sont bons) et une autre complète (ou tronquée) contenant l’intégralité du contenu (liens et autres). Ceci est effectué en natif par le script de blog (du moins sur dotclear) via un outil php bien connu des pilleurs (strip_tags()).

    Par défaut, Wikio ainsi que la grande majorité des agrégateurs de flux prennent cette version épurée.

    Les lecteurs de flux du type netvibes, prennent la version la plus complète, si diffusée.

    Donc, en fait, en fonction du script de blog utilisé, Wikio ne modifie en fait pas le contenu publié, ils prennent le contenu qu’on leur envoie qui est par essence nettoyé des tous les "tags" en natif.

    Par contre la question d’y accoler les tags wikio en supplément, ça c’est un autre histoire.

  • 2008 06 17 12:41 Xavierwww.liteweb.fr

    Les résultats de Google et de Wikio sont présentés en texte brut dans les résumés, le texte est épuré de tout code html, c’est pareil partout.

    Par exemple ici: http://www.skyrock.com/recherche/index.php?searchtype=web&keywords=gpureftpd

    Je retrouve un post de chez moi, épuré de ses liens html et entouré de pub. Donc Skyrock se fait de la pub sur mon dos alors ? Ceci dit, personnellement je n’en perd pas donc c’est pas vraiment grave…

    Note que l’entreprise pour laquelle on travaille n’a pas d’importance dans la discussion ;-)

  • 2008 06 17 13:09 michel vintraordinaire.com

    L’entreprise pour laquelle on travaille conditionne notre objectivité quand on en parle. On ne vit pas dans le monde des Bisounours non plus.

    Aymeric : d’où mon « en plus diplomate ». Je suis plus adepte du pavé dans la mare, ça défoule. Après tout, les liens directs que vous aviez obtenus en étant diplomate n’ont été présents qu’une semaine et quelques sur Wikio, alors à quoi bon faire encore des ronds de jambe&nbsp;?
    Quant à mon flux sur Wikio, il est épuré et modifié alors que je le publie dans son intégralité. Ce problème ne vient pas de mon blogiciel (et la majorité publie les flux non-tronqués par défaut).

  • 2008 06 17 18:36 Bramabrama

    <!— donc on se fait dé-référencer ou pas? si vraiment t’es convaincu que on t’a volé quelque chose fais toi dé-référencer ensuit e tu va voir la police et ton avocat, parce que sinon on pourrait penser que c’est que du bla bla.

    mais bon on a droit à changer d’avis ça c’est sur :-)

    remarque tu peut faire une pétition sur ce site:

    http://jesigne.fr/ du style je voudrais ceci et cela, mais bon c’est deja plus difficile que de râler…
    —>
    <i>(troll effac&eacute;)</i>

  • 2008 06 17 19:11 michel vintraordinaire.com

    Brama : encore une fois à côté de la plaque. Ça devient d’un classique, avec les anonymes.

  • 2008 06 17 19:59 Brama

    donc pour une réponse il faut t’envoyer sa propre carte d’identité? et tu répond d’une manière différentes en fonctions de l’identité d’une personne?
    comme dis en haut je suis pas français et en lieux de te moquer de mois répond simplement: tu te fais de-référencer ou pas?

    will you ask wikio to blacklist your feed?
    pregunterà wikio de no mas haber tu blog en su index?

    anonymes? peut etre j’ai pas de blog non? il y a pleins de gents qui n’ont pas de blog tu sais? il te faut un prenom français de pure suche pour repondre? (si tut te fais dereferencer….)

    a= oui
    b=non
    c+oui et je m’explique
    d=non et je m’explique

    ps on calmes les hormones ok?

  • 2008 06 17 20:12 Magrat

    "ps on calmes les hormones ok?"

    Ah bah non, oh, pour une fois qu’un homme a de la testostérone dis donc !

  • 2008 06 17 21:48 brama

    ben ok mais il nous répond pas….

  • 2008 06 17 23:58 Magrat

    brama > hey, ouais, y’a des gens qui ont une vie en dehors du 2.0, incroyable, mais vrai !

  • 2008 06 18 00:45 michel vintraordinaire.com

    (Des commentaires de Brama ont été effacés. Je n’ai aucune envie d’argumenter avec un troll aussi évident. Si vous voulez recommencer cette discussion, revenons seulement au sujet du post.)

  • 2008 06 18 11:48 Brama B.

    je voulais juste te poser une question:
    est ce que tu va te faire dereferencer?

  • 2008 06 18 11:57 michel vintraordinaire.com

    La réponse est : je suis désindexé, là. Et j’en suis fort aise.

  • 2008 06 18 13:44 Brama B.

    ben voilà merçi (enfin) pour cette reponse, et merci de m’avoir traité de troll au passage, t’aurai pas fais plus vite de me répondre de suite?

Vous avez la parole

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Nom et e-mail sont requis, le HTML est autorisé.

Note : En postant ce commentaire, vous acceptez qu’une équipe de hamsters vérifient qu’il ne s’agit pas de spam. Si votre commentaire ne s’affiche pas, vous savez qui blâmer. En outre, je me réserve le droit d’effacer tout commentaire sans préavis et sans explication.

« »

meule de foin

le passé

et vous êtes ?

À l’aréoport.

pouvoirisé par

WordPress et une équipe de hamsters joviaux
…et des poneys !

©2006-2024 Michel Valdrighi (Dinoblogueur -1235 avant LLM)
contact : michel point (la vingt deuxième lettre de l'alphabet) @ (la lettre juste après le F) mail point com