Un moteur pour trouver et répertorier les pollublogues (splog)

logo de blogspotUn nouvel outil pour lutter contre les pollublogues, j’ai nommé splogspot. Il s’agit d’un moteur de recherche et d’une base de données qui répertorie les pollublogues mondiaux.

Qu’est-ce que les splogs?

Un nouveau phénomène fait son apparition sur la toile et commence à emmerder Google et ses filiales blogger et blogspot. Il s’agit des « splogs ».

« Splog » est une contraction des mots « spam » et « blog ». Avant de faire mon premier billet sur le sujet, j’avais demandé l’avis de l’office de la langue française du Québec pour la francisation de ce terme. Comme cela fait déjà plus de 2 semaines et que je n’ai toujours pas reçu la réponse, voici donc mes suggestions de termes francisés :
« pollublogue »,
« poublogue »,
« pollubloguer »
et « pollubloguage ».

Mais de quoi s’agit-il? Qu’est-ce qu’un « splog »? Lire la suite…

Les marketeurs qui polluent le Web

Ce n’et pas élogieux pour certaines entreprises de ma profession, mais le fait est que plusieurs marketeurs polluent le Web. C’est le constat que fait Steve Rubel dans son billet An All Too Convenient Truth: Many Marketers Pollute the Web.

Je m’insurge souvent ici contre les pourriels, les stratagèmes pyramidaux douteux et autres conneries qui détruisent l’expérience utilisateur ou refroidissent les investissements des entrepreneurs et des entreprises sur le Web. Un site d’entreprise fait entièrement en Flash, des splogs, des bannières dont le taux de clics sont de 0.5% et dont on se dit satisfait, des campagnes de mots-clés Google sans étude préalable avec un CTR de 1%, des propositions de référencement qui propose de travailler les métas tag Keyword et d’inscrire le site à des centaines de moteurs de recherche. De la pollution, en veux-tu? En voilà…

Quant à Rubel, il relève que :

First let's look at the the obvious ways marketers poison the web. These all intend to game the system …
• Spam: 94% of all email is spam (Postini)
• Splogs: 53% of all blog pings is spam, including 64% of those in English (UMBC)
• Click Fraud: Increased last year by 15% (Click Forensis)
Still, there's more. In subtle ways marketers are contaminating the Internet without even knowing it by spewing millions of meaningless messages across thousands of sites. This may be contributing to the slow down. They're not adding value to your experience or working to help you meet your goals in a very meaningful way.

Pathétique je vous dis. PATHETIQUE

Actupc.info, je vous emmerde

Je vais encore sauter une coche! On mettra ça sur le dos des hormones et de ma puberté accélérée ou tout simplement sur le fait que j’aïs ça les voleurs de contenus. Toujours est-il que le site Actupc.info s’amuse à voler mes contenus et que ça, ça me fait vraiment chier. Je parlais dans un récent billet du cycle de vie d’un billet, qui termine sa course quelquefois dans des splogs, qui sont montés grâce à des texts scrapers. C’est donc ce qu’est cette merde d’Actupc.info. Un splogs! Le motus operandi est le suivant. J’écris un billet, en l’occurrence Comscore médiametrix vs Yannick Manuri. Par la suite je le mets en ligne sur le blogue de l’AMM auquel je collabore. Puis Actupc.info de merde, le vole de l’AMM et le met dans son splog. Ils ont toutefois la décence de ne pas désactiver les redirections. Leur modèle d’affaires est donc de voler des contenus ailleurs et de faire de l’argent avec les AdWords de Google.

J’ai songé à faire aller la tronçonneuse, à envoyer une fusillade, une bombe nucléaire, une attaque de fourmis ou des crottes de chien sur le site de ces zigotos grâce à l’outil Netdisaster.com. Mais ce serait vil et ça me ferait trop plaisir. Ce n’est pas mon genre et je suis maintenant un peu plus réservé. Je commence d’ailleurs à avoir de la difficulté à me stationner en parallèle (c’est une blague les copines…). J’ai plutôt choisi de bitcher ici (de chialer pour les copains d’outre-Atlantique) et de les exposer à la face du monde. Si ça vous fait plaisir de leur causer un désastre, je ne vous encourage pas (à des fins légales). Pour vous informer, à titre indicatif seulement, sachez qu’ils sont logés à l’adresse IP 77.232.68.51, qu’ils roulent sous Linux, sur Apache, qu’ils sont enregistrés par Majdi Najat c/o Dynadot Privacy à San Matéo en Californie, mais hébergé en Europe chez  Servage.net – Hosting Segment H2 à l’adresse Neustadt 16, 24943 Flensburg, que je présume être en Allemagne. Voilà… Ça me fait du bien et en même temps je vous ai partagé quelques outils…

MAJ

Suite à l’écriture de ce billet, je suis allé me coucher. Ce que j’ai fait de cauchemars cette nuit! Jamais plus je n’écrirai ce genre de truc avant d’aller dormir. C’est vraiment trop dérangeant…

Le cycle de vie du billet d’un blogue

Voici une belle représentation graphique qui explique le cycle de vie du billet d’un blogue (via Pisani et c’est sur Wired). C’est l’explication des text scrapers qui deviennent plus tard des splogs, qui me font encore suer…

Cycle de vie du billet d'un blogue

Bloguer pour vendre, la suite de pourquoi bloguer

Le livre collaboratif Pourquoi Bloguer (dans un contexte d’affaires), auquel j’ai collaboré, est en prévente et vous pouvez toujours bénéficier d’une dédicace et d’un rabais de $4.95 si vous achetez maintenant.

Voici maintenant la suite de mon chapitre.

Même l’industrie pornographique et des pourrielleurs s’en mêlent!

Les blogues sont tellement efficaces afin de vendre sur internet qu’un nouveau phénomène a fait son apparition sur la toile et commence à emmerder Google et ses nombreuses filiales. Il s’agit des « splogs ».
« Splog » est une contraction des mots « spam » et « blog ». Avant de faire mon premier billet sur le sujet, j’avais demandé l’avis de l’office de la langue française du Québec pour la francisation de ce terme. N’ayant toujours pas reçu la réponse, voici donc mes suggestions de termes francisés :
« pollublogue »,
« poublogue »,
« pollubloguer »
et « pollubloguage ».
Selon wikipedia , le terme « splog » serait apparu en août 2005 et sa paternité appartiendrais à Mark Cuban .

Mais de quoi s’agit-il? Qu’est-ce qu’un « splog »?


En fait, les polluposteurs se sont vite rendu compte de l’avantage indéniable des blogues en termes de positionnement dans les moteurs de recherches et de la pertinence des fils RSS comme outil de diffusion de courriels. Ils ont donc su s’adapter aux nouvelles réalités Web. Un pollublogue est donc un blogue dont la vocation est de diffuser des hyperliens qui favoriseront le positionnement dans les engins de recherches de sites Web appartenant à leurs auteurs ou leurs affiliés. Le but de cette arnaque est d’augmenter le « Page Rank » des sites en question. Les pollublogues sont donc des blogues bidon avec des textes incohérents et parfois volés à des sites légitimes. Selon Technorati , entre 2 et 8% des blogues créés chaque jour seraient des pollublogues.
Les industries qui semblent utiliser les pollublogues apparaissent dans les catégories du tabac, des casinos en ligne, de la pornographie et des hypothèques immobilières. Incidemment, ces industries sont toujours à l’avant-garde des pratiques marketings internet. Si les blogues sont bons pour eux peut-être peuvent-ils faire des merveilles pour vous aussi? En autant que vous ne deveniez pas vous aussi un autre de pollublogues!

Le blogue comme outil de publication

Une présence Web peut se faire de diverse façon. Vous pouvez même avoir une page sur eBay et vendre énormément, sans site Web. Vous pourriez aussi donner le mandat à un « faiseur de sites Web » pour qu’il vous confectionne un site à partir de ce qu’il percevra être votre besoin. Vous pourriez aussi le faire vous-même. D’ailleurs, les nouveaux outils de mise en ligne d’une présence Web sont de plus en plus faciles d’utilisation pour un nom informaticien. Lors de mes conférences, j’aime donner l’exemple d’un copain de 9 ans, Thomas Martin , qui s’en est fait lui-même trois. Pour revenir à mon propos, les outils facilement utilisables sont communément appelés CMS (Content Management System que nous pourrions traduire par Outil de Gestion de Contenu). Ces outils nécessitent une expertise spécialisée pour leur mise en place initiale, mais une fois la mise en place faite, avec une formation de quelques heures seulement, un néophyte pourra, à sa guise, ajouter des contenus textuels, vidéo, audio et autres. Or ces CMS peuvent être gratuits (s’ils sont à code source ouvert) ou coûter plusieurs dizaines de milliers de dollars. L’un de mes clients, le Réseau de veille en tourisme de l’UQAM , requerra mes services d’expert conseil pour sélectionner un CMS pour ses besoins. C’est alors que j’inventai un mot pour lui. Le mot « Slogue ».

Il ne voulait rien savoir des blogues, mais voulait une plate-forme (un CMS) perméable aux engins de recherches, des archives par dates et sujets, un moteur de recherche intégré et un outil d’édition simple pour ses nombreux rédacteurs scientifiques. J’ai alors inventé le terme slogue. En fait, un slogue et un site Web traditionnel qui est monté sur une plate-forme blogue. La plate-forme blogue devient en fait un CMS (content management System) pour le site Web. À ce propos, sachez que le CMS qu’il utilisait depuis trois ans, avait coûté $80 000cdn. Le coût du slogue, incluant mes honoraires, le transfert des volumineux contenus de l’ancien site, en anglais et et français, et la mise en ligne de deux slogues adaptés en terme de design graphique et de fonctionnalités qui répondent au besoin spécifique du client, aura coûté $15 000. Une économie de $65 000 en plus des nombreuses retombés d’affaires qu’engendreras une présence Web désormais visible aux engins de recherches.

AIRWeb 2007, la rencontre des spécialistes antispams d’engins de recherches

La troisième édition d’AIRWeb 2007 (Adversarial Information Retrieval) vient de rendre disponibles les recherches scientifiques spécialisées en détection de spams d’engins de recherches. Le AIRWeb s’intéresse à des sujets tels que :

• Link spam: nepotistic linking, collusion, link farms, link exchanges and link bombing.
• Content spam: keyword stuffing, phrase stitching, and other techniques for generating synthetic text.
• Cloaking: sending different content to a search engine than to regular visitors of a web site, which is often used in combination with other spamming techniques.
• Comment spam in legitimate sites: in blogs, forums, wikis, etc.
• Spam-oriented blogging: splogs, spings, etc
• Click fraud detection: including forging clicks for profit, or to deplete a competitor’s advertising funds
• Reverse engineering of ranking algorithms
• Web content filtering: as used by governments, corporations or parents to restrict access to inappropriate content
• Advertisement blocking: developing software for blocking advertisements during browsing
• Stealth crawling: crawling the Web while avoiding detection
• Malicious tagging: for injecting keywords or for self-promotion in general

Les recherches qui ont été sélectionnées pour être présentées lors de l’événement sont maintenant disponibles gratuitement chez SearchengineLand.

Via MattCutts

Les spams des résultats de recherches financés indirectement par les annonceurs

Je fais des mandats d’analyse de référencement « white hat » et je suis toujours en maudit de trouver sur le passage ces fameux sites bidons qui ne sont que des sites de faire-valoir et de positionnement de produits ou mots-clés dirigeant ailleurs. Ce sont des sites de spams qui peuvent utiliser par exemple des technologies blogues (dans ce cas, on parle de splog et ils ont aussi leur outil de recensement Splogspot) pour arriver à leurs fins d’attirer ou de diriger le trafic des moteurs de recherches, selon leurs besoins. Pour ce faire, ils utilisent des techniques de référencement « black hat » qui ne répondent pas aux critères de qualités énoncés par les engins de recherches. Lorsque je trouve ce genre de truc sur le passage obligé d’une catégorie de mots-clés de mes clients, je les en informe, en fournissant le formulaire de plainte officiel, qu’ils peuvent adresser aux moteurs de recherches.

Une nouvelle étude vient corroborer ces phénomènes. Il s’agit de Spam Double-Funnel: Connecting Web Spammers with Advertisers (PDF), une recherche conjointe de Microsoft Research et University of California. Tel que vue dans zdnet.fr, on y apprend que :

Lire la suite…

Les menaces de WordPress

WordPress menace d’effacer les blogues hébergés chez eux et qui ne respectent pas les termes de services stipulant entre autres l’interdiction de monétiser son blogue via les redirections payantes telles que les redirections d’Amazon, de payperpost ou autre.

Lire la suite…

La bataille des fil RSS, Des fils complets ou des fils partiels?

Ces jours-ci, une nouvelle polémique fait rage dans la blogosphère, concernant les fils RSS. Certains proposent de mettre l’entièreté des billets dans le fil RSS et d’autres (comme moi) sont plutôt partisan des fils tronqués qui ne donnent qu’un avant-goût du billet et force ainsi les lecteurs à cliquer sur le contenu pour en savoir plus.

Je suis définitivement pour les fils RSS tronqués (avec ce que l’on peut appeler un teaser, ou une mise en bouche). Mon rational derrière cette prise de position …

Lire la suite…