Petite histoire des mensonges des GAFA et des autres médias sociaux

Lorsque j’ai commencé ma carrière, je disais que l’audience publicitaire télévisuelle était une création de l’esprit. Lorsqu’on disait que telle émission de tv avec 1 million de téléspectateurs, on ne savait pas combien se levaient pour aller aux toilettes durant les pauses publicitaires. Et avec l’arrivée des enregistreurs numériques personnels, les gens enregistraient leurs émissions favorites et zappaient en grande vitesse les pubs. C’était le cas ici au Canada puisqu’à l’époque, les Américains eux avaient TIVO qui escamotait automatiquement les pubs. Mais ici, étant donné que les câblodistributeurs étaient aussi des producteurs de contenus (songeons à Bell, Rogers ou Videotron), ils avaient toujours refusé de faire entrer cette technologie ici. Alors lors de mes conférences, je disais on compare les chiffres d’audience télévisuelle qui sont une création de l’esprit, aux chiffres du web qui eux sont fiables puisque nous mesurons les clics et la conversion, qui bien que ces chiffres sont beaucoup moins imposants, eux par contre sont vrais.

En 20 ans, les chiffres du numérique ont explosé et les fraudes numériques aussi

Même si les chiffres télévisuels sont une forme de création de l’esprit, il demeure qu’ils sont colligés par des agences indépendantes des diffuseurs. Nielsen, étant le leader mondial en ce domaine. Ces chiffres, quoiqu’imparfaits, sont tout de même neutres et l’imperfection est égale pour tous les diffuseurs. On peut donc objectivement comparer la popularité d’une émission télévisuelle à une autre, et un diffuseur à son compétiteur. Il en est de même pour la radio. D’ailleurs je dis à mes clients que s’ils tiennent à faire de la pub télévisuelle, ils devraient privilégier les canaux sportifs, la météo et les canaux d’information continue puisque ce sont le genre d’émission qu’on écoute en direct sans enregistrer au préalable.

À mes débuts, il y avait un foisonnement d’outils d’analyse statistique de fréquentation de site indépendant. Mais ils étaient tous payants. L’arrivée de Google Analytics bouleversa ce marché. Comme Google Analytics était gratuit, il tua la compétition. Selon Wikipédia, Google Analytic aurait même 80% du marché mondial. Cette réalité est déjà en soi problématique. Comment peut-on objectivement faire confiance à un outil d’analyse d’audience qui mesure lui-même l’efficacité de sa sœur Google, comme outil de création d’achalandage vers un site web?

Mais on pouvait toujours se fier à d’autres outils pour mesurer le trafic mondial. Il y avait toujours Alexa, qui nous donnait une idée externe à Google. Alexa s’est aussi associé à Internet Archive et Wayback Machine. Or que s’est-il passé en 1999? Alexa fut acheté par Amazon.

Quelques années plus tard, on vit naître Twitter, Facebook, YouTube et tous les autres. Il s’avère que chacun d’eux offre généreusement ses outils d’analyse statistique interne. À plusieurs reprises, ces outils ont été sévèrement critiqués pour avoir grossi les chiffres de fréquentation ou de visionnement. D’ailleurs Facebook a plusieurs fois été critiqué pour ses chiffres suspects, voire carrément frauduleux. (dans Wikipédia)

In July 2012, startup Limited Run claimed that 80% of its Facebook clicks came from bots Limited Run co-founder Tom Mango told TechCrunch that they “spent roughly a month testing this” with six web analytics services including Google Analytics and in-house software. Click fraud (Allege reason) Limited Run said it came to the conclusion that the clicks were fraudulent after running its own analysis. It determined that most of the clicks for which Facebook was charging it came from computers that were not loading Javascript, a programming language that allows Web pages to be interactive. Almost all Web browsers load Javascript by default, so the assumption is that if a click comes from one that is not, it’s probably not a real person but a bot.
(…)
Facebook offers an advertising tool for pages to get more “like”. According to Business Insider, this advertising tool is called “Suggested Posts” or “Suggested Pages”, allowing companies to market their page to thousands of new users for as little as $50.

Global Fortune 100 firms are increasingly using social media marketing tools as the number of “likes” per Facebook page has risen by 115% globally. Biotechnology company Comprendia investigated Facebook’s “likes” through advertising by analyzing the life science pages with the most likes. They concluded that at as much as 40% of “likes” from company pages are suspected to be fake. According to Facebook’s annual report, an estimated 0.4% and 1.2% of active users are undesirable accounts that create fake likes.

(…)
In August 2012, Facebook revealed that more than 83 million Facebook accounts (8.7% of total users) are fake accounts. These fake profiles consist of duplicate profiles, accounts for spamming purposes and personal profiles for business, organization or non-human entities such as pets. As a result of this revelation, the share price of Facebook dropped below $20. Furthermore, there is much effort to detect fake profiles using automated means, in one such work, machine learning techniques are used to detect fake users.

Pour YouTube, vous pouvez lire l’excellent article The Flourishing Business of Fake YouTube Views, qui encore une fois, explique comment on peut s’acheter des « vues » sur Youtube, via de faux comptes. Déjà en 2014, dans mon billet Click Farms (les fermes de clics) ou comment se faire fourrer heureux, comment il était facile et payant, de frauder les statistiques numériques et en 2007, je parlais de la conférence AirWeb qui avait pour mission de partager les connaissances contre le pourriel des moteurs de recherche et en 2006, Google et Yahoo se faisaient ramasser pour les fraudes par clic.

J’y disais :

Le hic, Google et Yahoo ne sont pas transparents sur les procédures qu’ils utilisent afin d’identifier et de neutraliser les fraudeurs de clics. Autre os dans le discours des moteurs de recherche, dans le même souffle ils disent protéger leurs clients, mais ne pas avoir suffisamment de données pour le faire !??

Mais si vous étiez l’une de ces entreprises, seriez-vous réellement convaincus que de lutter pour éliminer 20% de votre chiffre d’affaires (à l’époque) ou 50% de votre chiffre d’affaires (aujourd’hui) soit une bonne chose votre entreprise? Poser la question, c’est y répondre. D’ailleurs, outre les scandales sporadiques à ce sujet, tout est bien dans le meilleur des mondes. Comme ils ont des algorithmes secrets, des bases de données « barrées à double tour » et que leurs outils statistiques sont internes, il est plutôt facile de dire n’importe quoi. Or, pour la première fois, le voile sera levé sur « ces secrets professionnels » par nul autre que Elon Musk. Comme je l’expliquais dans mon récent billet : Twitter, Musk et la fondamentale et perturbante question des bots (robots).

Comme pour tous les autres médias sociaux, les algorithmes sont secrets, nous n’avons pas d’informations précises sur le nombre de vrais et de faux abonnés et ce qui est encore pire pour certains autres joueurs du web, dont Facebook et Google, nous ne savons que peu de choses sur le réel taux de « faux clics » et de ce que ces entreprises font réellement pour les enrayer. J’ai écrit une couple de fois ici à propos du chercheur Augustine Fou, qui prétend que 50% des clics publicitaires seraient de faux clics (à mes débuts il y a 20 ans, on parlait de 20%). Mais comme ces monstres ne sont pas sur le point de se faire acheter, donc auditer, nous n’avons réellement aucun outil indépendant pour valider les prétentions qu’ils mettent de l’avant depuis toutes ces années.
Voilà donc une autre des raisons pourquoi l’achat de Twitter par Musk, est l’équivalent d’un tremblement de terre sur la planète des médias sociaux et des GAFA…

Dans l’article Ad Fraud – The Hidden Way Ad Tech Is Stealing Your Ad Dollars, on apprend que

Today, ad fraud is perpetrated in several different ways:
• Hidden ads: Ads are displayed in such a way that the user doesn’t actually see them. For example, ads are just 1×1 pixel ads, are displayed outside the viewing area, or are overlapping in an iframe. This kind of ad fraud targets ad networks that pay based on impressions vs clicks.
• Click hijacking: Hackers insert malware into computers to redirect a click from one ad to another one
• Bot ad fraud: Hackers use bots to generate thousands of fake clicks on an ad or fake visits to a website displaying the ads. Bots fake legitimate human website visitors and fake real browsers by declaring they are Chrome, Safari, or Firefox.
• Fake websites: Today, there is a significant number of fake websites that have no content except ads. Moreover, since the sites contain only random ads, no humans visit them. These fake websites were created solely to make money from advertising. Fake websites can mimic real websites by simply passing false information in bid requests.

Ad networks and ad exchanges have turned a blind eye to ad fraud as their existence helps to line their pockets. What makes matters even worse is that advertisers rely on data from attribution platforms like Google Analytics to understand the marketing interactions customers have with their brand so they can make better ad buys. However, clicks can be manufactured out of thin air by directly loading click-through URLs, affiliate links, or click trackers. Hackers can also imitate humans using mobile devices to record and replay fake engagement.

La solution est donc d’investir dans le marketing de contenus sur son propre site, dans les publicités sur les sites web qu’on visite soi-même, sur les médias télévisuels en temps direct ou à la radio, dans l’imprimé et dans tous les cas, d’impérativement mesurer les ventes réelles tributaires de la conversion des abonnés en se foutant des métriques de vanités.

Je rappelle aussi encore une fois que Procter & Gamble a coupé son budget de publicité numérique de $200 Millions sans aucun impact sur ses ventes et en augmentant sa portée de 10%. Ça devrait, en principe, en faire réfléchir une couple…

Ha oui, il semblerait, selon Newsweek, que 50% des abonnés Twitter de Joe Biden, soient de faux comptes! Cela semble très loin du compte de 5% de faux compte qu’avance Twitter…

Patrick Pichette CFO de Google m’excite et me met en tabar___

J’arrive à l’instant de la journée Espage Google organisée par Google Québec. L’un des conférenciers-surprises était Patrick Pichette, CFO de Google. Faisant partie de l’équipe de direction de Google, il est sans aucun doute le Québécois le plus important du monde numérique mondial.

Patrick Pichette m’excite

Déjà la candeur, l’humilité, la fougue et la passion très palpable qu’il avait pour son employeur Google et qu’il démontrait lors de sa courte présentation, me soufflait. Les meilleures allocutions sont souvent celles qui ne semblent pas préparées et qui viennent du cœur. L’auditoire était plus que servi. Il nous parla de sa fonction qui n’est vraiment plus celle de CFO, mais les titres, on s’en fout un peu chez Google à ce qu’il paraît. Il nous présenta « la douce folie des grandeurs » qui anime le conseil de direction. Lorqu’une idée est présentée, la question est de savoir si ce produit ou service peut intéresser un milliard d’usagers. Si c’est le cas, c’est un feu vert, sinon un feu rouge. La folie des grandeurs est un leitmotiv qui pousse à l’innovation et à l’excellence. Il nous parla du nouveau bureau de Toronto dans lequel les tapis sont confectionnés de recyclage de filets de pêche et dont l’ensemble de la planification, de la construction et de la mise en place, suit une idéologie des plus écolo. Il nous parla aussi de cette ville qu’il est en train de planifier sur le campus Google dans laquelle les automobiles n’auront plus leur place. Pourquoi utiliser des machines de 2 tonnes pour déplacer 125 livres? C’est alors qu’il nous donna l’exemple du Parc Lafontaine et du stress qui tombe soudainement lorsqu’on y met les pieds, puisqu’aucune automobile ne vient y ajouter le stress du danger (parlez-moi de ça de quelqu’un qui parle spécifiquement de l’endroit dans lequel il se trouve). Il nous raconta le processus d’embauche de son chef ingénieur du projet Google Fiber et de comment l’attitude de dépassement (la saine folie des grandeurs) lui avait permis de décrocher le poste. Mais lorsqu’il commença à nous parler des idéaux qui font de Silicon Valley, Silicon Valley. C’est à ce moment que je commençais à me mettre en tabarn_ak.

Patrick Pichette me met en TABARN_K

Il nous explique que dans la Silicon Valley, tout le monde semble obsédé par la technologie. Que ce soit les travailleurs technologiques ou même les préposés au Starbuck du coin. Il y règne des conversations constantes à propos de l’innovation et de comment on pourrait se partir une business. Tous ses voisins, les gens qu’il rencontre et avec lesquels il interagit, ont un enfant, un conjoint ou une personne qui leur est proche qui est dans une start-up ou qui songe à en partir une. Il y existe un vent d’optimisme qui n’existe pas ailleurs. D’ailleurs, les capitaux risqueurs se battent pour attirer chez eux ceux qui ont de bonnes idées à développer. Ils savent que ça prendra 19 échecs qu’ils financeront pour un succès qui lui atteindra le milliard d’usagers qui leur fera faire fortune. Cet optimisme est réellement contagieux. Il y a à cet endroit une masse critique de tripeux d’innovation qui viennent des quatre coins du globe ce qui fait que la diversité, qu’elle soit raciale, linguistique, d’orientation ou autre, est célébrée plutôt que d’être stigmatisée. Je commençais à être verte de jalousie.
Puis il revient sur le nouveau joujou de Google, le projet Google Fiber qui est un réseau internet super rapide qui est pour l’instant disponible seulement à Kansas City. Pour seulement $70/mois, vous aurez une vitesse maximale de 1GBPS. Pour vous donner un comparatif, notre haute vitesse ici est de 1,5MBPS c’est-à-dire 666.66 fois moins rapide. Puis il nous parla brièvement du retard du Canada et nous donna son exemple personnel. Il veut acheter plusieurs couronnes de sapin de Noël pour offrir en cadeau à plusieurs de ses amis. Alors il décide de magasiner en ligne et lors de sa recherche en français et en anglais, aucune entreprise canadienne n’apparaît en ligne ni dans les résultats payants ou naturels de Google. L’entreprise qui arrive première et qui vendra des couronnes de sapins de Noël aux Canadiens, d’où viennent les sapins, est une entreprise … du Texas. Là j’étais vraiment en TABARNAK. Puis vint alors la période de questions.

Ma question

Monsieur Pichette, je travaille présentement avec certains sages numériques du Québec à tenter de pousser dans le cul de nos gouvernements pour qu’à l’instar de New York, de la France et des États-Unis, nous ayons nous aussi un Plan numérique pour le Québec et votre allocution m’excite par toutes les innovations dont vous nous parlez et me met en tabarnak par notre retard, dont celui que notre vitesse internet n’est encore que de 1,5MBPS, pour eux qui ont la chance de l’avoir. Vous diriez quoi au gouvernement pour qu’il se grouille le cul?

Sa réponse (que je reprends ici de mémoire)

C’est une très bonne question (notez ici que c’est généralement ce qu’on dit lorsqu’on n’a pas de réponses). À mon point de vue la priorité principale est l’éducation. Il faut insuffler à nos jeunes le goût des mathématiques, des sciences et de l’anglais. Nous avons un excellent système d’éducation et c’est un atout. Malheureusement nos jeunes ne sont pas assez friands de mathématiques et de sciences, qui sont à la base du monde numérique. De plus, la langue internationale est maintenant l’anglais. Il faudrait que chaque québécois soit bilingue, tout en continuant de valoriser notre héritage commun qui est le français et continuer d’être fier d’être francophone. Il faut aussi encourager et stimuler l’esprit entrepreneurial. C’est cet esprit entrepreneurial qui sera à la base de la croissance et il faut l’inculquer à nos jeunes. Malheureusement je ne crois pas que ce soit une question de mois ou d’années. Ça risque même d’être une question de génération.

Ma conclusion

Après avoir écouté monsieur Pichette, je suis encore plus convaincue de notre retard et de l’importance d’agir. Je suis cependant plus optimiste que lui et j’ai bien l’intention de faire tout en mon possible pour continuer à convaincre la population en général et les dirigeants politiques en particulier, par tout les moyens possibles (dont par le blogue que vous lisez présentement), que nous devons prendre le virage numérique pour notre société et nos enfants, au plus criss. Je n’ai malheureusement pas le loisir d’attendre quelques générations…

Google : les consignes d’analyses référencements à leurs employés

Depuis sa création, l’algorithme de Google est tenu secret. C’est comme la recette du Coke ou de la Caramilk. De l’externe, on a une bonne idée du contour de cet algorithme en analysant les résultats qu’il génère et en procédant par une ingénierie inversée. Mais cet algorithme change et il arrive que l’intervention humaine soit nécessaire afin de valider ou d’invalider des sites web qui viennent polluer par diverses tactiques de référencement frauduleux (des sites de spam quoi) les résultats de recherche. Il faut se souvenir que le modèle d’affaire de Google est basé sur la pertinence. Google vend de la pertinence.

Or, grâce à un billet de David Carle, Le guide de l’évaluateur Google coulé en ligne: Voici les critères de qualité de l’algorithme naturel, nous prenons connaissance de plusieurs critères jugés importants par Google. Ce document est en ligne (plus bas) et étrangement, il ne contient pas les premières pages. Mais ayant cliqué sur certains liens qui y figurent, cela semble être “’the real deal”.

La surprise majeure relevée dans le billet de Carl est qu’il semble que Google autorise le contenu dupliqué:

Page 25 – Google vous donne le droit de copier du contenu

Selon Google, vous pouvez copier du contenu, seulement si celui-ci est de qualité. Belle logique ici. Probablement que le contenu copié est responsable d’une grande partie des revenus Google AdSense, donc la raison pourquoi cette pratique est non-seulement tolérée, mais encouragée.

Cependant je vous invite à considérer que ce guide est rédigé pour les employés de Google qui feront sporadiquement des interventions humaines sur les résultats. Je ne suis vraiment pas certaine que pour l’algorithme qui continue de générer la grande majorité des résultats, la même logique s’applique…

Bonne longue lecture et ayez toujours en tête qu’il ne s’agit pas de l’algorithme de Google, mais bien d’un document pour les employés dont la tâche est de filtrer occasionnellement la merde qui s’infiltre dans les résultats de l’engin de recherche…

Google + est mort, est plus vivant que jamais ou s’en fou

Le pote Martin Lessard sur le blogue de Radio-Canada, dans son billet Un déclin pour G+? note à juste titre que Google + vit une certaine diminution :

Malgré les 25 millions d’adeptes qui se sont joints au réseau en un mois, il semble que le rythme s’essouffle après un trimestre : il y aurait 41 % moins de commentaires publiés publiquement sur G+ qu’au début, selon la firme 89n. Comme toujours, il faut prendre avec des pincettes les chiffres. Ici, ils ne prennent pas en compte les commentaires privés. Mais on se pose tout de même la question : où est allé tout ce monde qui avait quelque chose à raconter?

Puis le blogueur techno du réputé PBS, Dan Reimold, trash Google + avec un titre sans équivoque Google+: Social Media Upstart ‘Worse Than a Ghost Town’ :

I am writing to second Tassi’s declaration: Google+ is dead. At worst, in the coming months, it will literally fade away to nothing or exist as Internet plankton. At best, it will be to social networking what Microsoft’s Bing is to online search: perfectly adequate; fun to stumble onto once in awhile; and completely irrelevant to the mainstream web.
To be clear, I do not buy the beta argument anymore. G+ still being in beta is like Broadway’s “Spiderman: Turn Off the Dark” still being in previews. It has premiered. Months have passed. Audiences have tried it. Critics have weighed in. It is a show — just not a very entertaining one.

Puis, Loïc Le Meur remet les pendules à l’heure dans son billet The Influencers Verdict: the Google+ example

-if the influencers still pay attention (unlikely) like they’re doing for Google+ because it’s Google, they will trash you has Dan Reimold just did. And many others did the last two weeks. It’s like becoming fashionable to trash Google+ these days, just to be different, just because it will get eye balls, just because it’s cool to say Google will fail, again, on social.

That’s the “influencers verdict” moment. When the influencers start either not paying attention or trashing you. That’s when you are really testing your service against normal users because you have just completely reached 99.99% of the influencers and they wrote everything they could possibly write about Google+ so all there is left to them is to trash it.

(…)It’s a great reminder on how to launch a new service: it’s not about the tech bloggers and writers, it’s about normal people and wether they will adopt it or not. Forget the influencers, the history is packed with services that succeeded when the influencers said it would fail and vice-versa.

No, Dan, your opinion doesn’t matter. It’s the other millions of users that matter, you might be right, but only time will tell. You’re trashing Google+ just because it will get you some attention today. update: it looks like you don’t even use Google+.

Apparté : Loïc Le Meur dit sur son mur Facebook can you guys kick my butt when I don’t blog anymore? I enjoy it but I get lazy. I’m trying to get back to a daily post. Serait-il en train de réaliser ce que je disais dans mon billet Le blogue, retour aux sources ???)

Incidemment, c’était hier que Google + ouvrait les vannes pour le grand public. Nous verrons donc dans les prochaines semaines si Google + relève le défi de la croissance et de l’adoption massive des « usagers ordinaires ». Pour ma part, j’ai confiance que Google + deviendra un joueur majeur de la sphère des médias sociaux, mais pas nécessairement parce que c’est un média social. Ce sera plutôt parce que c’est une plate-forme centralisatrice qui fédère sous un même point, tous les services de Google et que c’est la porte d’entrée de ce que nous nommons aussi l’informatique dans les nuages, tel que je l’expliquais déjà dans mon autre billet Google + n’est peut-être pas un média social ?

MAJ
Question de jouer les trouble-fêtes de ceux qui prédisent la mort de Google +, il connaît une croissance exponentielle depuis qu’il a ouvert les vannes. Chez plusheadlines.com :

Here is a quick look at the estimated total users on Google+ at the specific dates below, using Paul Allen’ssurname model:
• July 4th – 1.7 million users
• July 9th – 4.5 million users
• July 12 – 10 million users
• September 9th – 28.7 million users
• September 22nd – 43.4 million users
Allen has also indicated that in the past 2 days alone, since the beta launch of Google+, the user base has increased a dramatic 30%.

P.-S. Vous êtes de toute évidence invitez à me suivre aussi sur Google+ 🙂