les statistiques des consultations de wikipedia

Qui la rédige et comment, la question a été traitée dans les précédents articles.
Qui la consulte et pour quels sujets ?
D'abord et au 1° coup d'oeil ce que tout le monde sait déjà plus ou moins, wikipedia n'est pas consultée pour ses articles relevant de la connaissance, autrement dit ses articles encyclopédiques, mais pour tout ce qui relève de l'actualité et des loisirs , avec prédominance pour tous les sujets liés au sexe, qui sont l'essentiel des consultations..
Ensuite, et étudiant plus minutieusement, apparaît un phénomène étrange, une disproportion considérable entre les articles consultés qui totalisent pour la 1° dizaine des chiffres se comptant à partir de 300 000 environ puis allant dans un ordre décroissant tel que dès la 2° dizaine des articles les plus consultés, ils se comptent en dizaines de milliers. Voilà pour les articles. Mais ce qui fait l'essentiel des statistiques des consultations, qui se comptent en dizaines de millions, ce sont wikipedia accueil et recherche.
Là c'est autre chose. Tout à fait autre chose. C'est wikipedia comme moteur de recherche et/ou page d'accueil, mais on ne retrouve pas ces chiffres dans les consultations d'articles.
Les plus consultés sont les articles de sexe, sports, loisirs.
Un correspondant ouvre le sujet :
Le succès de Wikipedia tient à la consultation des articles en rapport avec le sexe, loin devant toutes les autres catégories . Les articles de Wikipedia n'ayant pas de caractère franchement porno, on peut penser qu'elle trouve ce succès auprès des (très jeunes) ados).
Viennent ensuite les sports, les loisirs et divertissements de toutes sortes.
L'ensemble fait le plus gros de la consultation. Et de fait, la consultation pour des sujets ayant un rapport avec ce que présente une encyclopédie, c'est à dire la connaissance, ne représente qu'une très petite minorité de ce qui est consulté, comme on peut le constater en utilisant les outils statistiques disponibles.
Les gens ne s'en servent pas comme ils se serviraient d'une encyclopédie, mais comme d'un instrument qui double et complète Google, pour trouver un mot, une date, un lieu géographique ou un renseignement factuel du genre qui a gagné le championnat de chose ou truc en telle année ?
Mais elle doit son succès pour l'essentiel à un public adolescent, dans un rapport ludique avec l'internet, sexe, loisirs, blagues y compris le jeu qui consiste à écrire n'importe quoi sur Wikipedia. Mais ils ne vont pas y chercher une encyclopédie, malgré le fait que la presse et les articles sur internet répètent benoitement que Wikipedia serait une encyclopédie, certes non fiable mais une encyclopédie tout de même (?)
Je ne sais pas si vous avez déjà vu une encyclopédie non-fiable, ni si cette expression a un sens. Pour moi, elle n'en a pas. Wikipedia est un jeu, une esbrouffe, un pari d'une communauté qui s'amuse et qui se monte la tête, rien d'autre.
J'enchaîne.
Tout à fait d'accord, le succès des consultations de wikipedia réside dans les domaines de sexe, sports, loisirs divers, c'est de notoriété publique du reste.
J'ajouterai même que les statistiques de la wikipedia en anglais donnent des résultats de consultation où tous les sujets liés au sexe recueillent une écrasante majorité au point de paraître constituer la quasi exclusivité des consultations. voir les statistiques.
Ensuite, en effet, les gens prennent-ils wikipedia comme une encyclopédie ou comme une annexe complémentaire de Google ? C'est la question et j'admettrais avec vous qu'on peut douter qu'ils y croient à "wikipedia-encyclopédie" alorsqu'ils l'utilisent durant leurs loisirs, pour leurs loisirs donc et sur un mode ludique pas sérieux, pour ne consulter que des sujets ayant trait aux loisirs, sans y croire comme encyclopédie. Ce serait logique.
L'étude demande à être approfondie, en tout cas, mais cette idée me paraît plausible et intéressante .
Observation détaillée
On parle d'encyclopédie. La presse accepte de nommer ainsi wikipedia, mais en vérité ? Qui la consulte ? Pour quoi ? Qui la rédige ? Comment ?
Pris sous ces rapports, toute idée d'encyclopédie disparaît lorsqu'on observe les pratiques générées par wikipedia indépendamment de sa prétention à être une encyclopédie.
Pratiques de consultation, c'est en effet les sujets sus-nommés qui font le succès de wikipedia.
Ce sont ces sujets qui font 90% des consultations de wikipedia (voire davantage) de même qu'ils font 90% de son contenu.
Pratiques de rédaction : pour moi , au vu de ces pratiques , tenant compte des discussions, disputes, commentaires, votes permanents de règles surréalistes et néanmoins respectées de manière totalement aléatoires, prises de décisions absurdes, raisonnements qui le sont tout autant etc. etc. etc. cela m'apparaît comme un vaste forum, du point de vue des rédacteurs , un jeu, un processus de socialisation peut-être, comme l'écrivait un commentateur du blog. Plus l'occasion d'avoir sous la main une excellente plate-forme de propagande pour ceux que cela intéresse et qui n'ont rien d'autre à faire que de se livrer à des bagarres sur wikipedia pour faire triompher leur point de vue.
Des deux points de vue, sous ses deux aspects consultation et composition, wikipedia n'a rien d'une encyclopédie. Il s'agit d'autre chose, distraction, détente, invention d'une nouvelle communauté qui réinvente tout sur tout... un loisir pour les geeks, un jeu de geeks pour les geeks.
Le côté ludique de la consultation est prédominant.
Distraction et occasion de jeux et de blagues pour adolescents (ou enfants) en bandes d'amis, très certainement. Quand on s'ennuie et qu'on a rien à faire, ou quand on fait miner de travailler et de faire ses devoirs, à la bibliothèque du collège ou du lycée, à la maison, c'est tellement plus marrant de déconner avec les potes, avec et sur wikipedia.
Un jeu pour les ados, pimenté par un peu de sexe, sur les articles les plus consultés.
Un jeu pour les rédacteurs également, qui se croient devenus encyclopédistes. C'est gratifiant pour pas cher. Regardez, même ces grands ados que je mets régulièrement à la porte qui viennent ici tout enflés de se présenter comme des encyclopédistes, usant pour le prouver d'arguments plus que faibles et bien dérisoires.
Wikipedia se taille une place sur le net par la quantité de ses articles, au détriment de la qualité, comme je l'ai déjà dit. Cet effort pour multiplier les articles afin d'occuper la place et de battre des records en nombre se traduit par le fait que seuls 30% des articles de wikipedia dépassent 2 lignes, comme le montre l'étude des statistiques que j'ai précédemment faite ; voir ce que révèlent les statistiques de wikipedia
Les rédacteurs s'amusent mais 70% de leur encyclopédie ressemble à des notices de dictionnaire, plus ou moins exactes toutefois, ou ce sont de véritables gags. De plus un pourcentage non négligeable d'articles ne concernent que des sujets mineurs, voire totalement folkloriques, ou ne traitent que des variétés grand public, sport, actualité anecdotique etc. Les articles dédiés à la connaissance doivent représenter au maximum de 5 à 10% de la totalité de cette étrange encyclopédie. Mais que valent-ils ? Pour une bonne partie d'entre eux, pas grand'chose.
Ne restent que les articles qui ressemblent à ce qu'on trouve dans une encyclopédie. Là de deux choses l'une, ou le consultant a un niveau suffisant pour s'apercevoir qu'ils sont mauvais, voire exécrables ou honteux, et il laisse tomber. En philo c'est le cas, vous ne trouverez pas un élève, encore moins un étudiant, qui puisse se satisfaire de ses articles absolument nuls, erronnés , dépouvus de toutes les qualités qu'attend le lectuer lambda. Vous ne trouverez pas un élève, encore moins un étudiant, pour utiliser wikipedia. Cela, je peux l'affirmer, c'est mon métier. Même chose en littérature et toutes les sciences humaines : trop mauvais, voire totalement nul, ce qui n'empêche pas qu'ils soient faux, bien entendu. (je pourrais citer un petit florilège)
Ou encore, le collégien ou l'élève du primaire, qui ne s'en rend pas compte car il n'en a pas les moyens. S'il s'en sert et recopie dans ses devoirs il rencontrera vite l'avis du prof lui faisant remarquer les erreurs.
Donc soit le lecteur est un jeune dépourvu de formation et s'y laisse prendre, soit le lecteur est averti et suffisamment cultivé, il se rend compte-par lui-même de l'insuffisante des articles
Que montrent ces listes ?
Une fois que vous avez passé les entrées qui font le plus de consultations, telle "wikipedia" et "accueil wikipedia", vous avez dans les premières places les portails sexualité, pornographie etc. à partir desquels on circule de lien interne en lien interne, jusqu'aux actrices et acteurs de films porno, leurs noms, ceux des films, puis les sites porno eux-mêmes. Vous avez nombre de noms concernant la sexualité qui sont placés dans les tops du classement qui s'ajoutent à cela.
Quant aux autres sujets c'est vraiment sports et variétés, vedettes de la chanson, du cinéma, de la télévision, mangas etc. et des renseignements pratiques, tels indicateurs téléphoniques à travers le monde et diverses listes donnant des renseignements d'utilité quelconque, des noms de villes ou de pays...
Sur les 1000 premiers articles les plus consultés il y en a vraiment très peu , quelques dizaines à peine, qui relèvent d'un sujet de connaissance ou sujet encyclopédique en termes classiques
Il faut savoir aussi que lorsqu'on arrive dans les rangs 800 / 900 des articles les + consultés, on a pour ces articles là environ 14 000/ 13 000 consultations, à comparer avec le 1° accueil wikipedia : 12 millions 1/2 et les 10 premiers articles plus consultés qui sont du wikipedia (recherche, page au hasard, wiki etc.).
Passons donc la première dizaine qui représente l'arrivée sur wikipedia, les deux premières dizaines, ensuite, sont dans les 100 000. On change d'échelle.
Les consultations sur les sujets sexe-porno , activités, et curisosités ayant trait au sexe se situent dans les 60 000. Et il y a une multiplicité de sujets et entrées dans ce domaine : tous les noms communs ayant trait au sexe, physiologie, activités, curiosités, perversions, avec toutes sortes de listes, personnages travaillant dans le porno, oeuvres porno, tout ce qui peut-être cité fait l'objet d'un article et c'est l'ensemble de ces articles qui arrive en haut du top des consultations ( à additionner donc) si l'on excepte les millions pour l'accueil qui font la 1° dizaine.
Même chose pour le sport qui vient immédiatement après : multiplication des articles qui doivent être additionnés pour dire que cette catégorie vient en 2° après le sexe. Comme sur internet en général du reste, ça n'a rien d'original et montre justement que wikipedia est un pur produit internet, son miroir.
Tandis que vous n'avez évidemment, qu'un seul article Napoléon, Louis XIV ou François 1°. Donc quant au nombre de consultations, il n'y a aucune équivoque et l'on peut dire que la proportion des consultations sur ces articles est infime par rapport à ce qui fait l'essentiel des consultations.
N.B. sujet déjà abordé dans l'article du 1° juin 2007 : qui rédige wikipedia ? qui la consulte ? : qui traite de ce qu'il n'y a pas de place pour les droits de l'homme à wikipedia, mais pour les variétés concernant le sexe les sujets sont illimités, et, de plus très consultés, à quoi sert wikipedia ? ainsi que qui écrit wikipedia ? article de décembre 2006.
De manière plus détaillée, les sujets des articles :
Une fois les premiers articles passés, on a : Jeux olympiques, Paris, des trucs techniques , portail médecine et arrive porno et sexe , (dans les rangs 40 : là on est dans les 60 000 consultations par sujet) suivis de plein d'autres articles concernant le sexe : faut additionner l'ensemble de tous les articles qui concernent ce thème.
Mais comme signalé précédemment la wikipedia en anglais fait beaucoup mieux sous ce rapport : la consultation des articles de sexe est impressionnante [statistiques]
Ensuite, on trouve des sujets d'actualité mais qui ne relèvent pas exactement de la connaissance. Ce sont ces articles où chacun se précipite écrire n'importe lors de l'événement. Ces articles ne sont guère encyclopédiques.
Après on a de la variété, vedettes diverses du monde du sport, de la chanson, du cinéma, alternant avec des sujets sur le sexe et jeux olympiques, les séries télévisées, et des infos pratiques : noms de villes, indicatifs téléphoniques.
Articles portant sur des sujets encyclopédiques, Hitler (un best-seller) arrive en 131, suivi de Louis XIV, II° guerre mondiale, Napoléon, I° guerre mondiale, (là on est à 228 du classement) Victor Hugo, maths, architecture, astronomie, Mozart, Einstein, physique, Voltaire, chimie , Henri IV, Jules César, Jésus, Martin Luther King, droit, philosophie, Shakespeare... ajoutez-en encore 4 ou 5, et c'est à peu près tout.
Admettons environ 20 à 40 articles dont le sujet est encyclopédique, sur mille c'est peu.
Pour la quantité, je trouve cette proportion assez significative en elle-même.
Pour la qualité il y a encore pas mal à dire. Par exemple philosophie : à peu près tout est complètement nul et faux, gravement faux.
Articles encyclopédiques ayant rapport à la connaissance, 20 à 40 pour mille = 2% à 4% environ c'est peu.
En plus si vous prenez en compte que ceux qui se trouvent plus bas dans le classement ont moins de consultations, par définition, on est là dans les 15 000 à 13 000, par exemple quand on arrive dans les rangs des centaines 700, 800, 900, ça fait encore moins. Si vous ajoutez les truandages par ex. Israël appellé Palestine juive (= wikipedia ne reconnaît pas l'existence de l'Etat d'Israël !) l'ensemble ne fait pas vraiment encyclopédie .
C'est du moins mon avis et l'impression que ça donne lorsqu'on épluche d'un peu près.
Comment comprendre ces comptages statistiques ?
A ces statistiques dites de "consultations" il faut ajouter toutes les interventions des wikipédiens, incluses dans les comptes mais non évaluées, soit toutes les modifications faites par toutes les petites mains des wikipédiens qui à longueur de temps, jour et nuit, rajoutent un mot, une virgule, une remarque, un avis, et discutent sans fin sur toutes les pages de discussion et bulletins divers et lieux d'échange, qui sont au total incomparablement plus volumineuses que les articles eux-mêmes. Certains wikipédiens y passent tout leur temps, en font des centaines et des milliers par jour.
Ce qui me frappe, c'est que les pages ayant wikipedia pour objet et qui relèvent de l'utilisation de ses moteurs de recherche internes, ont des taux de consultation qui se comptent en millions, tandis que les meilleurs articles du classement sont dans les +/- 100 000 et quelques : on n'est pas dans la même dimension.
Pourtant ces millions d'usages des outils de recherche sont comptabilisés comme des consultations d'articles et font bien entendu partie des scores de wikipedia qui lui assurent son rang au top des classements de Google.
Il y a un truc étrange : le tableau des consultations montre respectivement 19 millions et 12 millions de consultations pour l'arrivée sur wikipedia alors que quand on passe les 10 premiers du classement on est dans les 100 000 et quelques , et pour ceux classés au delà de 20 ou 25 ça se compte par dizaines de mille.
1 | Special:Recherche | 19 145 585 |
2 | Accueil | 12 548 676 |
5 | Special:Page au hasard | 1 566 640 |
6 | Special:Search | 766 378 |
7 | Special:Liste de suivi | 382 070 |
8 | Wiki | 320 664 |
9 | Portail:Accueil | 230 494 |
= total près de 36 millions rien que pour wikipedia
Le reste, soit les articles, ne se compte pas en millions mais en centaines de milliers pour la 1° dizaine, et très vite, dès la 2° dizaine, on est en dizaines de milliers, une fois passés les classements concernant wikipedia. Les dernières de la liste des 1000 les plus consultés sont à quelques milliers de consultations.
Pire encore d'après cet instrument de statistiques accueil wikipedia cumule plus de 28 millions de consultations. Le logiciel de stats cité donne ici 16 millions de plus pour l'accueil que le chiffre cité dans le tableau ci-dessus. Donc les pages wikipedia sont comptées pour environ 52 millions de consultations, au total.
Les gens s'arrêtent-ils à l'accueil quand ils consultent Wikipedia ? Utilsent-ils les moteurs de recherche internes sans toutefois consulter autant d'articles que wikipedia le sous-entend ?
52 millions pour wikipedia pages d'accueil, recherche, et sommaire des rubriques Wikipedia, et le reste fait combien ?
Reprenons. Un rapide calcul des résultats pour les autres articles donne ceci :
articles classés de rangs 12 à 27 : 2 millions de consultations
articles de rangs 27 à 40 : un million
articles de rangs 40 à 58 : un million (je ne compte pas les articles wikipedia et appartenant encore au sommaire)
articles de rangs 59 à 85 : un million
articles de rangs 86 à 145 : un million
articles de rangs 146 à 190 : un million
= lorsqu'on arrive au rang 200 on est donc à environ 7 millions de consultations au total
articles de rangs 200 à 500 : environ 7 millions 1/2
articles de rangs :500 à 1000 : environ 7 millions 1/2 encore
soit, hors consultation wikipedia accueil, recherches diverses (recherche, page au hasard et liste de suivi etc. )qui fait à elle seule environ 52 millions on a environ 24 ou 25 millions pour les 1000 articles les plus consultés.
Disparité intéressante qui laisse penser que les articles sont beaucoup moins consultés que les nombres de consultations affichées ne le laisseraient penser.
Alors ? Quelle est l'explication ? Les gens s'arrêtent à page d'accueil et sommaire etc. qui sont deux fois plus consultés que la totalité des articles eux-mêmes si l'on prend pour référence les chiffres donnés par le 2° logiciel de mesure de traffic, plus précis ?
Quel est votre avis, pour expliquer cette énorme disparité et l'intérêt pour wikipedia, son existence et son accueil, plus que pour ses articles ? Cela vous intrigue-t-il autant ?
Pour l'autre aspect des choses qu'indiquent ces statistiques, soit les loisirs préférés à la connaissance, il n'y a pas lieu de tellement s'étonner. S'ils sont mis en concurrence, c'est de la concurrence déloyale.
Sur ces articles ayant trait à la connaissance, sur un total de consultations qui ne fait que la moitié du traffic de wikipedia (dont il conviendrait de retirer de plus toutes les interventions des wikipédiens) il faut noter que 2% à 4% tout au plus traitent d'un sujet encyclopédique.
Enfin, si l'on prend en compte la qualité de ces articles, d'après ce que j'évalue grosso modo, il n'y a pas 10% d'articles corrects (10% étant une proportion très très généreuse).
Donc prenons ces 2% ou 4% de consultation représentant les articles ayant trait à la connaissance, et 10% de ces 2% à 4% qui ont une qualité acceptable, cela fait
= 2% à 4 % de consultations d'articles ayant un sujet encyclopédique
= mais 0,2% à 0,4% d'articles susceptibles d'avoir une qualité encyclopédique parmi ceux qui sont consultés.
Taux d'intérêt estimé qui peut exister à la consultation de wikipedia comme références utiles à a connaissance compris environ entre 0,2% et 0,4%.
C'est peu. Mieux vaut, par conséquent, dans une recherche sur internet, chercher par soi-même les documents susceptibles d'être intéressants, on gagne du temps et on trouve des documents beaucoup plus intéressants et de meilleure qualité.
Wikipedia est une magistrale perte de temps, étant donné qu'il faut tout vérifier, chaque phrase étant susceptible de contenir une erreur, (ce qui est le cas pour les articles de philo par exemple) et les sources bibliographiques étant notoirement incomplètes et inappropriées dans pas mal de cas, comme je l'ai montré sur le blog avec de nombreux exemples.
Alithia
N.B. : Je ne compte pas parmi les articles encyclopédiques ceux du type Sarkozy-Royal sur lesquels tout le monde se précipite et tout le monde écrit n'importe quoi au moment des élections, pas plus que ceux sur la Chine au moment des jeux olympiques ou J-C Brialy au moment de sa mort, pas plus que ceux sur la Géorgie , l'Ossétie, l'Abkhazie, au moment de la guerre : dans l'urgence de l'actualité des centaines de milliers de modifications apparaissent où tout le monde écrit n'importe quoi , comme pour Cecilia ou Carla, n'importe quoi qui sera effacé ensuite.