Après un format publicitaire comme AdSense, Google propose aux webmasters d’enrichir leur site avec du contenu extrait de ses bases de données.
Google soigne ses relations avec les éditeurs du web. Après des outils de monétisation comme les liens sponsorisés AdSense, le groupe américain a dévoilé vendredi “Related Links”, un service permettant à n’importe quel webmaster et autre bloggeur d’enrichir son site avec des contenus issus de ses bases de données.
La suite chez NetEconomie Actualité le 9 Septembre, 2006, 4:08am
Moteur de rechercheLa plateforme de blogs américaine (Weblog Community) Xanga voit la Federal Trade Commission (FTC) lui infliger une amende d’1 million de dollars pour avoir violé le Children’s Online Privacy Act en ouvant des comptes à des enfants de moins de 13 ans sans l’accord de leurs parents, Xanga déclare faire plus attention desormais.
Par ailleurs, on voit que les utilisateurs qu’on invite à prendre le pouvoir dans le Web 2.0 ont vite appris à le faire.
Trop au goût du fondateur de Digg Kevin Rose. Il explique qu’il change les règles du jeu pour éviter qu’un petit groupe d’utilisateurs d’accord entre eux prenne le contrôle de la communauté et arrive a mettre en tête les infos qu’il souhaite, chacun votant pour les infos mises en ligne par les autres. Désormais, il y a aura deux classements : d’un cotê, les ‘Top Diggers’, de l’autre, les ‘Top Submitters’. Du coup, P9 le plus célèbre des utilisateurs annonce qu’il s’en va.
Par contre Mark Zuckerberg le patron de la communauté Facebook a du faire marche arrière. Il avait commencé par demander aux mécontents de se calmer. Mais il bat sa coulpe hier vendredi sur son blog : “nous nous sommes plantés“. Mis en place mardi, le système News Feed qui informait automatiquement le réseau d’amis d’un abonné dès que celui ci faisait une modification, avait provoqué une levée de boucliers, plus de 600 000 contestataires en quelques jours. Les abonnés pourront désactiver complètement cette fonction, ou choisir quelles informations seront communiquées à leur réseau d’amis expliquait le Washington Post hier.
Originellement Par Gilles Klein chez pointblog.com le 9 Septembre, 2006, 4:08am
Informatique
Le succès incroyable de Digg a récemment connu quelques heurts. Digg est un site qui permet de promouvoir de nouvelles informations soumises par les utilisateurs et qui apparaissent en page d’accueil en fonction du nombre de votes des utilisateurs de Digg. Si une histoire est votée (« dugg ») par suffisamment d’utilisateurs alors elle apparaît en page d’accueil et le lien pointe vers le site éditeur de l’information.Alors qu’AOL vient de transformer NetsCape en un clone massif de Digg, un certain nombre de personnes se sont plaints de la capacité d’un nombre limité d’utilisateurs organisés de promouvoir ou retirer une histoire de la page d’accueil.
La bloggueuse politique Michelle Malkin a été l’une des premières à s’en plaindre en disant qu’un groupe organisé d’utilisateurs de Digg conservateurs ou libéraux ont agi pour retirer les billets de bloggeurs d’un autre courrant politique. Plus récemment, un autre bloggeur a analysé la page d’accueil de Digg et est arrivé à la conclusion qu’un petit groupe assez influent d’utilisateurs de Digg et organisé contrôle une grande partie de ce qui apparaît en page d’accueil.

Pour certains cela peut être troublant car cela pourrait remettre en question l’approche démocratique de Digg. Contrairement aux journaux comme Le Monde ou le New York Times ou un petit groupe d’éditeurs décident ce qui fait l’actualité et sera publié dans le journal, Digg propose une approche collaborative à travers flux « démocratique » ou chaque lecteur décide ce qui est susceptible de capter l’attention. Si Digg est « parasité » par un nombre limité de groupes d’utilisateurs, la différence entre Digg et les journaux traditionnels est moins claire.
D’autres déclarent qu’il ne s’agit que de groupes d’utilisateurs passionnés qui passent leur journée à la recherché d’histoires à succès. Digg note les utilisateurs en fonction de leur capacité à soumettre des informations qui deviendront populaires, et certains utilisateurs sont très attachés à leur position dans les classements. L’argument consiste à dire que ces utilisateurs sont simplement meilleurs dans leur capacité à trouver des histoires intéressantes.
Hier le co-fondateur de Digg Kevin Rose a répondu à ces critiques. Il déclare que les groupes de personnes qui recommandent les informations les plus intéressantes à leurs amis sont plutôt une bonne chose. Mais il annonce aussi que Digg mettra en place bientôt un algorithme qui attribuera plus de poids un groupe hétérogène d’utilisateurs plutôt qu’ à des groupes organisés.
Cela me semble être une bonne approche. Digg doit continuer d’encourager les personnes à recommander des informations à leurs amis mais aussi trouver un moyen pour les histoires uniques et intéressantes arrivent en page d’accueil sans le soutien de groupes d’utilisateurs. Espérons que l’approche algorithmique est la bonne. Une autre suggestion que nous avons transmis au CEO de Digg récemment Jay Adelson : attribuer plus de poids à une histoire si les votes proviennent de la section « upcoming » (en attente) par rapport aux histoires votées depuis un lien direct. En effet comme les groupes se passent souvent les histoires par email ou messagerie, il est plus probable qu’il s’agisse d’un vote de groupe. Un vote depuis la section upcoming est certainement plus le fait d’un utilisateur ayant lu et analysé l’info plutôt qu’un clic « automatique » issu de la recommandation d’un groupe.
Mise à jour: l’un des principaux contributeur de Digg vient de quitter le service suite aux remarques de Kevin…
Note d’Ouriel : Cette analyse vaut certainement pour tous les services utilisant le principe de vote collaboratif et ils sont nombreux. En France par exemple, nous les avons souvent cité, je serai curieux de savoir ce que pensent de cette polémique les acteurs proposant un service proche ou similaire à Digg. Juste pour les rappeler il y a Fuzz, Scoopeo, Allactu.com et TapeMoi sans oublier Wikio (ndlr : je suis actionnaire de Wikio)
![]()
Voilà l’occasion aussi de vous signaler NewsBurn, un service français d’actualité personnalisable doté d’un module de vote collaboratif. Newsburn, lancé le 3 septembre 2006, est d’une part un agrégateur de flux d’actualités prédéfinis avec une sélection de 200 sources par pays classés par catégorie mais aussi un lecteur RSS. Vous pouvez créer votre propre sélection d’actualités en ajoutant ou supprimant des catégories et des sources d’informations. Chaque histoire peut être votée par la communauté. Il s’agit donc plutôt d’un hybride en Digg et BlogLines ou NewsGator.
Bref je serai intéressé d’avoir sur ce blog le point de vue des confrères de Digg sur cette histoire.
Originellement par Michael Arrington et Ouriel Ohayon chez Techcrunch FR, le 8 Septembre, 2006
weblog
Les résultats du Persoweb 2006 le premier concours belge récompensant des “medias personnels et non professionnels.” organisé par le journal Le Soir et la radio RTL Belgique
Blog d’Or 2006 : Corinne Dilenseger, pour Tout pour elles
un blog pour les “femmes actives et celles qui cherchent un emploi.”
Perso d’Or 2006 : Thierry Van Goubergen, pour Chronique d’une enfance génétiquement modifiée, le blog de Shan, 10 ans, handicapée mentale, privée de parole qui communique en pointant des images
Podcast d’Or 2006 : Benoît Marchal pour Déclencheur un podcast consacré à la photographie.
Vlog d’Or 2006 : Zazon Castro pour Zazon “Une sorte de caméra cachée pleine de candeur et d’humour.”
Originellement par Gilles Klein chez pointblog.com le 8 Septembre, 2006, 5:45am
weblogDébut août, une équipe d’AOL Research a mis en ligne, avant de le retirer promptement, un document contenant des millions de données sur les recherches effectuées par ses utilisateurs américains (concernant quelques 658 000 internautes ayant effectué quelques 20 millions de requêtes sur les mois de mars, avril et mai 2006). Téléchargé plusieurs centaines de fois, le fichier a été depuis livré en pâture sur l’internet (il existe même plusieurs moteurs de recherche spécifiques permettant de mener des requêtes sur ces données, notamment AOL Search Database, Datablunder ou Frogspy…).

Le fichier a déjà été exploité par de nombreux chercheurs et blogueurs (comme BioloGeek), et a livré des premiers résultats généraux assez intéressants, indique SearchNewz :
Pourtant l’essentiel n’était pas dans les résultats généraux.
Avant publication, le fichier avait été rendu anonyme : le nom des abonnés n’était pas visible et avait été remplacé par des numéros d’identification. Une anonymisation qui n’a pas servi à grand-chose : la liste des recherches associées à chaque identifiant a permis à de nombreux pisteurs de retrouver la trace d’internautes, d’identifier leurs numéros de sécurité sociale, leurs adresses parfois, jusqu’à leurs noms pour certains. En observant la seule liste des requêtes quotidiennes, sur plusieurs mois, il n’est souvent pas difficile de comprendre les préoccupations de l’internaute, d’imaginer son intimité, voire de retrouver son identité.
Les journalistes du New York Times sont par exemple parvenus à identifier l’utilisateur “4417749″, une veuve de 62 ans, grâce à la liste de ses requêtes (par exemple : “chien qui fait pipi partout”, “taxe foncière de Harrisburg, Virginie”, “solitude”, “Paranoïa”, “Thé pour une bonne santé”, etc.). Le grand jeu de l’été a ainsi consisté à pister les requêtes les plus étranges, faisant apparaître un formidable “tableau des intentions cachées”, comme le soulignent Google Blogoscoped et Chryde. Le Guardian évoque ainsi cet homme, qui a une passion pour le football portugais et vit dans une ville de Floride. Visiblement, il apprend que sa femme a une relation extraconjugale et les requêtes qu’il effectue sur son moteur décrivent l’évolution de sa relation : “Ma femme ne m’aime plus”. Il cherche à “interrompre son divorce” puis à prendre une “revanche sur sa femme” avant de regarder les propres symptômes de son malaise : “manque d’alcool”, “symptômes du manque d’alcool” (à 10 heures du matin) et “problème d’érection”. Le 1er avril, il chercha un médium local pour lui “prédire son futur”.
Autre exemple frappant ? L’utilisatrice 11110859 à New York qui, le 7 mars, a recherché des “fringues hip-hop”. Le 26, elle a cherché “perdre sa virginité” avant de s’interroger pendant plusieurs semaine pour savoir si on “pouvait tomber enceinte même après avoir eu ses règles”. Quelques temps plus tard, elle s’interroge à nouveau “pourquoi les gens font-ils mal aux autres ?” Le 19 mai, elle demande : “Comment aimer quelqu’un qui vous maltraite ?”, “Que dit Jésus à propos d’aimer ses ennemis ?” Ensuite, elle demandera encore “la direction de la prison de New York” avant de demander au moteur “quels objets a-t-on le droit d’y apporter ?”
On pourrait rapporter beaucoup d’autres histoires sur ces requêtes mises bout à bout. Un site, AOL Psycho, invite même les internautes à décrire collectivement les profils pour repérer les cas les plus “intéressants”, les plus emblématiques ou les plus dangereux, c’est selon. Ces tentatives de retracer des parcours individuels font froid dans le dos. Bien sûr, pour quelques séquences de recherche éclairantes, la plupart des autres s’avèreront sans doute impossibles à interprêter. Mais le “17556639″ voulait-il vraiment “tuer sa femme”, comme il l’a formulé à plusieurs reprises ?
Si quelques chercheurs ont exprimé des réserves éthiques a utiliser un tel fichier, comme l’indique l’International Herald Tribune, d’autres se sont félicités de disposer d’une telle ressource, qui est rarement accessible au commun des chercheurs. Reste que le scandale AOL pose de nombreuses questions laissées sans réponses et notamment sur le rôle et la fonction de l’anonymisation. Car on ne rend pas des données anonymes en masquant seulement le nom de leur utilisateur, comme semblaient le croire certains chercheurs d’AOL.
Les traces de nos requêtes que gardent les moteurs ne sont pas innocentes. Bien sûr, pour les moteurs, ces données servent à fournir des résultats plus pertinents, à personnaliser nos résultats de recherche en fonction de nos habitudes pour nous fournir un meilleur service. Sont-ce des raisons suffisantes pour qu’ils conservent indéfiniment des informations aussi sensibles ?
“Où est le pouvoir totalitaire ?”, s’interroge le Guardian, avant de répondre : le vrai pouvoir totalitaire ne repose peut-être pas tant sur la censure, que sur le fait de laisser les citoyens dire et chercher ce qu’ils veulent - et le garder en mémoire.
Il s’agit pourtant d’une question récurrente, à laquelle les réponses apportées ne sont jamais satisfaisantes. Quelle est la valeur réelle, dans le temps, des traces de connexion et de recherche ? Augmente-t-elle avec le temps et les progrès technologiques ? Comment anonymiser les données à l’origine ? Peut-on préserver leur valeur marchande tout en respectant l’intimité de chacun ? Ou se situe l’équilibre ? Faut-il adopter une mesure radicale comme celle que prône Jason Calcanis de Weblogs Inc., récemment rachetée par AOL, à savoir de ne plus garder aucune trace des requêtes effectuées ? Faut-il créer une autorité indépendante qui vérifie la destruction régulière de ce type de données, comme le suggère Bruno Giussani ? L’EFF (Electronic Frontier Foundation) appelle à une politique claire de conservation des données ; “AOL pourrait rendre un grand service à la communauté en ligne en s’engageant à supprimer définitivement les données de requêtes et en poussant les autres entreprises à faire de même“, affirme pour sa part Marc Rotenberg, directeur de l’Epic (Electronic Privacy Information Center).
Certes, Google par exemple affirme régulièrement que les données collectées ne seront divulguées nulle part, et qu’en aucun cas les gouvernements (même celui des États-Unis) n’obtiendraient leurs fichiers. Mais comme l’expliquent de nombreuses associations, le mieux serait peut-être que ces données n’existent pas.
Certes, des techniques qui nous permettent d’anonymiser nos données à la source (outils, moteurs “propres”, navigateurs) refont surface depuis l’incident AOL, dont certaines sont extrêmement simples. Mais les internautes ne changeront pas si facilement leurs habitudes, et l’on serait en droit d’attendre que les entreprises aillent au-devant de ces attentes. “Les moteurs de recherche doivent comprendre qu’ils disposent d’informations très sensibles, même si cela n’implique pas forcément des données personnellement identifiables“, rappelle Ari Schwartz, vice-président du Center for Democracy and Technology.
Assurément, le log - c’est-à-dire, le journal des connexions au serveur -, qui permet d’identifier l’internaute et de tracer l’historique de ses actions, est appelé a prendre de plus en plus d’importance, à mesure que nous utilisons l’internet pour accomplir de plus en plus de choses de la vie de tous les jours. Cette donnée a toujours été capitale pour tous les acteurs de l’internet. Mais il est peut-être temps en tout cas de s’interroger sur son sens, son risque, sa valeur, sa pérennité et sa volatilité. Si les gouvernements européens font aux fournisseurs d’accès obligation de conserver les données de connexion - mais pas les contenus des communications -, reste que les contenus de ces données doivent être éclaircies. Car une chose est sûre : si ces données existent, tôt ou tard, quelqu’un en abusera.
En attendant, manifestement, les moteurs de recherche continuent de jouer aux apprentis sorciers avec nos données.
Originellement par Hubert Guillaud chez InternetActu, le 7 Septembre 2006
actualitéChampion des blogs avec ses plates-formes TypePad, MovableType, LiveJournal ou encore Splashblog, Six Apart se diversifie en rachetant l’agrégateur Rojo.com
L’heure est à la diversification dans le web 2.0. Champion de la blogosphère avec les plates-formes TypePad, MovableType, LiveJournal ou encore Splashblog, la société Six Apart a annoncé mercredi soir l’acquisition de Rojo.com, un service d’agrégation de flux RSS, concurrent de Bloglines et autre Newsgator. Selon Michael Arrington, rédacteur en chef de TechCrunch, la transaction ne dépasserait pas les 5 millions de dollars.
La suite chez NetEconomie Actualité le 7 Septembre, 2006, 6:04am
Les logiciels de blogVoilà 10 ans que l’internet existe, 10 ans où il n’à cessé de croître et pendant lesquels les utilisateurs ont eu largement le temps de ce familiariser avec les logiques de recherche d’information. En 10 ans les comportements ont fortement évolués et nous n’en sommes qu’au début.
L’illustration la plus flagrante de cette modification de comportement est la fonction de base de l’internet : la recherche d’information. Depuis l’avènement du roi Google, le niveau d’exigences des utilisateurs a été rehaussé au pus haut point : soit l’information qu’ils cherchent se trouve dans les 5 premiers résultats, soit elle n’existe pas. Avouez-le, votre comportement à également évolué : depuis combien de temps ne vous êtes-vous pas aventuré au-delà de la première page de résultat ?
Voilà pourquoi il est temps de se rendre à l’évidence : les habitudes et réflexes liés à la recherche d’information ont irrémédiablement changé et nous nous dirigeons vers des comportements extrêmes. Alors je pose ici une question ouverte : à quand la règle du clic unique ?
Cette règle repose sur un postulat simple : pour une information qui représente une certaine valeur, vos utilisateurs n’iront pas plus loin qu’un clic depuis votre page d’accueil ou depuis la première page de résultats de Google.
Mais avant de rentrer des les détails de cette règle, laissez-moi dans un premier temps enterrer définitivement la pseudo règle des 3 clics.
Il existe une précédent règle relative au nombre maximum de clics “tolérés” par les utilisateurs avant d’accéder à l’information qu’il recherche : la règle des 3 clics. J’ai déjà eu l’occasion de m’exprimer sur l’absurdité de cette règle (voir à ce sujet mon précédent billet : En finir avec la règle des 3 clics, qui a été rédigé il y a près de 3 ans !) mais je souhaite quand même enfoncer le clou une dernière fois : réduire le nombre de clics pour atteindre le niveau le plus profond dans un site revient à complexifier son arborescence. Pour faire simple, cela implique de confronter l’utilisateur à plus de liens à chaque clic, donc des choix plus long, donc plus de risque d’erreurs, donc plus de frustration.
Je ne sais pas qui est à l’origine de cette règle mais les grands gourous de l’utilisabilité de l’ont jamais cautionné. Pire, ils l’ont démonté au travers d’arguments très précis :
Moralité : oubliez la règle des 3 clics car elle n’est pas fondée.
La suite chez FredCavazza le 6 Septembre, 2006
InformatiqueLe moteur s’est allié à des titres américains pour lancer Google News Archive Search, qui indexe des articles remontant parfois au 18ème siècle.
Google propose un nouveau service baptisé Google News Archive Search. Objectif : mettre à disposition des internautes les archives de journaux et magazines sur le Web remontant jusqu’à 200 ans en arrière. Le service n’est disponible qu’en anglais pour l’instant. Les internautes peuvent faire leurs recherches sur news.google.com/archivesearch.
La suite par Sophie Fiévée chez L’actualité des nouvelles technologies le 5 Septembre, 2006, 5:00pm
InformatiqueAprès sa base de questions / réponses, Google sollicite à nouveau pour les internautes avec “Image Labeler”, un jeu permettant de documenter son index d’image.
Champion des algorithmes de recherche, Google sait également faire appel aux humains pour enrichir son index. Après Google Answers, une base de connaissances où ce sont les internautes eux-mêmes qui proposent des réponses aux requêtes, le portail américain lance “Image Labeler”, un jeu où les internautes sont sollicités pour décrire une image et lui associer des mots-clef.
La suite chez NetEconomie Actualité le 6 Septembre, 2006, 5:50am
InformatiqueWeb Info & Tutorials is Hosted by Chaaban