juin 27, 2003

Les films les plus cités

Nouvelle fonctionnalité dans Blogolist.com : les films les plus cités dans la blogosphère.
Cette liste est déterminée en comptabilisant les liens vers imdb.com et allocine.fr.

Posted by houssein at 03:46 AM | Comments (4) | TrackBack

juin 24, 2003

Le problème de 20six

Les robots indexeurs de Blogolist.com ne sont pas capables d'indexer les blogs hébergés par 20six.fr.
La raison est que 20six bloque la visite aux agents qui n'acceptent pas les cookies. C'est le cas des robots de Blogolist. C'est vraiment dommage.

Je n'ai pas le temps de penser à un "work around" pour résoudre le problème.

Si vous connaissez une solution rapide avec PHP n'hésitez pas à me la communiquer. Merci.

Posted by houssein at 02:33 AM | Comments (2) | TrackBack

juin 23, 2003

Joueb.com intègre les coordonnées géographiques

Après U-Blog, Stéphane vient d'annoncer l'intégration des coordonnées géographiques dans les blogs de Joueb.com.

Excellente initiative qui permettra d'enrichir la liste des blogs organisés par localisation géographique sur Blogolist.com.

Posted by houssein at 07:12 PM | Comments (0) | TrackBack

Etude scientifique des blogs

En parcourant les proceedings de la douzième conférence internationale du world wide web (WWW2003), qui s’est déroulé entre le 20 et 24 mai dernier à Budapest, je suis tombé sur un papier fort intéressant qui traite du phénomène des blogs : "On the Bursty Evolution of Blogspace".

Cet article écrit par des chercheurs du IBM Almaden Research Center présente une étude quantitative et statistique d’un phénomène intuitivement indetifiable dans la blogosphère et que les auteurs appellent "bursty communities of blogs".
Les auteurs insistent sur le fait que les communautés dans le blogspace (terme introduit dans l’article) diffèrent des autres communautés sur le Web à cause de la notion fondamentale de temps qu’introduisent les blogs. Un burst (éclat, explosion, …) est un événement qui génère un nombre d’inter-liens entre un ensemble de blogs pendant une période de temps. Une communauté temporelle de blogs se forme alors pendant cette période de temps, puis disparaît, pour se former ailleurs.

Nous avons assisté récemment à un exemple de "burst" dans la blogosphère francophone lors de l’Initiative de MediaTIC pour la fête de la musique. L’éclat a commencé par un événement : la publication d’un article par Jean-Luc annonçant l’initiative. La mèche allumée a généré deux éclats (bursts) : les enthousiastes (plus de 70 blogs) et les sceptiques (6 blogs).

Posted by houssein at 05:22 PM | Comments (0) | TrackBack

juin 20, 2003

Les feeds RSS dans la blogosphère

Sur 1270 blogs indexés par Blogolist.com, les robots indexeurs ont découvert 458 feeds RSS. 5 des adresses des feeds RSS découverts se sont avérés inaccessibles (erreur 404).

Ceci équivaut à 453 blogs ou 35,7% des blogs indexés.

Une analyse des versions des feeds RSS découverts a donné le résultat suivant :

Commentaires

1/ Le faible taux de blogs ayant un feed RSS pourrait s'expliquer par deux raisons :
- Certains outils tel Blogger n'offrent pas de feeds RSS à leurs utilisateurs
- Certains blogueurs ommettent d'ajouter la ligne :
link rel="alternate" type="application/rss+xml" title="RSS" href="monrss.xml"
dans le header de leurs blogs. Les robots de Blogolist ne peuvent découvrir l'emplacement du feed si cette ligne n'existe pas.

2/ La forte proportion du RSS 2.0 est due essentiellement aux blogs hébergés par U-Blog.net. Ce dernier offre cette fonctionnalité à ses usagers.
De même, plusieurs feeds RSS 0.91 proviennent de blogs hébergés chez Joueb.com.
Les feeds RSS 1.0 proviennent majoritairement des blogs utilisant l'outil Movable Type.

3/ En tenant compte de 2/, il est facile de comprendre ces résultats "étranges" comparativement aux statistiques d'utilisation des versions RSS sur le Web. Sur Syndic8.com on découvre que le RSS 0.91 est le plus utilisé (47%) suivi du RSS 1.0 (27%) et de RSS 2.0 (13%).

Pour en savoir plus :
Comparaison des versions RSS (en)
Statistiques de Syndic8

Posted by houssein at 05:41 PM | Comments (2) | TrackBack

juin 18, 2003

Premières journées de Blogolist

Le démarrage de Blogolist s'est bien passé. Pas de bugs majeurs, juste quelques petites anomalités.

Coté statistiques, hier quelque 313 visiteurs et 1457 pages vues. Ce qui fait une moyenne de 6,8 pages vues par visite du site.

Merci aux blogueurs qui ont parlé de Blogolist :
.Conforme
Bebedjia
Blogalization Community
errance...
Hmmmmm.....blog!
justic7 weblog v.07.000.001.r0
kylie
l'oeil de mouche
le blogue bertholdien
Le carnet techno
Les Autres
m.o.r.g.a.n.e
mediaTIC
miette
Mohsan Blog
navire.net
Netlex Blogs
Ok, Thierry
pointblog.com
tgBLOG
tgJOUE
Vol de mots...
Znarf News

NB. La liste ci-dessus n'est pas exhaustive, elle provient des liens indexés par Blogolist.com et du log des statistiques.

Posted by houssein at 03:48 PM | Comments (3) | TrackBack

juin 17, 2003

Lancement de Blogolist.com Beta 0.2

Ouf, enfin, voici la version Beta 0.2 de Blogolist.com.

J'avais prévu de faire le lancement officiel mercredi ou jeudi prochain, mais Jean-Luc m'a précédé :)

Je me suis fort amusé à concevoir cet index des blogs francophones. Les défis étaient de taille : il y a tellement d'imprévus dans le net qu'on risque facilement de s'y noyer.

Maintenant, je vais laisser rouler Blogolist pendant 2 semaines en phase Beta 0.2 afin de voir comment ca va marcher dans le monde réel. La base de données des blogs continuera de s'enrichir grâce à Weblogues.com, et les bugs seront fixés au fur et à mesure.

Ensuite, dépendament du succès (ou non) de Blogolist dans la blogosphère, je vais voir si je vais continuer le développement de l'outil.
Quand je dis succès, personellement je ne le mesure pas forcément en nombre de visteurs, mais plutôt par l'impact de l'outil sur la blogosphère francophone. Mon objectif premier (et secret) est de promouvoir l'utilisation des méta-données dans les blogs francophones, et des flux RSS.
Dans ce sens, Blogolist à déjà "réussi" à interesser Stéphane qui a ajouté deux fonctionnalités à U-blog.net : Les mots clés et la localisation. Merci Stéphane.

Un autre objectif que je poursuis, c'est de faire des analyses statistiques poussées sur la blogosphère francophone. Les méta-données sont essentielles pour celà.
Il serait interessant par exemple de déterminer quelle est la fréquence de mise à jour des blogs sur une période de temps donnée. Aussi, découvrir des "îlots" de blogs : ces blogs qui se lient entre eux, ainsi on verrait que la plupart des blogs chez Joueb.com se lient entre eux, le même phénomène est remarquable chez U-blog.net.

Une fonctionnalité très importante à mon avis, et c'est fondamentalement la raison pour laquelle je me suis lancé dans la conception de Blogolist, c'est la catégorisation automatique des articles de la blogosphère. Il s'agit d'un module "intelligent" qui pourrait déterminer automatiquement pour chaque post quels sont les sujets dont il parle (politique, photographie, cinéma, personnel, ...), et de proposer au lecteur d'autres posts semblables.
J'ai déjà une bonne idée comment je pourrai implémenter un tel module. Ce n'est pas si complexe que ca. Mon seul souci c'est que je ne suis pas très sûr des résultats que ca donnerait. Mais c'est justement ca le but : expérimenter.

Voilà. J'espère que vous apprécierez Blogolist autant que j'ai pris du plaisir à le développer.
Je vous invite à me faire part de vos commentaires et idées ici ou par email : houssein_benameur(à)yahoo.ca.

Bonne navigation.

Posted by houssein at 02:45 AM | Comments (1) | TrackBack