février 26, 2004

20six.fr va pinguer

Bonne nouvelle 20six.fr va pinguer weblogues.com. Voici le commentaire de max publié sur ce blog :

"on va pinguer weblogues.com dès le lancement de notre nouvelle version sera achevé: mars/avril.
merci pour ton travail,
max"

Posted by houssein at 05:26 PM | Comments (0) | TrackBack

Le problème des blogs inactifs

Un problème qui me dérange dans l'indexation des blogs, ce sont les blogs inactifs.

Chaque fois qu'un blog est créé sur un des hébergeur qui pingue weblogues.com, ce blog est automatiquement ajouté à Blogolist.com. Or, il arrive souvent que des blogs nouvellement crées ne contiennent jamais plus qu'un seul article, et restent à jamais inactifs!
Il existent aussi des blogs qui n'ont pas été mis-à-jour depuis des mois, et dont les auteurs les ont abondonnés.

Pour moi, les blogs inactifs représentent une sorte de "spam" pour Blogolist. Ils ne devraient pas être indexés.
En effet Blogolist indexe tous les blogs listés d'une manière cyclique (tous les blogs sont réindexés toutes les 48 heures). Je ne me fie pas à la liste des blogs de weblogues.com pour faire l'indexation (je devrais surement), essentiellement parce qu'il existe des blogs listés sur Blogolist et pas sur weblogues.com.

Un ami m'asuggéré e tester la taille d'un blog lors de son indexation pour voir si ce dernier à changé depuis sa dernière indexation. Un flag associé à chaque blog dans la base de données déterminera depuis combien de temps le blog n'a pas été mis-à-jour. Je pourrai alors automatiquement purger les blogs inactifs (non mis à jour depuis 2 ou 3 mois) une fois par semaine par exemple...

Je trouve l'idée intéressante. Je ne suis pas très sûr de son efficacité, notamment à cause des liens publicitaires qui peuvent changer la taille du blog, sans pour autant que ce dernier ait été mis-à-jour!

Je pense quand même que je l'implémenterai cette solution dès que j'aurai un peu de temps...

Si vous avez d'autres idées pour gérer ce problème, n'hésitez pas à m'en faire part.

ps. Ce qui est intéréssant si cette solution d'élimination des blogs inactifs fonctionne, c'est qu'on pourrait alors avoir une bonne estimation réelle du nombre de blogs actifs sur chaque plateforme de blogs... Évidemment cette comparaison ne sera possible que si toutes les plateformes pinguent weblogues.com, ce qui semble le cas (20six.fr ne devrait pas tarder). Les blogs gratuits sur U-Blog seront bienôt les seuls à ne pas pinguer, ceci poussera peut-être U-Blog à remédier à cette anomalie!

Posted by houssein at 05:23 PM | Comments (0) | TrackBack