A verdade dos números

É muito difícil contabilizar o número de acessos a um sítio da net@.

Podemos contabilizar o número de acessos por IP por hora, mas isso deixa de fora uma imensidade de gente, que aceda a partir de uma instituição que se esconda por detrás de um único IP traduzido por NAT: uma grande empresa, uma universidade, etc.

A segunda opção, que corrige este problema e, portanto, aparentemente mais fidedigna, é contar o número de sessões abertas. Esta solução tem a vantagem de contabilizar diferentes sessões abertas em diferentes browsers que se escondam por detrás do mesmo IP. No entanto, não resolve o problema do acesso dos crawlers (as aranhas da net@): Google, Websense, Inktomi (Yahoo), etc. que não criam sessões, porque não registam cookies que são, geralmente, a base técnica da manutenção de sessões.

A solução ideal de contabilização seria utilizar sessões, mas descontar todos os acessos de endereços provindos dos crawlers. Contudo esta solução é difícil de implementar, pois os grandes sistemas de varrimento da rede possuem diversas redes espalhadas por várias gamas, não sequenciais, de IPs. Além disso, todos os dias surgem novos crawlers, o que faz com que uma solução destas obrigue a uma monitorização constante dos ficheiros de log de acesso ao sítio. Ainda hoje tive 200 acessos seguidos originados por um crawler israelita que não conhecia.

Acontece que, do ponto de vista da mercadologia (marketing), não interessa a ninguém anunciar que tem poucos acessos. Quanto mais acessos tem um sítio, mais fácil é vender soluções de publicidade. É por esse motivo que todos os sistemas de contabilização do número de acessos a sítios da net@ são falaciosos.

Este Chornal utiliza a segunda solução, baseada em sessões com a duração de 7 horas, mas não é resistente ao acesso dos crawlers.

Alguém tem uma solução simples e prática de contagem mais realista?

Respondam, de preferência, depois de passarmos os 200.000 acessos… eh eh eh


Publicado

em

por

Etiquetas:

Comentários

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *