Navegação privada e o impacto nas estatísticas do Google Analytics

Hoje estava dando uma geral no Google Analytics (GA), vendo as estatísticas de acesso e percebi que um dos meus sites não possuía nenhum acesso registrado. Na dúvida verifiquei se o código de rastreamento do google estava no cabeçalho… e estava. Como tenho acesso aos logs do servidor, fui confirmar se não houve nenhum acesso, e realmente haviam acessos realizados esta semana. Com a pulga atrás da orelha, comecei a comparar alguns indicadores entre o GA e os logs do Apache (servidor web) e percebi que o GA sempre está com os totalizadores menores que os contabilizados pelos logs.

Meu primeiro chute, e não deixa de ser válida, é que o GA não consegue processar todas as requisições das centenas de milhares de sites que utilizam ele. Depois comecei a me lembrar de várias opções que os usuários têm de bloquear o rastramento do GA.. uma delas é um Addon oferecido pelo próprio Google (GA OptOut) disponível para vários navegadores e que impede que os sites que usam o GA coletem dados do usuário/navegador. Usuários de Firefox/Chrome/etc que suportam plugins, também  podem ter optado por desabilitar o GA usando as extensões AdBlock que possui uma subscrição específica para filtros de rastreamento (e.g EasyPrivacy).

E hoje me deparei com um artigo no Meio Bit falando de uma nova extensão para o Chorme chamada Disconnect que permite o bloqueio do rastreamento das redes sociais Digg, Facebook, Google, Twitter e Yahoo.

Revista info: 13 integrações bloqueadas

Acho importante frisar que esses bloqueios permitem uma navegação mais privada. Quando um site está usando estes serviços ou está integrado a uma rede social, ele estará permitindo que sejam coletadas diversas informações e até mesmo validando seus usuários por meio de cookies ou sessões previamente abertas em seus servidores. Ou seja, cada serviço/rede social poderá traçar um perfil de uso/tendência ou preferências dos seus usuários; o que acessam, em que momento, de onde acessam.

Mas voltando as estatísticas, tenho um site e quero saber quantas pessoas acessaram ele! bem, eu recomendo também o uso de ferramentas que analisam diretamente os logs do servidor como o AWStats. Não tem erro, se um navegador requisitou alguma coisa e o servidor web entregou, foi gerado um log da operação (salvo problemas de configuração do web server ou disco cheio :) .

Analisador de logs AWStats

A quantidade de informação com certeza é bem menor que a oferecida pelo GA (Esqueça informações como resolução da tela, se tem ou não flash/java instalado.. essas coisas), mas o importante estará lá: quantas pessoas acessaram, de onde vieram, para onde foram, qual o tipo de navegador, etc.

Nada impede de você usar as duas opções (GA / Logs do servidor). Os logs são gerados de qualquer jeito e é bem provável que você já tenha os logs de acesso ao seu site dos últimos dias… é só processá-las com o awstats e terá novos indicadores!

Como nem todo mundo tem acesso aos logs dos servidores, algumas empresas de hosting oferecem ferramentas próprias ou pré-configuradas para acessar os logs. O Dreamhost por exemplo oferece o Analog. Se você não tem acesso ao servidor (shell) para instalar o awstats, veja com seu hosting como poderá acessar as estatísticas geradas pelo web server.

E pra resumir a história é por isso que nem sempre temos os mesmos indicadores no Google Analytics e nas ferramentas de análise de logs..os usuários de ferramentas de privacidade não são contados no GA. ;)

Apresentação sobre Cloud Computing

Ontem (21/10) fiz uma apresentação sobre Computação em Nuvem no 1º Encontro de Tecnologia e Informação do Instituto Federa Catarinense – Campus Camboriú (e-TIC).

O objetivo da palestra foi explicar um pouco como está dividida a computação em nuvem, apresentar alguns exemplos dos modelos de serviços existentes e principalmente demonstrar que esta tendência está vindo para ficar.

A Computação em Nuvem é um paradigma em evolução, mas com certeza vai mudar a forma como a Tecnologia da Informação é entregue e utilizada pelos usuários.

Cloud Computing: uma abordagem objetiva sobre o novo ambiente computacional

Opções para geração de relatórios

Seguindo um novo modelo de publicações, vou listar de forma rápida e objetiva algumas soluções open source que encontrei para substituir soluções comerciais responsáveis pela geração de relatórios.

Aplicações comerciais (Pagas)

  • Crystal Reports (Site): Comprada pela SAP;
  • Cognos ReportNet (Site): Comprada pela IBM.
  • Microsoft SQL Server Reporting Services (Site / pt_BR): Solução da Microsoft que vem junto com o Microsoft SQL Server. Disponibiliza os relatórios via Web (precisa do IIS instalado) de forma estática ou interativa. Ideal para quem programa em .NET usando SQL Server;

Aplicações Open Source

  • JasperReports (site): Biblioteca escrita em java e recomendada para quem vai programar nesta linguagem. Gera relatórios impressos ou documentos em formato HTML, PDF, MS Excel, OpenOffice, e MS Word). Também existe a versão servidor (JasperServer) que é interativa entregando uma plataforma de Business Intelligence (BI) além de relatórios sob demanda ou agendados. Licenciado sobre Aferro GPL;
  • OpenRPT (site): Tem uma ferramenta para construir os relatórios (designer) que roda em Linux, windows e MacOS. Conecta em bancos Postgres (ODBC genéricos) e com um pouco de esforço em Oragle, DB2, SQL Server e MySQL. Usei rapidamente e não achei muito fácil, além de não ter achado uma versão servidor. Licenciado pela GPL;
  • OpenReports (site): Solução de relatórios baseada em web. Pode usar engines como JasperReports, JFreeReports, JXLS. Não li muito sobre ele, mas como vi a disponibilidade, decidi compartilhar;
  • Got Reportviewer (site): É um controle que permite adicionar relatórios em aplicações desenvolvidas em .NET.
  • Fyireporting (site / dica para conexão Postgres): De todos, este foi o que testei mais profundamente. Feito em .NET, suporta a linguagem RDL (Report Definition Language) a mesma usada pelo Microsoft SQL Server Reporting Services. Gera relatórios em vários formatos (pdf, html, doc, xls, rtf, csv, entre outros) e também permite a entrega de consultas em forma de matrizes. Permite carregar dados a partir de servidores de BDs (MySQL, Postgres, SQL Server, etc) assim como de arquivos csv, xml ou mesmo web services. A licença empregada é a Apache License v2.
    Tem basicamente 4 aplicativos principais:

    • fyireporting Designer: Usado para montar o layout do relatório no estilo WYSIWYG;
    • fyireporting Desktop: Levanta uma versão “servidor” que atende na porta 8080 (via navegador), e entrega os relatórios  RDL (que na verdade é uma marcação XML) via navegador;
    • fyireporting Reader: Sua função é permitir gerar relatórios em qualquer formato a partir do arquivo RDL gerado previamente;
    • rdlcmd: Utilitário de linha de comando que permite informar o arquivos de entrada e path de saída e o formato que você quer o relatório.

Atualizações:

-(2010-09-03) Adicionado link para OpenReports;