Olá Jorge, tudo bem? Meu nome é Igor Wiese, sou orientando de Doutorado do Gerosa. Estou trabalhando com mineração de repositórios.
Que tipo de análise você quer executar? Sabe os dados que você precisa pra sua análise?
Algumas opções de ferramentas:
===
Para baixar o controle de versão (Git, SVN, CVS)
**Funciona melhor no linux
====
====
MSR - Conferência sobre mineração de repositórios. Ano passado teve uma trilha de dataset´s.
E eles sempre tem dataset´s para o mining challenge
===
**Funciona melhor no linux
===
Ferramenta para coleta de dados do Github, Geração de Redes sociais, análise de change dependecies
Estamos desenvolvendo a ferramenta ainda, se quiser contribuir, fique a vontade 
Essa ferramenta foi desenvolvida durante o TCC de um aluno que eu orientei.
===
===
PROMISE data. Também é parte de uma conferência.
Dataset´s de projetos open source e privados.
Dataset´s para estudo de effort prediction, e defect prediction
Bom.. tem uma lista não exaustiva de opções. Infelizmente não tem muitas "ferramentas estáveis" pra usar. Existem várias iniciativas que eu poderia sugerir pra você mais poucas funcionam na prática, infelizmente.
Atualmente eu tenho usado o BICHO e CSVAnalY para coletar dados pra um experimento que vou fazer. Eles tem funcionado com relativa eficiência. Em alguns momentos, aparecem uns pequenos bugs.. mas da pra contribuir com a ferramenta corrigindo ou reportando bugs.
Se puder ajudar, conte comigo.
Abraços