Segue link de um artigo publicado no DAFx do ano passado, fazendo comparações entre ferramentas para extração de características (features) em sinais de áudio.
À primeira vista, o Essentia (http://essentia.upf.edu) aparenta ser bastante conveniente, e a documentação parece bem boa.
abs!