Fizemos uma classe analisador textual em Java. Basta rodar o main para ver o exemplo de um texto com os processos abaixo:
- Tira acentuacao
- Tira caracteres fora do alfabeto (pontuacao, colchetes, parenteses)
- Normalizacao (remove caracteres maiusculos)
- Remove stopwords (palavras comuns)
- Tokeniza (separa em palavras)
- Stemng (remove plural).
Obrigado