Objetivos:

Ao final da disciplina o aluno deverá saber os fundamentos e as técnicas para manipulação, representação, análise, modelagem e validação de grandes conjuntos de dados.

Justificativa:

A facilidade de coleta de dados alcançada pela civilização atual nos impõe um grande desafio: armazenar, representar, analisar e modelar o que usualmente é conhecido como “avalanche de dados”. A formação de graduandos e pós-graduandos em Ciência da Computação não pode dispensar o conhecimento dos referidos fundamentos e técnicas proporcionados por esta disciplina.


Conteúdo:

Importância da área e de suas aplicações. Processo de descoberta do conhecimento (KDD) em conjuntos de dados. Tratamento, representação e qualificação de grande volumes de dados. Armazém de dados e modelos multidimensionais. Indexação e recuperação de grande volumes de dados. Grafos em Bancos de Dados. Análise exploratória de dados (análise de agrupamentos e associações de dados). Modelagem de conhecimento (classificadores, regras de classificação, exemplos). Desenvolvimento e uso de software para KDD. Exercícios com utilização de dados simulados e reais.