Tópicos para a prova 2

Tópicos para a prova 2

por Marco Aurélio Gerosa -
Número de respostas: 0

Olá,

Seguem os tópicos para a prova 2:

• O que caracteriza a Web 2.0?
• O que é inteligência coletiva e como ela pode melhorar os sites Web 2.0?
• Dê exemplos de usos bem conhecidos de inteligência coletiva em sites de diversos domínios de aplicação.
• Qual a relação entre aprendizado de máquina e inteligência coletiva?
• Quais as vantagens e desvantagens da organização hierárquica de documentos x organização a partir de tags?
• Quais as vantagens e desvantagens da: (i) classificação de documentos por especialistas, (ii) pelos usuários e (iii) de forma automatizada?
• O que é folksonomia?
• Como são extraídas tags automaticamente de um documento (explicar as etapas de tokenização, normalização, eliminação de stop words e stemming)?
• Para que é usado um vetor de termos?
• Como é calculada a relevância de cada tag para um documento?
• Como é que o uso dos outros documentos pode ajudar a calibrar a relevância de cada tag de um documento?
• Como o uso de sinônimos, lista de frases, descrição curta etc. pode melhorar a eficácia dos algoritmos que dependem da análise textual?
• O que é, para que serve e como é criada uma tag cloud?
• Como tags podem ajudar a encontrar similaridades entre documentos, entre usuários ou entre usuários e documentos?
• Para que servem, como são calculados e como se comparam a distância euclidiana e o coeficiente de correlação de Pearson?
• Como funciona um web crawler?
• Como um web crawler pode contribuir para aumentar a melhor a eficácia dos algoritmos de inteligência coletiva?
• Como determinar a relevância de uma url encontrada por um crawler?
• Quais são as estratégias que normalmente são utilizadas para ranquear os resultados de uma busca por ordem de relevância?
• Como uma rede neural pode ajudar a melhorar os resultados de um mecanismo de busca?
• Como utilizar informações provenientes de web services para melhorar os algoritmos de inteligência coletiva de um site?
• Quais são as funcionalidades oferecidas pelo Lucene?
• Quais são as funcionalidades oferecidas pelo Weka?
• Como funcionam os algoritmos de recomendação?
• Qual a diferença entre recomendação baseada em item da baseada em usuário e quando usar cada uma?
• Dê exemplos de dados que podem alimentar um algoritmo de recomendação.
• Para que é feito agrupamento (clustering) e qual a relação com a inteligência coletiva em sites web 2.0?
• Como funciona e qual a diferença entre os algoritmos de agrupamento hierárquico e de k-médias?
• Como o algoritmo de k-médias pode ser usado para recomendação?
• Para que pode ser usada a categorização automática de conteúdo em sites Web 2.0?
• Como funciona a categorização Bayseana?
• Quais são os algoritmos que podem ser usados para fazer predição?
• O que é árvore de decisão?
• Quando e como usar algoritmos de otimização para melhorar o suporte à inteligência coletiva em sites web 2.0?
• Como funciona a otimização por busca randômica e gulosa?
• Para que servem os algoritmos de regressão?

Vocês podem se basear para estudo nas apresentações dos colegas e nos livros:

SEGARAN, T., Programming Collective Intelligence: Building Smart Web 2.0 Applications, O’Reilly, ISBN 0596529325, 2007. 

ALAG, S., Collective Intelligence in Action, ISBN 1933988312, 2008.

abraço,

Marco