Prospecção de Dados e Extração do Conhecimento

Disciplina: Prospecção de Dados e Extração do Conhecimento

EMENTA:
Apresenta tópicos de prospecção de dados (data mining) e extração de conhecimentos em bancos de dados (knowledge data discovery), data warehouse, modelos descritivos, temporais e baseados em transações, métodos visuais, grafos, classificação, agrupamento e análise de dados multivariada. Aborda, também, métodos para extração de conhecimento de redes neurais e algoritmos genéticos.

CONTEÚDO PROGRAMÁTICO:
Introdução à descoberta do conhecimento em bases de dados (KDD) abordando questões relacionadas à Big Data;-Exploração de aspectos relacionados ao processo de pré-processamento de dados, tais como: seleção, limpeza e transformação de dados;-Seleção de características e redução da dimensionalidade;-Avaliação e interpretação dos modelos de prospecção de dados;-Exploração das principais tarefas de mineração de dados: classificação, clusterização e associação;-Aprendizado de máquina aplicado à extração do conhecimento;OBJETIVOSProporcionar aos alunos domínio sobre os conhecimentos e ferramentas necessários para prospecção de dados no contexto da Internet, especialmente envolvendo a computação em nuvem. Compreender os algoritmos, técnicas e ferramentas utilizadas para a extração do conhecimento sobre grandes volumes de dados. Entender como a inteligência artificial pode ser empregada para auxiliar no processo de mineração de dados.

METODOLOGIA
(I) aulas expositivas e dialogadas com utilização de quadro e data show;
(II) incentivo ao desenvolvimento de pesquisas através da escrita de artigos científicos relacionados aos temas abordadosem aula;
(III) incentivo à participação ativa dos alunos no processo de aprendizagem a partir de diversas apresentações durante o semestre, que podem envolver o andamento dos artigos que serão desenvolvidos, mas também outros trabalhos propostos.

BIBLIOGRAFIA BÁSICA
LESKOVEC, Jure; RAJARAMAN, Anand; ULLMAN, Jeffrey D. Mining of Massive Datasets. Cambridge University Press; 2 edition, 2014.
Christopher D. Manning,Prabhakar Raghavan,Hinrich Schütze. Introduction to Information Retrieval. Cambridge University Press, 2008.
HAN, Jiawei; KAMBER, Micheline; PEI, Jian.Data mining:concepts and techniques. 3rd ed. Waltham [Estados Unidos]: Elsevier: Morgan Kaufmann, 2012
BUYYA, Rajkumar; BROBERG, James; GOSCINSKI, Andrzej (Ed.).Cloud computing:principles and paradigms. Hoboken [Estados Unidos]: Wiley, 2011
GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron.Deep learning.Cambridge [Estados Unidos]: MIT Press, 2016

BIBLIOGRAFIA COMPLEMENTAR
MURPHY, Kevin P.Machine learning:a probabilistic perspective. Cambridge [Estados Unidos]: MIT Press, 2012
MITCHEL, Tom. Machine Learning. McGraw-Hill, 2017.
SINGH, Chanchal; KUMAR, Manish. Mastering Hadoop 3: Big data processing at scale to unlock unique business insights. Packt Publishing, 2019.
RYZA, Sandy; LAERSON, Uri; OWEN, Sean; WILLS, Josh. Advanced Analytics with Spark: Patterns for Learning from Data at Scale. O’Reilly Media; 2 edition, 2017.
IEEE Transactions on Big Data.
IEEE Transactions on Knowledge and Data Engineering.
IEEE Big Data Mining and Analytics.
IEEE Surveys & TutorialsI
EEE Cloud Computing
ACM Computing Surveys
ACM Transactions on Knowledge Discovery from Data
ACM Transactions on Storage
ACM Transactions on the WebJournal of Data and Information Quality

Trabalho realizado…

Apresentacao_clustering_v2

Trabalho…
(RAFAEL )Trabalho de prospecção de dados e extração do conhecimento
Sobre que assunto: Data mining, big data, knowledge discovery, ML
02/03 – Vídeo de 5 minutos com a ideia do artigo e possíveis locais de publicação
23/03 – Entregar documento contendo a estrutura do texto, definição do artigo, estutura de tópicos, apresentação de como será feito o artigo, estrutura do IEEE
13/04 – Entrega parcial – texto e vídeo (ler descrição)
O documento deve conter, pelo menos:
1) Definição do problema, na seção de introdução
2) Descrição e análise de, pelo menos, 5 trabalhos relacionados
3) Overview da solução proposta
Além disso, o aluno deve postar um vídeo de 5 minutos, no máximo,
explicando a solução proposta.
8/6 – Entrega do artigo e da apresentação (15/20 minutos)