Faculdade de Ciência de Dados e Inteligência Artificial

aprendizagem de Máquina Não-Supervisionada

Entregável do Bloco:
Aplicações de modelagem de fenômenos por meio de aprendizagem de máquina para agrupamentos de observações similares, como segmentos de clientes e grupos de risco similar
Projeto de Bloco: Aprendizagem de Máquina Não Supervisionada
Analisar casos de aplicação de aprendizagem de máquina não supervisionado
Entender o modelo CRISP-DM de desenvolvimento de projeto
Utilizar PCA em uma base de dados multi-dimensional
Utilizar o algoritmo de K-Médias em uma base de dados multi-dimensional
Algoritmos para Clusterização de Dados I
1 – Explicar a motivação de usar algoritmos não-supervisionadas
2 – Explicar diferentes tipos de algoritmos de clusterização
3 – Escolher a técnica mais adequada de clusterização para diferentes problemas
4 – Aplicar os algoritmos de K-Means e HCluster em dados reais
5 – Aplicar o algoritmo de DBScan em dados reais.
Álgebra Linear
1 – Utilizar o módulo numpy de Python para manipulação de matrizes e vetores
2 – Calcular o inverso de uma matriz e sua determinante
3 – Interpretar a independência linear entre matrizes
4 – Entender o conceito de espaços vetoriais e suas dimensões
5 – Calcular autovalores e autovetores
Algoritmos para Clusterização de Dados II
1 – Compreender as medidas de distâncias: Euclideana, Cosseno e Manhantan
2 – Aplicar a medida de silhueta para problemas complexos usando a implementação de Scikit-Learn
3 – Realizar a análise de componentes principais em um conjunto de dados
4 – Reduzir a dimensionalidade de um problema para solução com algoritmos de clusterização
Implementação de Modelos de Aprendizado de Máquina
1 – Construir uma solução que aplica um modelo elaborado em uma base de dados.
2 – Desenvolver um sistema de coleta de dados usando API públicas
3 – Preparar um modelo previamente treinado para uma solução de streaming de dados
4 – Estabelecer um método de atualização de um modelo empregado em produção