Aniversário
Alura 12 anos

20% OFF

Falta pouco!

00

DIAS

00

HORAS

00

MIN

00

SEG

10h

Para conclusão

1429

Pessoas nesse curso

9.1

Avaliação média

Certificado

De participação

Introdução_

O que você aprenderá_

  • Utilize o PySPark para criar um pipeline do machine learning
  • Leia e manipule os dados utilizando PySpark SQL
  • Vetorize os dados utilizando PySpark
  • Reduza a dimensionalidade dos dados com PCA utilizando PySpark
  • Desenvolva clusters com K-means utilizando PySpark MLlib
  • Visualize dados utilizando Plotly

Público alvo_

Pessoas interessandas em criar clusters de machine learning com a ferramenta PySpark.

Igor Nascimento Alves

github

linkedin

Sou graduado em Ciência da Computação. Atuo como instrutor de Data Science e Machine Learning no Grupo Alura, tendo como principais interesses na tecnologia: criação de modelos e análise de dados. Nas horas vagas assisto e analiso dados de basquete e adoro ouvir podcasts de humor como Nerdcast e Jujubacast.

Curso atualizado em 17/06/2024

Ementa

  1. Problema e ferramenta

    • Entendendo o problema
    • Dicionário dos dados
    • Configurando o PySpark
  2. Leitura e análise dos dados

    • Leitura dos dados
    • Análise dos dados
    • Matriz de correlação
  3. Clusterização por gênero musical

    • StandardScaler
    • PCA - Principal Component Analysis
    • K-Means
    • Plotando o clustering
  4. Clusterização por música

    • Redução de dimensionalidade
    • Criação dos clusters
    • Analisando o cluster
  5. Sistemas de recomendação

    • Distâncias das músicas
    • Recomendação da música
    • Biblioteca do Spotify
    • Imagem do álbum

Descubra se esse curso é pra você! Leia as primeiras aulas

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos

Este e mais 4 cursos fazem parte das seguintes formações

Nossas formações são uma sequência de cursos e conteúdo para você se profissionalizar e se tornar quem o mercado procura!
Escola

Data Science

Trabalhe com dados. Aprofunde seu conhecimento nas principais ferramentas de uma pessoa data scientist. Descubra as diferentes possibilidades de análise de dados, do Excel ao Python, e mergulhe em frameworks e bibliotecas, como Pandas, Scikit-Learn e Seaborn.

Conheça a escola

Faça parte da nossa comunidade no discord!

Troque conhecimentos com a comunidade da Alura

Escolha a duração
do seu plano

Conheça os Planos para Empresas