Formações Data Science Machine Learning com Python: Classificação

Formação Machine Learning com Python: Classificação

Desenvolva habilidades em Machine Learning para resolver problemas de Classificação com Python, explorando os fundamentos e técnicas essenciais para a construção de modelos precisos e eficazes.

* Esta formação faz parte dos nossos cursos de Data Science

Quero Estudar na Alura
67h

Para conclusão

8
Cursos
2
Vídeos extras
5
Artigos

Conheça a formação de Machine Learning com Python: Classificação

A formação em Machine Learning com Python: Classificação da Alura é um guia de estudos com o passo a passo necessário para iniciar seus estudos em classificação de dados. Cada etapa desse processo foi cuidadosamente pensada por nossa equipe, fazendo com que você, ao final da formação, tenha desenvolvido habilidades para enfrentar qualquer desafio nessa área.

O que é Classificação em Machine Learning?

A classificação com Machine Learning é uma técnica na área da inteligência artificial em que um algoritmo é treinado para identificar e categorizar dados em classes ou categorias distintas, com base nos padrões e características encontrados em conjuntos de dados.

O que você aprenderá?

Nesta formação, você aprenderá os primeiros passos em classificação, validação e métricas, como resolver problemas multiclasse e otimização de modelos. Você também aprenderá sobre dados multidimensionais, combinação de classificadores, como melhorar o desempenho com XGBoost e aprendizado semi-supervisionado. Ao finalizar a formação, você estará capacitado(a) a aplicar técnicas de classificação com confiança, melhorando o seu conjunto de habilidades em Machine Learning e preparando-se para desafios práticos do mercado.

Para você se aprofundar e conhecer outras áreas do Machine Learning, na formação Machine Learning Avançada, você irá explorar áreas como Deep Learning, Processamento de linguagem natural (NLP) e Visão Computacional. Caso você ache que não é o momento de avançar para estes assuntos e gostaria de colocar em prática o que aprendeu nesta formação resolvendo problemas reais com Machine Learning, a formação Machine Learning para Negócios Digitais é para você. Nela, você irá trabalhar com diversos problemas como detecção de fraude, segmentação de clientes e até criar uma aplicação e colocá-la em produção, dando os primeiros passos no famoso MLOps. Por fim, a formação Machine Learning com Python: Regressão também é uma opção, onde você explorará diversas técnicas de regressão, desde as mais básicas até as avançadas, utilizando bibliotecas poderosas do Python.

Por que estudar esta formação?

  • Guia de aprendizado

    Conteúdos pensados para facilitar seu estudo

  • Do básico ao avançado

    Formação completa para o mercado

  • Você dentro do mercado

    Do zero ao sonhado emprego em sua área de interesse

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos

Com quem você vai aprender?

  • Valquíria Alencar 

    Doutora em Biotecnologia e realizou pós-doutorado na Universidade Federal do ABC. Atualmente, atua como instrutora na escola de Data Science, onde desenvolve projetos e cursos abrangendo o pré-processamento e análise exploratória de dados, visualização de dados em Python, aplicação de inteligências artificiais generativas, além da implementação e otimização de modelos de aprendizado de máquina. Também é uma das autoras do livro Séries Temporais com Prophet, publicado pela Editora Casa do Código.

  • Valquíria Alencar 

    Doutora em Biotecnologia e realizou pós-doutorado na Universidade Federal do ABC. Atualmente, atua como instrutora na escola de Data Science, onde desenvolve projetos e cursos abrangendo o pré-processamento e análise exploratória de dados, visualização de dados em Python, aplicação de inteligências artificiais generativas, além da implementação e otimização de modelos de aprendizado de máquina. Também é uma das autoras do livro Séries Temporais com Prophet, publicado pela Editora Casa do Código.

  • João Vitor de Miranda

    Bacharel em Matemática e pós graduado em Data Science e Analytics. Com conhecimento em Matemática, Estatística, Excel, Python, R e SQL/NoSQL.

  • João Vitor de Miranda

    Bacharel em Matemática e pós graduado em Data Science e Analytics. Com conhecimento em Matemática, Estatística, Excel, Python, R e SQL/NoSQL.

  • Bruno Raphaell

    Bruno é um instrutor de Data Science e Engenheiro Eletricista pela Universidade Federal do Piauí. Se dedica em áreas como Data Science, Machine Learning e Deep Learning, e possui grande interesse em engenharia de dados e engenharia de machine learning. Além disso, em seu tempo livre, ele gosta de jogar xadrez, tocar instrumentos musicais e jogar League of Legends.

  • Bruno Raphaell

    Bruno é um instrutor de Data Science e Engenheiro Eletricista pela Universidade Federal do Piauí. Se dedica em áreas como Data Science, Machine Learning e Deep Learning, e possui grande interesse em engenharia de dados e engenharia de machine learning. Além disso, em seu tempo livre, ele gosta de jogar xadrez, tocar instrumentos musicais e jogar League of Legends.

  • Allan Segovia Spadini

    Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

  • Allan Segovia Spadini

    Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

  • Paulo Calanca

    Estudante de Engenharia de Computação, na Universidade Candido Mendes. Atualmente atua como Monitor da escola de dados da Alura. Com muito interesse em Estatística, Data Science e Engenharia de Dados. Constantemente aprendendo novas tecnologias.

  • Paulo Calanca

    Estudante de Engenharia de Computação, na Universidade Candido Mendes. Atualmente atua como Monitor da escola de dados da Alura. Com muito interesse em Estatística, Data Science e Engenharia de Dados. Constantemente aprendendo novas tecnologias.

Passo a passo
  1. 1 Iniciando em Classificação

    Neste primeiro momento, você iniciará a jornada em Classificação com Python aprendendo como treinar modelos de classificação a partir de dados, fazer previsões de novos dados a partir do modelo treinado e armazená-lo em um arquivo para que possa ser utilizado em seus projetos.

    Você vai explorar as principais métricas dos modelos de classificação, identificar a métrica mais relevante para cada tipo de problema, utilizar diferentes estratégias de validação de dados para avaliação do desempenho dos modelos e aprender técnicas para lidar com dados desbalanceados.

    Por fim, você terá a oportunidade de aplicar todas essas habilidades em problemas multiclasse, onde não estamos mais lidando apenas com duas categorias, mas sim com várias. A capacidade de classificar dados em múltiplas categorias é crucial em muitas aplicações do mundo real e ampliará significativamente o seu conjunto de habilidades em classificação com Python.

    • Artigo O que é Machine Learning? | Alura

    • Curso Classificação: aprendendo a classificar dados com Machine Learning

      08h
      • Realize análises exploratórias de dados para machine learning
      • Aplique transformações em variáveis categóricas
      • Treine modelos de classificação a partir de dados
      • Realize previsão de novos dados com modelos de classificação
      • Armazene modelos de transformação de dados e de machine learning em arquivos pickle
    • Artigo Problemas resolvidos por algoritmos de classificação | Alura

    • Alura+ Métricas de avaliação para classificação

    • Curso Classificação: validação de modelos e métricas de avaliação

      08h
      • Valide modelos de machine learning com método hold out e validação cruzada
      • Avalie modelos de machine learning a partir de métricas de desempenho
      • Identifique quais as métricas mais apropriadas para cada tipo de problema
      • Realize o balanceamento de dados usando oversampling e undersampling
      • Aplique um pipeline para validar modelos de forma correta
    • Alura+ Curva ROC

    • Curso Classificação: resolvendo problemas multiclasse

      08h
      • Aplique técnicas de análise exploratória para compreender os dados e obter insights
      • Realize o pré-processamento de dados para treinamento de modelos de classificação
      • Avalie o desempenho de modelos de classificação para problemas multiclasse
      • Realize o balanceamento de dados para melhorar a performance dos modelos
      • Aplique um pipeline para validar modelos de forma correta
      • Interprete resultados e insights obtidos a partir das análises e avaliações
      • Investigue problemas de forma analítica e crítica
  2. 2 Otimizando os resultados

    Após concluirmos as etapas iniciais do processo de construção de modelos de Machine Learning voltados para a classificação, é hora de aprofundar nossa compreensão sobre como aprimorar os resultados obtidos. Nesse sentido, vamos avançar na otimização de hiperparâmetros, explorando técnicas como a validação cruzada aninhada (Nested Cross-Validation), a busca aleatória (Random Search), a busca em grade (Grid Search) e a otimização bayesiana (Bayesian Optimization).

    Na sequência vamos utilizar técnicas para verificar a importância dos atributos dos nossos conjuntos de dados sobre o problema de classificação. Assim, será possível ajustar os dados apenas aos melhores atributos e otimizar os resultados.

    • Curso Classificação: otimizando modelos de machine learning

      08h
      • Conheça as técnicas para a otimização de hiperparâmetros
      • Saiba como melhorar o resultado do modelo
      • Entenda como funcionam as técnicas de otimização de hiperparâmetros
      • Realize a otimização de hiperparâmetros usando as técnicas apresentadas
      • Encontre o melhor modelo para os dados trabalhados
    • Curso Classificação: selecionando features

      08h
      • Explore a importância da seleção de features em modelos de ML
      • Use técnicas de visualização das features mais importantes
      • Identifique correlações entre features para insights valiosos
      • Domine técnicas automáticas e manuais de seleção de features
      • Avalie o impacto das estratégias de seleção na eficácia dos modelos
  3. 3 Combinando técnicas

    Nesta última etapa, você será guiado por estratégias avançadas de combinação de classificadores, aprendendo a integrar diferentes abordagens para potencializar a precisão de suas previsões. Em seguida, exploraremos o XGBoost, uma ferramenta poderosa para impulsionar o desempenho dos seus modelos, capacitando-o a dominar técnicas avançadas de otimização.

    Além disso, abordaremos o aprendizado semissupervisionado na classificação, revelando estratégias inovadoras para lidar com conjuntos de dados parcialmente rotulados. Ao integrar informações não supervisionadas, você aprimorará ainda mais seus modelos de classificação.

    Ao concluir este passo, você estará preparado(a) para enfrentar desafios complexos no mundo do Machine Learning. As habilidades que você adquirir ao longo destes cursos lhe proporcionarão uma vantagem significativa na resolução de problemas do mundo real e na tomada de decisões embasadas em dados.

    • Artigo Machine Learning: conhecendo as técnicas de bagging e boosting | Alura

    • Curso Classificação: combinando classificadores para a melhoria de performance

      08h
      • Aprenda a realizar votações de classificadores para decisões mais assertivas
      • Maximize o desempenho analítico com estratégias avançadas de ensemble learning
      • Domine as técnicas de bagging e aumente a robustez dos seus modelos de ML
      • Explore o boosting para otimizar a precisão das suas previsões
      • Integre múltiplos modelos com stacking e alcance resultados de vanguarda em IA
    • Curso Classificação: melhorando o desempenho com XGBoost

      08h
      • Saiba como utilizar a biblioteca XGBoost para classificação binária
      • Avalie o desempenho de modelos com métricas de classificação
      • Entenda como realizar a validação cruzada com XGBoost
      • Explore o impacto do número de rodadas de reforço em modelos XGBoost
      • Realize o ajuste de hiperparâmetros para otimizar a performance do seu modelo
      • Saiba como incorporar XGBoost em pipelines de machine learning
    • Artigo Machine Learning: o que é aprendizado semi-supervisionado | Alura

    • Curso Classificação: construindo modelos semi-supervisionados

      08h
      • Treine modelos de classificação a partir de dados rotulados
      • Entenda o conceito do aprendizado semi-supervisionado e como aplicar esta abordagem
      • Utilize rótulos gerados em previsões para construir modelos semi supervisionados
      • Utilize a estratégia Self Training a partir de dados rotulados e não rotulados
      • Classifique dados utilizando o aprendizado transdutivo com o modelo LabelPropagation
    • Artigo Os 4 tipos de aprendizagem na IA, algoritmos e usos | Alura

Escola

Data Science

Além dessa, a categoria Data Science conta com cursos de Ciência de dados, BI, SQL e Banco de Dados, Excel, Machine Learning, NoSQL, Estatística,e mais...

Conheça a Escola

Comece a estudar agora na maior escola de tecnologia do país

Conheça os Planos para Empresas