Olá! Meu nome é Mirla Costa e vou te acompanhar no curso: Utilizando SQL no Pandas!
Mirla é uma mulher branca, de cabelos cacheados e pretos na altura dos ombros. Usa um óculos de grau de armação redonda e uma camiseta regata preta. Ao fundo, uma parede lisa com iluminação degrade do azul para o verde.
Esse curso é para você que já lida com python e deseja aprender como integrá-lo a outras ferramentas de dados, como o SQL. Também é para pessoas que já sabem SQL e querem aprender python.
Aqui exploraremos o banco de dados de uma loja virtual que vende roupas e acessórios com SQL, porém em um ambiente Python.
A partir disso, poderemos fazer análises e visualizações que vão contribuir na tomada de decisão da empresa.
Ao concluir o curso você será uma pessoa capacitada a fazer consultas SQL em um ambiente python. Além disso, também saberá como trabalhar com o retorno das consultas no Pandas.
Para que você tenha maior proveito do curso é recomendado que você tenha um conhecimento básico em SQL e pleno conhecimento em Python, Pandas e Matplotlib.
Vamos nessa?
Fomos contratados pela Meteora, uma loja de roupas e acessórios que atende todo o Brasil.
Nossa função será entender o banco de dados e exibir informações relevantes que auxiliem a loja na tomada de decisões.
Para isso, solicitaram diversas análises nas quais colocaremos em prática ao longo do curso.
Antes de começarmos a trabalhar nesse projeto, vamos conhecer as ferramentas que utilizaremos.
A primeira ferramenta que utilizaremos é o Google Colab. Nele, vamos subir um notebook pré-pronto para fazermos as análises do Meteora.
Você pode encontrar o notebook nas nossas atividades, na lateral esquerda dessa página. Após baixá-lo, suba o arquivo no Google Colab para ter acesso aos dados.
Também utilizaremos as bibliotecas Pandas e Matplotlib. Por meio delas, poderemos fazer análises por meio de tabelas e gráficos.
Sabendo disso, no Colab, acessamos nosso notebook. Na primeira célula importaremos as bibliotecas acima.
Para isso, escrevemos import pandas as pd
. Na linha debaixo, escrevemos import matplotlib.pyplot as plt
.
Em sequência, importaremos o SQLAlchemy que nos permitirá executar consultas no banco de dados da Meteora.
Para isso, importaremos três módulos essenciais dessa biblioteca. Na linha abaixo escrevemos from sqlalchemy import create_engine, inspect, text
. Feito isso, apertamos "Shift + Enter".
import matplotlib.pyplot as plt
import pandas as pd
from sqlalchemy import create_engine, inspect, text
Feito isso, as ferramentas foram importadas!
Importante ressaltar que além dessas bibliotecas, todos os dados também estarão no SQLLite.
Não teremos empecilhos para utilizá-lo, pois teremos o auxílio do SQLAlchemy que fará as consultas no banco de dados com o Python.
Já sabemos nossa função e as ferramentas que serão utilizadas. No vídeo seguinte conheceremos as tabelas que trabalharemos nesse projeto.
Para realizarmos a análise, precisamos dos dados da Meteora. Nesse vídeo, vamos aprender como coletá-los.
A empresa disponibilizou links de quatro tabelas relacionadas. Eles já estão no nosso notebook, junto com as variáveis que receberão como string. Dessa forma:
url_itens_pedidos = 'https://github.com/alura-cursos/SQL-python-integracao/raw/main/TABELAS/itens_pedidos.csv'
url_pedidos = 'https://github.com/alura-cursos/SQL-python-integracao/raw/main/TABELAS/pedidos.csv'
url_produto = 'https://github.com/alura-cursos/SQL-python-integracao/raw/main/TABELAS/produtos.csv'
url_vendedores = 'https://github.com/alura-cursos/SQL-python-integracao/raw/main/TABELAS/vendedores.csv'
Caso você tenha optado por não realizar o download do notebook da Meteora, não se preocupe. Você pode acessar os links na atividade dessa aula, na lateral esquerda da plataforma.
Sabendo disso, entenderemos um pouco mais sobre essas tabelas.
O banco de dados da Meteora é composto por tabelas com o foco em vendas. Isso significa que cada tabela possui como tema um setor de venda da Meteora. É com esse material que trabalharemos nosso projeto.
A primeira tabela, chamada itens_pedidos
, se refere ao produto que foi pedido. Então, encontramos informações sobre o produto, como valor, frete e estado que foi enviado.
A tabela pedidos
se refere a venda realizada, traz informações sobre quem vendeu, o que, valor e outros dados.
A terceira tabela produto
, traz dados como nome, marca e condição do produto. Por fim, a última tabela vendedores
se refere aos nomes dos vendedores que realizaram as vendas.
Importante lembrar que essas tabelas seguem um esquema de relação entre chaves primárias, estrangeiras entre outras.
Porém, nesse curso não vamos nos preocupar com isso, afinal, nosso objetivo não é modelar os dados e sim analisá-los.
Sabendo disso, no Colab, faremos a leitura das tabelas utilizando o Pandas. Para isso, na célula abaixo dos links, escrevemos itens_pedidos = pd.read_csv(url_itens_pedidos)
.
Repetiremos o mesmo padrão de código para as outras tabelas. O código fica da seguinte forma:
itens_pedidos = pd.read_csv(url_itens_pedidos)
pedidos = pd.read_csv(url_pedidos)
produtos = pd.read_csv(url_produto)
vendedores = pd.read_csv(url_vendedores)
Apertamos "Shift + Enter". Feito isso, as tabelas são salvas em dataframe.
No vídeo seguinte faremos a alocação dessas tabelas no banco para podermos trabalhar com os dados. Vamos lá?
O curso Python: análise de dados com SQL possui 123 minutos de vídeos, em um total de 45 atividades. Gostou? Conheça nossos outros cursos de Data Science em Data Science, ou leia nossos artigos de Data Science.
Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:
Impulsione a sua carreira com os melhores cursos e faça parte da maior comunidade tech.
1 ano de Alura
Assine o PLUS e garanta:
Formações com mais de 1500 cursos atualizados e novos lançamentos semanais, em Programação, Inteligência Artificial, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.
A cada curso ou formação concluído, um novo certificado para turbinar seu currículo e LinkedIn.
No Discord, você tem acesso a eventos exclusivos, grupos de estudos e mentorias com especialistas de diferentes áreas.
Faça parte da maior comunidade Dev do país e crie conexões com mais de 120 mil pessoas no Discord.
Acesso ilimitado ao catálogo de Imersões da Alura para praticar conhecimentos em diferentes áreas.
Explore um universo de possibilidades na palma da sua mão. Baixe as aulas para assistir offline, onde e quando quiser.
Acelere o seu aprendizado com a IA da Alura e prepare-se para o mercado internacional.
1 ano de Alura
Todos os benefícios do PLUS e mais vantagens exclusivas:
Luri é nossa inteligência artificial que tira dúvidas, dá exemplos práticos, corrige exercícios e ajuda a mergulhar ainda mais durante as aulas. Você pode conversar com a Luri até 100 mensagens por semana.
Aprenda um novo idioma e expanda seus horizontes profissionais. Cursos de Inglês, Espanhol e Inglês para Devs, 100% focado em tecnologia.
Transforme a sua jornada com benefícios exclusivos e evolua ainda mais na sua carreira.
1 ano de Alura
Todos os benefícios do PRO e mais vantagens exclusivas:
Mensagens ilimitadas para estudar com a Luri, a IA da Alura, disponível 24hs para tirar suas dúvidas, dar exemplos práticos, corrigir exercícios e impulsionar seus estudos.
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.