Alura > Cursos de Data Science > Cursos de Excel > Conteúdos de Excel > Primeiras aulas do curso Análise de dados: cálculos, padrões e estratégias com Excel

Análise de dados: cálculos, padrões e estratégias com Excel

Visualização de Dados - Introdução

Olá pessoal, tudo bem? O meu nome é Rodolfo e eu vou acompanhar vocês nesse nosso curso de análise de dados com Excel.

Nesse curso nós vamos explorar bastante as ferramentas estatísticas do Excel, vamos aplicar para um caso fictício diversos conceitos, diversas fórmulas, até mesmo análises gráficas. Há um caso de uma empresa do setor alimentício, que é uma loja de varejo de alimentos, e essa empresa teria solicitado para nós uma consultoria para que nós encontrássemos algumas relações nos dados de vendas que ela nos fornece.

Então se nós formos olhar um pouco o banco de dados que ela nos deu, nós temos aqui uma tabulação, essa é uma planilha do Excel básica, onde nós temos nas colunas as variáveis que vamos trabalhar, então por exemplo, nós temos a data da venda, a data do envio, o modo de envio, segmento do cliente, etc.

Vamos nos concentrar nas variáveis mais quantitativas que estão ali no meio da tabela, que são por exemplo o valor da venda, a quantidade de itens vendidos e o lucro. Em cada linha dessa planilha, nós temos uma venda e registrada, então tem ali a data daquela venda, o tipo de cliente, se ele era corporativo, se ele era um consumidor, o estado de onde ele veio, a cidade, o valor comprado, etc.

O que vamos fazer com essas informações aqui? A hora que a gente olha uma planilha desse tamanho e essa planilha tem 500 linhas, ou seja, são 500 vendas registradas a gente não consegue o olho nu identificar padrões, enxergar ali algum insight interessante que agregue valor à empresa, algo que ela possa trabalhar na estratégia de vendas dela, ou mesmo conferir se há alguma coisa errada no banco de dados ou uma possível fraude por exemplo.

Então vamos usar ferramentas estatísticas para isso, vamos inserir fórmulas dentro do Excel que vão dar resultados interessantes, por exemplo, vamos padronizar variáveis, como aqui nessa coluna temos o lucro padronizado e vamos ver o que significa essa padronização, é uma maneira de nós compararmos cada uma das vendas com uma média daquelas vendas.

Vamos usar bastante também análise gráfica, então por exemplo, iremos produzir gráficos de barra, como esse que está aqui, gráficos de ponto ou dispersão, como esse daqui, além de outros gráficos, nós vamos ver qual gráfico é mais apropriado para cada situação.

Nós vamos fazer o uso de outras ferramentas, iremos pedir média do lucro por exemplo, que é uma medida de posição, vamos calcular mediana, vamos ver a diferença dessas coisas, ou desvio padrão e variância, como está aqui embaixo na planilha também, que são medidas de como os dados desviam com relação à média.

Por fim, nós veremos algumas ferramentas de análise rápida no Excel, que nos dão um conjunto bastante grande de medidas, de estatísticas, como elas são chamadas de uma vez só e isso facilita bastante ou agiliza bastante o nosso trabalho, e até mesmo ferramentas de análise instantânea, como por exemplo, essa solução em que a gente seleciona um pedaço do nosso banco de dados, e aqui no canto nessa barra inferior, temos imediatamente ali a média, a soma, valores máximo e mínimo etc.

Visualização de Dados - Botando a mão na massa

Baixe aqui a planilha utilizada no curso

Então pessoal, nesse vídeo aqui já vamos começar a botar a mão na massa. Primeira coisa que temos que fazer, é relembrar algumas funcionalidades básicas do Excel. Então aqui está a cara do Excel, uma planilha de dados, tem um vasto campo de menus, de possibilidades aqui. E como eu falei, a nossa ideia aqui não é dar um curso completo de Excel, mas usar algumas funcionalidades estatísticas dele.

O nosso banco de dados, que a Alura Market nos forneceu, tem diversas variáveis ou colunas, como são chamadas no Excel, ou às vezes vetores, que são esses alinhamentos de dados que podemos ver aqui, nomeados por “A”, “B”, “C”, “D” e “E” por exemplo.

Nesse banco de dados, o que podemos ver, fazendo uma pequena descrição dele, é que temos dados de vendas de uma loja de varejo no setor alimentício. Então cada uma dessas linhas é uma venda, tem informações sobre uma venda, então temos a identidade, que é simplesmente uma numeração. Em um banco de dados real por exemplo, poderia estar o nome do cliente.

Depois temos data da venda, data de envio, modo de envio, o segmento do cliente, se ele é corporativo, se ele é pessoa física, a cidade do cliente e assim por diante, até lá na frente que temos os dados que vamos usar mais para frente para fazer algumas análises estatísticas, que são por exemplo, o valor da venda, a quantidade vendida e o lucro daquela venda.

Vale lembrar que o Excel tem um paralelo, que é o Google Sheets, mas embora elas tenham funcionalidades bastante semelhantes, a sintaxe das funções pode variar.

O que é sintaxe? É a escrita, o nome da função, e os parâmetros, o que vai dentro da função, a forma de separar aquilo nós colocamos dentro da função, então embora as técnicas que a gente veja aqui, possam ser aplicadas na ferramenta do Google, elas normalmente precisam ser adaptadas, porque o nome da função é diferente, o modo de operacionalizar pode variar um pouquinho, então não é imediata essa transposição.

O que vemos aqui nessa planilha, que é um banco de dados de tamanho moderado por assim dizer, é que nós, a olho nu não conseguiremos encontrar um padrão nessas coisas, não conseguimos, olhando a coluna “K” por exemplo, descobrir qual item de venda tem geralmente um valor maior ou com a quantidade que vendemos mais de unidades daquele item, ou se vendemos mais doce, mais salgado, etc.

E o que queremos fornecer para empresa é justamente esse tipo de inteligência, buscar padrões nos registros de vendas que ela nos forneceu, então se você não é um Neo, Trinity ou Morfeu, que consegue olhar uma matriz e encontrar padrão nessas coisas, é melhor você usar estatística descritiva, é isso que faremos a seguir.

Visualização de Dados - Visualização de variáveis categóricas

O que faremos agora é uma visualização inicial de dados. Uma boa prática quando pomos as mãos no banco de dados, é pedir alguns gráficos para observar o jeito de uma variável por exemplo.

Aqui nós vamos olhar uma variável categórica, o que é uma variável categórica? Só lembrando, é uma variável não quantitativa. Por exemplo, uma variável que é dividida em categorias, em nomes, em qualidades. Vamos olhar por exemplo a variável consumidor ou segmento do cliente, mais precisamente, que temos aqui na nossa coluna “E”, segmento do cliente.

O que temos de valores nessa variável são categorias, então nós temos um consumidor, corporativo, home office, são os três tipos de clientes que temos aqui, os três segmentos. O que podemos fazer é colocar isso daqui em um gráfico para olhar a distribuição dessa variável, para saber o que temos mais, se é mais consumidor, pessoa física, se é mais corporativo ou se é mais home office.

Antes da jogarmos isso em um gráfico, vamos fazer um pequeno exercício visual mental aqui, vamos rolando essa planilha para baixo, para ver se a conseguimos mentalmente descobrir qual é o tipo de cliente mais predominante, qual é o segundo mais predominante, qual é aquele para qual vendemos menos.

É uma tarefa complicada, porque a planilha não cabe na nossa tela. Então temos um problema cognitivo, uma dificuldade intrínseca de encontrar um padrão a olho nu aqui, ou pelo famoso teorema de Zukovski nós não enxergamos qual é o padrão aqui, então podemos usar um gráfico para fazer isso. Um gráfico excelente para análise da distribuição de variáveis categóricas, é o gráfico de barras, vamos produzir então um gráfico de barras aqui.

A primeira coisa que nós temos que fazer é clicar para selecionar coluna inteira, então clicamos aqui em cima da letra “E”. Você pode alternativamente clicar na primeira célula e ir arrastando até lá embaixo, mas é menos eficiente, quando você tem uma planilha limpinha desse jeito aqui, basta você clicar na letra da coluna e verificar que ela foi até o final da nossa planilha.

Olha só, dando um scroll ela foi lá até a linha 501 e selecionou tudo que a precisamos. Uma vez a coluna selecionada, ou o vetor, como eu falei ou a variável, vamos no menu inserir, depois nessa funcionalidade do Excel chamada gráficos recomendados. Essa funcionalidade gráficos recomendados vai buscar um gráfico apropriado, que o Excel acha apropriado para aquela variável que nós selecionamos, funciona muitas vezes, às vezes não funciona e nós veremos exemplos mais para a frente.

Alternativamente podemos ver aqui em todos os gráficos, por exemplo, só para vocês verem todos os tipos de gráficos que o Excel faz, mas nesse caso aqui a função, a funcionalidade gráficos recomendados, sugere o gráfico apropriado para nós, que é o nosso famoso gráfico de barras ou como o Excel chama, um gráfico de coluna agrupada, é a mesma coisa, ele já dá uma pré-visualização aqui da nossa distribuição da variável.

Nós podemos clicar em ok que ele vai produzir esse gráfico, no caso aqui da minha versão do Excel, ele criou uma nova aba, que ele chamou de planilha dois, pode ser que no seu Excel, ele sobreponha o gráfico na própria planilha de dados que você tem, é indiferente, o gráfico é ao mesmo, depois você pode inclusive pegar esse gráfico, exportar para uma nova planilha, uma nova aba ou para um documento de Word ou para o PowerPoint, para colocar isso numa apresentação.

Mas aqui, temos os dados, e do ponto de vista de análise, o que é interessante para notarmos, é que o segmento consumidor, é o segmento predominante aqui na Alura Market, nosso mercadinho de doces, salgados e bebidas.

E o que é legal também é notarmos que os dois outros segmentos não constituem nem metade das nossas vendas, então vemos aqui que se somarmos, quantidade de vendas para home office e para corporativo, não chega ainda no mesmo número de vendas que temos para consumidor.

Dá um exercício visual mental que podemos fazer, que é sobrepor essas duas colunas de corporativa ao home office, como se recortássemos o home office, e colasse aqui encima de corporativo, ainda assim não chegaria lá na altura da barra de consumidor.

Então esse é um primeiro padrão que encontramos aqui, é uma primeira informação, uma primeira inteligência, um primeiro valor que nó agregamos para a Alura. Consumidor, pessoa física, seu tipo predominante de vendas, e mais do que predominante, ele corresponde a mais de 50%, mais de metade das suas vendas.

Sobre o curso Análise de dados: cálculos, padrões e estratégias com Excel

O curso Análise de dados: cálculos, padrões e estratégias com Excel possui 105 minutos de vídeos, em um total de 36 atividades. Gostou? Conheça nossos outros cursos de Excel em Data Science, ou leia nossos artigos de Data Science.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Excel acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas