Alura > Cursos de Data Science > Cursos de Business Intelligence > Conteúdos de Business Intelligence > Primeiras aulas do curso Tableau: funções e cálculos LoD

Tableau: funções e cálculos LoD

Diferenças entre discreto e contínuo - Apresentação

Meu nome é Victorino Vila e eu vou ser o instrutor de vocês nesse curso Tableau - Funções e cálculos LoD.

Esse curso vai ser dividido em 7 aulas e começaremos, na primeira aula, falando sobre o conceito do Discreto e do Contínuo dentro do Tableau.

Chegamos a falar sobre isso um pouco no primeiro curso da formação Tableau, vamos estressar um pouco mais esse conceito.

Por quê? Porque quando lidamos com cálculos e, principalmente, quando lidamos com uma categoria de cálculo chamada TABLE_CALCULATION_LEVEL, é preciso entender esse conceito do Discreto e do Contínuo e de uma partição dentro da visão que você monta no Tableau.

Na aula 2 nós vamos entender o que é o TABLE_CALCULATION_LEVEL. Se vocês se recordam também lá no primeiro curso quando vimos cálculos falamos que existem três grandes grupos de cálculos no Tableau, o cálculo a nível de célula ou linha, a nível, de agregação e a nível de tabela.

É a essa terceira categoria que daremos ênfase na aula 2, vamos entender o conceito do TABLE_CALCULATION_LEVEL, e vamos ver algumas funções que utilizam o critério de TABLE_CALCULATION_LEVEL. No caso, veremos o Lookup Total, Previous e o Running.

Na aula 3, vamos continuar olhando outras funções do TABLE_CALCULATION_LEVEL como a Windows e vamos montar um caso prático na aula 3 baseado em montar uma análise que nós que assistimos noticiário na TV olha muito, que são as médias móveis das mortes de Covid. Vamos, na aula 3, montar esse gráfico, um gráfico igual ao que vemos na TV.

Depois vamos entender mais algumas funções TABLE_CALCULATION_LEVEL no capítulo 4, que é a First e Last, Index, Rank e a Size.

Na aula 5, vamos estressar melhor o conceito de direção do cálculo quando aplicamos a função em uma TABLE_CALCULATION_LEVEL. Porque quando aplicamos todas essas funções que eu já falei nas aulas anteriores, precisamos dizer a direção com que esse cálculo deve ser efetuado.

Vamos entender na aula 5 como funcionam essas direções, quais são as combinações existentes e vamos praticar um pouco sobre elas.

Agora vamos abandonar as funções TABLE_CALCULATION_LEVEL e a partir da aula 6 e da aula 7 vamos falar das funções LoD. Que vem do Inglês Level of Detail ou expressões de nível detalhe, é um outro grupo de cálculos

E basicamente o que essas expressões LoD fazem é fixar, incluir ou excluir uma determinada dimensão durante a consolidação dos dados no momento em que você os visualiza na tela. Falaremos, na aula 6, sobre o fix it, vamos entender, praticar e fazer alguns exercícios práticos sobre ele.

E na aula 7, nós vamos falar sobre o INCLUDE e o EXCLUDE. E terminaremos esse treinamento. Esse treinamento faz parte de mais um curso da formação Tableau, e espero que vocês gostem.

Vamos começar a estudar, um abraço e até o próximo vídeo.

Diferenças entre discreto e contínuo - Discreto e contínuo

Vamos começar e vamos falar sobre uma coisa que é muito importante para quem utiliza o Tableau, até mesmo para entender como funciona a ferramenta no momento em que você começa a arrastar, para aquelas áreas de linhas e colunas, dimensões ou medidas.

Se vocês prestaram atenção em tudo que fizemos até agora, vocês viram que o Tableau possui certo padrão quando começamos a construir visões.

E esse padrão pode parecer um pouco complicado no primeiro momento, mas ele possui certa lógica, o Tableau possui uma inteligência interna que já te orienta para montar para você a melhor visão levando em consideração aquilo que você selecionou.

Para entender essa lógica temos que começar a entender direito porque algumas entidades são verdes e outras são azuis.

Quando arrastamos para a área de colunas e linhas, muitas coisas aparecem com a cor azul como, por exemplo, está sendo mostrado na figura acima, ou na cor verde.

E em um primeiro momento, podemos estar associando sempre o azul a uma dimensão e o verde a uma medida. Por quê? Porque normalmente quando arrastamos alguém que é dimensão como, por exemplo, um código de uma cidade, nome de um, cliente, o Tableau automaticamente coloca ele com a cor azul.

E quando arrastamos quantidade vendida, faturamento, ele automaticamente coloca como verde. Mas ser azul e ser verde não tem nada a ver com dimensão e medida. Mas tem a ver com o conceito de Discreto e Contínuo. Ou seja, tudo que é azul é alguma coisa Discreta e tudo que é verde é alguma coisa Contínua.

E temos que entender que Discreto é alguma coisa que eu consigo contar, consigo identificar. Enquanto que Contínuo é alguma coisa infinita, que vai de um ponto a outro.

Por exemplo, se eu tiver alguém que tiver uma classificação, por exemplo, bom, ruim, ou Rio, São Paulo, Brasília, isso é uma informação Discreta, porque eu posso contar essas ocorrências.

Quando falamos alguma coisa que é um número inteiro que varia de 0 a 100, eu tenho infinitas possibilidades ali, um número que vai de 0 a 100, em um primeiro momento, pode ser alguma coisa Contínua.

Mas não significa ainda que Contínuo e Discreto seja texto ou número, porque eu posso olhar alguém que é Contínuo de modo Discreto.

Por exemplo, eu tenho uma tabela com regiões, tenho a região 1, a quantidade vendida, a região 2, a quantidade vendida e a região 3 e a sua quantidade vendida.

Quando olhamos a quantidade vendida como sendo qualquer valor, ou seja, se eu colocar uma região 4 eu posso colocar qualquer valor, e posso vender também 100, mas eu posso vender 150, 180, 210, 1.500, tanto faz, é um número. Eu estou olhando a quantidade vendida como sendo alguma coisa Contínua.

Mas eu posso, por exemplo, dizer que as únicas possibilidades de vendas é ou o valor 100 ou o valor 500, ninguém pode vender 50 ou vender o número 150, ou é 100 ou é 500.

Eu posso tratar a quantidade vendida, que é um número, como sendo um valor Discreto, basta eu dizer que as ocorrências que podem acontecer naquela medida é o número 100 ou o número 500.

Normalmente um número ou alguém que é Contínuo pode ser visualizado no Tableau como Discreto, e aquilo que era verde vira a cor azul.

Um exemplo que acontece muito é CPF, quando colocamos CPF no Tableau, CPF é composto só de números e muitas vezes quando carregamos para o Tableau as informações de CPF, o Tableau encara ao analisar o dado que o número do CPF é um número e ele, por padrão, classifica o CPF como Contínuo.

E se eu arrasto o CPF para visualizar alguma coisa, ele vai tratar aquilo como um número qualquer que vai de um ponto a outro.

Em um primeiro momento, o Tableau interpreta o CPF como Contínuo, mas é importante que eu diga para ele "Não, precisamos transformá-lo em Discreto", o número de CPF é uma identificação numérica, claro, mas é uma identificação de uma pessoa, não é uma coisa que tenha uma Continuidade entre os pontos.

Outro exemplo é data, data é uma coisa que se você não falar nada o Tableau considera como Contínua porque o Tableau olha a data até a nível de segundos, você pode ter infinitas datas entre dois períodos.

Agora, quando eu olho a data como um Discreto, eu estou olhando os pontos ao longo do tempo sem considerar o intervalo entre eles.

Essa definição de ser Contínuo ou ser Discreto realmente é uma área cinzenta, muitas coisas podem gerar controvérsias, podem gerar discussões para saber se aquilo é Contínuo ou se aquilo é Discreto.

Agora, ser Discreto ou Contínuo vai resultar o quê? Em uma visão default que o Tableau vai montar de forma automática. Ser Discreto ou Contínuo vai resultar em um comportamento diferente quando formos montar uma visão no Tableau.

Se eu tenho uma entidade que é Discreta ou Contínua, isso vai gerar no Tableau um comportamento diferente quando formos arrastar entidades para a linha, para a coluna, para filtro ou para a área de cores.

Quando eu pegar uma entidade e colocar nesses quatro lugares, o fato de ela ser Discreta ou Contínua vai fazer com que o Tableau faça alguma coisa diferente.

Por exemplo, se eu arrasto uma entidade que é Discreta para linhas, por exemplo, eu vou gerar um cabeçalho, ou seja, se eu colocar regiões aqui eu vou ver a lista das regiões no eixo vertical.

E eu vou ver uma a uma, por quê? Porque região aqui no caso é Discreta, são quatro valores, não há uma continuidade entre eles, valores intermediários entre eles, a ordem com que a região é apresentada não tem certo sentido.

E claro, se eu começo a arrastar entidades Discretas tanto para colunas quanto para linhas o Tableau vai montando os relatórios colocando no cabeçalho da identificação aquilo que eu estou colocando como Discreto.

Porém se eu arrasto para uma coluna ou uma linha alguém que seja Contínuo, em vez do Tableau escrever esses valores, ele cria um eixo, um eixo que pode ser um eixo vertical ou horizontal, ele sinaliza para mim uma continuidade.

Ou seja, ele tende a escrever um gráfico em vez de uma tabela porque é o gráfico que vai me representar a evolução de coisas contínuas. Aqui, no caso, como eu botei colunas, ele vai criar um eixo horizontal e como eu coloquei em linhas Região, ele vai criar os labels verticalmente.

Se eu, por acaso, pego esse cara que está sendo olhado como Contínuo, SUM(Faturamento e…, e transformo ele em Discreto, isso é uma possibilidade, eu posso ter alguém que é Contínuo e transformar em Discreto e vice-versa.

O que ele vai fazer é transformar esse eixo que é uma continuidade desse valor em valores fixos. E vai transformar isso em tabela porque eu passei aquela entidade que era Contínua para Discreta.

O fato de aquela entidade ter mudado a sua característica fez com que o Tableau desenhasse uma tabela de uma forma diferente. E esse conceito faz com que eu possa usar a inteligência do Tableau para montar de forma rápida a visão que eu quero trabalhar.

Por exemplo, se eu tenho entidades como Discretas o que eu vou ter no meio sempre vai ser alguém que eu vou ver escrito. E o que eu vou ver aqui no meio basta arrastar para a área de texto, se eu arrastar alguém área a área de texto, ele vai escrever onde eu tenho os ABCs.

No caso, se eu arrastar alguém que é Contínuo, ele vai escrever, por exemplo, os valores, representar os valores de forma numérica.

Se, por acaso, eu arrastar alguém para texto que é Discreto, ele vai colocar as ocorrências. Note aqui no meio eu tenho nome de produtos que cruzam o Distrito Federal Centro Oeste e cruzam com esse diretor Produto.

Por quê? Porque Produto foi colocado no lugar do texto. Dependendo do que eu arrasto, tanto para minhas colunas quanto para as marcas que temos no canto esquerdo, eu vou ter um resultado final.

Nós podemos dizer o seguinte: que quando eu arrasto alguém par alinha e para coluna eu estarei criando o que chamamos de headers, ou seja, cabeçalhos das minhas visões.

Quando eu arrasto alguém que é Contínuo eu estarei criando o que nós chamamos de eixos, aqui, no caso, por exemplo, como eu tenho duas entidades Discretas, uma na linha e uma na coluna, eu tenho dois headers. Um header horizontal representando o vendedor e um header vertical representando a região.

Já se eu arrasto alguém Contínuo, o header vertical onde eu tenho a região continua sendo um header, mas o que eu tenho na horizontal passa de header para um eixo. E ele começa a montar um gráfico.

E se eu por acaso arrastar para Rows outro indicador que chamaríamos de Contínuo, eu passo a olhar, por exemplo, dois eixos.

Note que dependendo do que eu estou arrastando para a linha e para a coluna, eu terei uma tabela. Uma tabela com labels e eixos. Ou um gráfico com dois eixos.

É isso que eu gostaria de falar com vocês sobre essa característica do Discreto e do Contínuo, e vamos praticar isso no próximo vídeo.

Um abraço, até daqui a pouco.

Diferenças entre discreto e contínuo - Relacionamento entre tabelas

Lá no Mão na Massa vai ter um link para vocês fazerem o download desta planilha. O nome dela é Superstore.xls.

Vamos copiar essa planilha para um diretório local na nossa máquina onde você vai usar como fonte de tudo que você está fazendo aqui no treinamento, "Botão direito do mouse > Copiar".

No meu caso, eu vou usar o diretório "Tableau Curso 2". Eu já estou usando, inclusive, para salvar tudo que eu estou fazendo aqui nos cursos que estão incluídos na nossa carreira de Tableau.

Eu vou colar aqui o arquivo "Ctrl + V". E vou abrir o Tableau, "Windows > Tableau Public 2021.2 > Enter".

Eu tenho aqui o meu Tableau, o último livro que eu salvei foi o livro 17, que vieram de outros cursos da nossa carreira. E no caso, eu vou me conectar a um Microsoft Excel.

Vou escolher no diretório onde eu salvei, "Tableau Curso 2", o "Superstore.xls". Note que ao fazer isso, ele me mostra, no canto esquerdo, como uma planilha de Excel, pastas da planilha.

Se olharmos essa planilha, no caso eu estou olhando ela através do Google Sheets porque eu não tenho Office nessa máquina.

Essa é a mesma planilha que estamos consultando no Tableau, ela possui três abas, Notas, Diretores e Recebido. Note que nessa primeira aba eu tenho o número da nota fiscal, data da nota fiscal.

Isso é uma base de dados de envios de mercadorias pelo Correio. As pessoas fazem compra online em uma loja virtual e cada linha dessa planilha é o registro de uma compra.

Eu tenho o número da nota fiscal da compra, a data da nota fiscal, a data do envio da mercadoria para o cliente, o modo do envio.

Aqui, no caso, é uma classificação referente ao tipo de postagem, se eu quero mandar uma postagem mais rápida é uma postagem de primeira classe, se eu quiser usar uma postagem mais lenta, mais barata, de segunda classe, tenho a classe padrão. Ou seja, são classes diferentes de postagem.

Eu tenho o código do cliente, o nome do cliente, o segmento de mercado desse cliente. Tenho a região que, no caso, é o país, eu tenho a cidade, o estado. Nós temos o código postal, que é o código postal do endereço do cliente, a região, o estado geográfico onde esse cliente mora.

O código do produto, a categoria do produto, cada produto tem uma classificação, uma subcategoria, um detalhamento dessa categoria e o nome do produto. Eu vendo materiais de escritório, materiais de tecnologia e mobiliários.

Mas uma coisa interessante é que eu tenho essa informação nessa aba, nessa pasta Notas, se eu for em Diretores eu consigo ver as Regiões. Ou seja, o que eu tenho na pasta Diretores representa a mesma coisa que eu tenho na coluna "Região".

Ou seja, há uma relação entre a pasta 2 e a pasta 1 onde eu tenho os responsáveis, os Diretores de vendas de cada região. E eu tenho um recebido que tem o número da nota fiscal, ela está na tabela principal, na coluna B, "Número da Nota Fiscal" e eu tenho apenas se foi recebido ou não, se o cliente recebeu a mercadoria.

Ou seja, eu tenho uma mesma planilha três abas, em cada aba eu tenho uma tabela e há campos que fazem um relacionamento entre essas tabelas.

Por que eu estou falando tudo isso? Porque olha como vai ser o comportamento do Tableau. Eu tenho as três tabelas, eu vou arrastar primeiro "Notas", que é a primeira, vamos recapitular, vou arrastar "Notas" que é a principal para "Superstore" no Tableau.

Note que ele automaticamente reconheceu todos os campos da tabela, até aqui tudo bem, mas notem, se eu arrastar a planilha "Diretores", veja que ele já coloca aqui um relacionamento.

Ele consegue identificar que tem um campo em comum enter a aba "Notas" e a aba "Diretores". Vamos arrastar de novo, vou largar aqui. E ele me confirma, "Olha, eu vou sugerir que há uma relação entre a coluna 'Região' da aba 'Notas' com a coluna 'Região' (Diretores) da aba 'Diretores'". Eu vou confirmar essa relação.

E se eu pegar o "Recebido", note que ele vai criar uma segunda relação. Ele vai me sugerir a relação, "Olha, eu acho que há uma relação entre 'Número Nota Fiscal' com 'Número Nota Fiscal (Recebido)'". Eu confirmo essa relação.

O que eu tenho aqui são como se fossem três tabelas, como se fosse um esquema de relacionamento entre tabelas. Quando eu leio isso em uma planilha de Excel cada aba pode ser uma tabela diferente, se eu estivesse lendo isso de um banco de dados eu teria os relacionamentos das tabelas do banco de dados automaticamente refletidos nessa aba.

Quando eu vou para a planilha o que eu tenho é: todos os campos das três tabelas, eu tenho da tabela "Recebido", da tabela "Notas" e da tabela "Diretores".

Mas eu posso arrastar para a minha visão qualquer um dos campos embaixo de cada tabela porque como eles se relacionam o Tableau sabe ligar as informações de uma tabela com as relações de outra tabela através daquela conectividade.

É como se eu pudesse montar lá no momento em que eu associo a informação externa no Tableau a um relacionamento, como se fosse relacionamento entre um data warehouse.

É isso que eu queria mostrar para vocês. Um abraço e até o próximo vídeo.

Sobre o curso Tableau: funções e cálculos LoD

O curso Tableau: funções e cálculos LoD possui 270 minutos de vídeos, em um total de 68 atividades. Gostou? Conheça nossos outros cursos de Business Intelligence em Data Science, ou leia nossos artigos de Data Science.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Business Intelligence acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas