Alura > Cursos de Data Science > Cursos de Engenharia de Dados > Conteúdos de Engenharia de Dados > Primeiras aulas do curso Governança de dados: conhecendo o ciclo de vida dos dados

Governança de dados: conhecendo o ciclo de vida dos dados

Estudando ciclo de vida - Apresentação

Olá! Eu sou o Pedro Moura e serei seu instrutor neste curso sobre Ciclo de vida dos dados!

Audiodescrição: Pedro é um homem branco de cabelos escuros e bem curtos, e olhos castanho-escuros. Usa óculos de grau de armação preta e quadrada. Está de camiseta verde-escura básica. Ao fundo, um ambiente iluminado por uma luz esverdeada, com armários e paredes decoradas, além de uma mesa de apoio com alguns enfeites.

Este curso é voltado para pessoas que desejam aprender mais sobre essa forma de gerenciar os dados em uma organização.

Passaremos por cada uma das etapas do ciclo de vida dos dados, aprendendo quais são as competências envolvidas, os atores e as áreas da organização que estão mais próximas de cada uma das etapas, além das questões e objetivos de cada uma.

Ao final do curso, você será capaz de identificar as características específicas de cada uma das etapas e como elas podem, em uma organização, auxiliar na gestão dos dados.

Para aproveitar melhor este curso, recomendamos que você tenha conhecimentos básicos sobre governança de dados.

Vamos lá?!

Estudando ciclo de vida - Porque estudamos o ciclo de vida das coisas

Temos diversas preocupações ao lidar com dados nas organizações, como:

Todas essas preocupações exigem competências e profissionais bastante diferentes, o que nos leva a uma questão: será que conseguimos identificar todas essas competências, necessidades e características específicas sempre que tomamos uma ação relacionada a dados?

Uma forma de entender isso é estudando o ciclo de vida dos dados.

O que é um ciclo de vida?

Quando pensamos em ciclo de vida, logo nos remetemos à biologia. Podemos tomar como exemplo o ciclo de vida das borboletas.

As borboletas nascem como larvas, e sua principal característica é tentar consumir o máximo de folhas possível para angariar nutrientes. Depois, elas procuram um lugar seguro para virar um casulo. Nesse momento, a preocupação é outra: simplesmente conseguir fazer a metamorfose que vai torná-la uma borboleta.

Logo depois que essa transformação acontece, a borboleta deve sair do casulo. Aí mudam completamente as características de sua vida: buscar néctar nas flores e, depois, um parceiro para o acasalamento.

Mas, como essa lógica se aplica aos dados?

O ciclo de vida dos dados

Nos dados, também conseguimos identificar diferentes etapas nas quais as características e preocupações são diferentes ao trabalhar com eles. Por isso, é fundamental estudar seu ciclo de vida.

Além disso, do ponto de vista mais estratégico, estudar o ciclo de vida dos dados facilita entender quais são os atores e capacidades envolvidas em cada uma das etapas.

Até mesmo do ponto de vista operacional, para quem foca em apenas uma das etapas, estudar o ciclo de vida ajuda a desenvolver uma visão sistêmica de tudo o que depende do seu trabalho, além de outras ações posteriores que estão relacionadas a como nos relacionamos com aquele dado.

Ou seja, estudar o ciclo de vida dos dados melhora a percepção de todos os atores envolvidos sobre todas as etapas, além de melhorar a percepção acerca de como o seu trabalho contribui para essa grande ação que é gerir o ciclo de vida dos dados em uma organização, desde a fase de coleta até o descarte.

Mas, antes de avançar para essas etapas, vamos discutir algumas características fundamentais dos dados que devemos ter em conta sempre que trabalhamos com eles. Falaremos sobre isso na próxima aula!

Estudando ciclo de vida - Características fundamentais dos dados

No último vídeo, aprendemos sobre a importância de estudar o ciclo de vida das coisas, e com os dados não seria diferente. Além disso, precisamos entender quais são as características importantes dos dados para compreender de onde eles vêm, para onde vão e o que são, de fato.

Afinal, o que são dados?

Dados são, simplesmente, uma coletânea de registros que pode ser física ou digital.

Um exemplo de coletânea física são revistas, que contêm várias informações. Já um exemplo de informação digital são as bases de dados com as quais trabalhamos, como a do IBGE, que possui dados sobre a população brasileira.

Dados são ativos

A primeira característica que vem à mente quando pensamos em dados, e que é extremamente importante, é o seu caráter de ativo. Dados são um ativo para as organizações porque elas conseguem extrair valor deles.

No entanto, os dados não são um ativo comum. Eles são muito diferentes de, por exemplo, dinheiro ou petróleo. Quando utilizamos um ativo como dinheiro ou petróleo, o consumimos uma vez e ele deixa de estar disponível para nós. No entanto, dados não são consumidos quando utilizados. Ou seja, podemos extrair valor de um dado várias vezes e ele continuará disponível para nós.

Essa é a primeira característica extremamente importante sobre os dados. E é basicamente essa característica que permite que os dados tenham um ciclo de vida. Afinal, se utilizássemos o dado e ele fosse consumido, não seria um ciclo — teria um começo, meio e fim. Mas, como o dado pode ser usado repetidamente, ele pode passar várias vezes por esse ciclo antes de encontrar um fim.

Dados são contextuais

Além disso, os dados têm uma segunda característica igualmente importante: a sua contextualidade. Ou seja, dados são sempre contextuais.

Se mencionarmos os anos 1958, 1962, 1970, 1994 e 2002, isso pode não significar nada. Mas se dissermos que são os anos em que a seleção brasileira ganhou a Copa do Mundo, esses dados têm um novo significado.

Nós só conseguimos nos relacionar com os dados por conta do contexto no qual eles estão inseridos. Portanto, a contextualidade é mais uma característica fundamental dos dados!

Dados são temporais

A última característica que vamos estudar hoje é o caráter temporal dos dados. Ou seja, dados se relacionam muito fortemente com o tempo. Isso ocorre de duas maneiras diferentes.

A primeira é que o dado só vai gerar valor para nós se estiver disponível quando precisarmos dele.

Digamos que estamos fazendo um relatório mensal sobre o crescimento da população brasileira. Mas, nos últimos três meses, o IBGE não divulgou esses dados. Portanto, esses dados não têm valor para nós, porque eles não estavam disponíveis quando precisávamos deles.

A segunda maneira com que os dados se relacionam com o tempo é no aspecto da relevância.

Por exemplo, se estamos interessados apenas nos dados dos times que jogaram a Copa do Mundo, basicamente, todos esses dados que desse contexto nos interessam. Agora, vamos adicionar um recorte temporal: só nos interessam dados de 1966 para frente. Agora, todos os dados de 1966 para trás estão disponíveis, mas não nos interessam.

É a partir da compreensão dessas características fundamentais que agora podemos começar a estudar melhor o ciclo de vida dos dados.

Sobre o curso Governança de dados: conhecendo o ciclo de vida dos dados

O curso Governança de dados: conhecendo o ciclo de vida dos dados possui 69 minutos de vídeos, em um total de 39 atividades. Gostou? Conheça nossos outros cursos de Engenharia de Dados em Data Science, ou leia nossos artigos de Data Science.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Engenharia de Dados acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas