O que é IA Generativa? A importância e o uso das Inteligências Artificiais como ChatGPT, MidJourney e outras

O que é IA Generativa? A importância e o uso das Inteligências Artificiais como ChatGPT, MidJourney e outras
Allan Segovia Spadini
Allan Segovia Spadini

Compartilhe

Introdução

Recentemente, ocorreu uma explosão de notícias e interesse em inteligência artificial (IA). Muitos especialistas afirmam que a IA é a próxima fronteira da tecnologia, com potencial para transformar todas as áreas da sociedade. Mas o motivo de tanta atenção é um tipo específico de IA, as IAs generativas. Essas têm mostrado rápida evolução e estão chamando a atenção de todo o mundo.

Banner promocional da Alura, com um design futurista em tons de azul, apresentando dois blocos de texto, no qual o bloco esquerdo tem os dizeres:

O que é inteligência artificial?

A inteligência artificial é uma área da Ciência da Computação cujo objetivo é criar sistemas capazes de realizar tarefas que, até então, só poderiam ser executadas por seres humanos.

Você já deve estar cansado de ouvir falar nisso. Afinal, a inteligência artificial faz parte de diversos serviços que utilizamos no dia a dia. Recomendadores de filmes em sites de streaming, classificadores de foto em redes sociais ou mesmo classificadores de spam são exemplos de uso de aprendizagem de máquina. Todas essas aplicações são interessantes e úteis. Elas fazem com que seres humanos não tenham que perder tempo realizando atividades mecânicas.

Você pode entender melhor o que é aprendizagem de máquina, ou em inglês machine learning nesse vídeo dos irmãos Silveira:

O que é Machine Learning? #HipstersPontoTube

Mas e quanto a atividades como interpretar um trecho de texto, construir um site do começo ao fim com base em instruções de um cliente, ou mesmo escrever histórias em quadrinhos a partir da descrição de personagens? Todas essas tarefas envolvem o raciocínio e criatividade reais e nunca poderão ser desempenhadas por uma inteligência artificial, correto?

No vídeo a seguir, o Gui Silveira se dedica a pergunta: Será que a inteligência artificial será tão poderosa quanto os seres humanos?

Será que a inteligência artificial será tão poderosa quanto os seres humanos? com Gui Silveira

O que é IA generativa?

As inteligências artificiais generativas têm a capacidade de criar novas informações a partir de conjuntos de dados pré-existentes. Essas IAs são “ensinadas” a partir de grandes bases de dados com a intenção de que sejam capazes de adquirir o padrão de construção desses dados. Com essa compreensão adquirida, se tornam capazes de gerar novos dados, semelhantes aos dados utilizados para ensinar a IA, mas que podem ser únicos e originais.

Como funciona a tecnologia de IA generativa?

As redes neurais generativas adversativas, também chamadas de GANs pela sua abreviação em inglês, têm essa capacidade de aprendizado e geração de novos dados. As GANs funcionam utilizando duas redes neurais:

  1. A primeira é uma rede geradora, capaz de criar dados;
  2. A segunda é uma rede discriminadora, que avalia os dados gerados pela primeira.

Essas redes funcionam em conjunto em um ciclo:

  • A rede geradora melhora os dados criados com base na nota dada pela rede discriminadora;
  • Esse processo é repetido até que a qualidade dos dados gerados seja considerada boa.

O que é Deep Learning? #HipstersPontoTube

Tudo isso, faz com que as IAs generativas possam ir além da aprendizagem de máquina convencional. Essas IAs podem aprender por conta própria. Normalmente as IAs não generativas precisam de dados anotados por seres humanos. Ou seja, um identificador de spam precisa de vários exemplos de e-mails que são e não são spam.

Já as IAs generativas podem aprender identificando padrões e agrupamentos dentro do conjunto de dados. Além disso, também podem aprender em ambientes onde recebam recompensas quando realizam uma tarefa de forma que consideramos correta.

O que é possível criar com inteligência artificial generativa?

As possibilidades de criação são praticamente ilimitadas. Podemos criar imagens, músicas e até mesmo textos completamente novos. É possível programar a IA para criar uma nova música a partir de um conjunto de notas pré-existentes, converter uma notícia de jornal para o estilo de escrita de Machado de Assis ou a foto de um gato para o estilo da Noite Estrelada de Van Gogh.

Foto de um gato convertida para o estilo da pintura Noite Estrelada de Van Gogh com um balão de texto centralizado no topo da imagem. No balão, lê-se “Foto de um gato para o estila da Noite Estrelada de Van Gogh” e há um ícone de um robô à direita.

Em áreas como a saúde, as IAs Generativas podem ser utilizadas para gerar modelos de previsão de testes clínicos, identificar padrões em exames médicos e auxiliar no diagnóstico de doenças.

Já em computação podemos gerar exemplos de códigos via instruções de texto. É possível criar um passo a passo de como executar uma tarefa em um software específico nos baseando no texto de uma pergunta ou mesmo desenhar toda a arquitetura de um software.

Exemplos de IA generativa

Com o aumento no interesse em inteligência artificial, têm surgido diversos serviços na internet que utilizam algum tipo de IA generativa. Entretanto, os nomes mais conhecidos são:

  • DALL-E;
  • Midjourney;
  • Github Copilot;
  • GPT-3 e GPT-4;
  • Jasper;
  • Bing Chat;
  • Google Bard; e
  • O famoso ChatGPT.

Cada uma dessas ferramentas tem funcionalidades específicas, mas podemos agrupá-las em geradoras de imagens e geradoras de texto.

IA generativa para a criação de imagens

As IAs generativas têm tido grande impacto na geração de imagens, pois conseguem gerar imagens realistas e detalhadas a partir de descrições textuais. A geração de imagens dessa forma pode ter aplicações em algumas áreas como:

  • Design;
  • Cinema;
  • Jogos;
  • Publicidade; e
  • Artes.

Tudo o que antes só poderia ser feito por profissionais especializados, agora, pode ser feito por pessoas que saibam informar uma descrição adequada do querem para a IA. Dentre as ferramentas citadas, a DALL-E e a Midjourney realizam esse tipo de tarefa.

1) DALL-E

A DALL-E é um sistema de inteligência artificial criado pela OpenAI, que é capaz de criar imagens a partir de descrições textuais. O nome é uma homenagem ao pintor surrealista espanhol Salvador Dalí e ao robô WALL-E do filme de animação da Pixar.

Você pode testar o DALL-E acessando o login da OpenAI Labs. Lá você terá uma quantidade de créditos renovada mensalmente, que pode ser utilizada para gerar imagens. Nesse exemplo digitei a descrição: Um coala dançando com um panda. Foram geradas quatro imagens como resultado:

Imagens geradas pela DALL-E a partir da descrição “Um coala dançando com um panda” com um balão de texto centralizado no topo da imagem. No balão, lê-se “Um coala dançando com um panda” e há um ícone de um robô à direita.

2) Midjourney

O Midjourney funciona de maneira semelhante ao DALL-E. A diferença principal é que a ferramenta é acessada através do Discord e, ao fazer login, você recebe uma conta de teste gratuita.

Tutorial MIDJOURNEY: Como usar e fazer Prompts Perfeitos

Na versão gratuita você terá o número limitado de 25 imagens. Depois disso, terá que passar para uma conta premium. Você pode consultar os preços e condições do teste gratuito na página de planos, já que essas questões mudam com o tempo.

Exemplo de imagens geradas com o Midjourney para a descrição “Gere a imagem de um gato dando aula de programação em um auditório (Estilo Anime)”. Na topo da imagem, um balão de texto centralizado em que lê-se “Gere a imagem de um gato dando aula de programação em um auditório (Estilo Anime)” com um ícone de um robô à direita.

IA generativa para criação de texto

Algo muito trabalhoso é escrever um texto como este aqui. Para isso, existem ferramentas como o Jasper e o ChatGPT. IAs generativas de texto são capazes, por exemplo, de:

  • Gerar textos longos e complexos;
  • Fazer uma tradução automática;
  • Gerar respostas em chats;
  • Classificar sentimentos em texto; e
  • Até a própria interpretação e resumo dos principais tópicos de um texto.

No episódio 291 do podcast Hipster.Tech, falamos sobre o processamento de linguagem natural, incluindo texto, dentro da inteligência artificial. Vale a pena conferir:

Processamento de Linguagem Natural – Hipsters Ponto Tech #291

Ouvir um pouco de:
Processamento de Linguagem Natural – Hipsters Ponto Tech #291

1) Jasper

Jasper é um serviço que se propõe a ajudar pessoas que escrevem textos de marketing, copys para venda de produtos e textos em mídias sociais em geral. Usando uma descrição em texto, você pode dizer o assunto sobre o qual você quer escrever que a IA escreve um texto completo sobre o assunto para você.

2) GPT

Generative Pre-trained Transformer (GPT) é um modelo de linguagem natural desenvolvido pela OpenAI, empresa que pesquisa inteligência artificial. Ele é baseado em uma arquitetura de rede neural conhecida como Transformer, e essa arquitetura tem a habilidade especial de trabalhar com informações sequenciais como texto.

Na internet, eventualmente aparecem termos como GPT-3 e GPT-4, que nada mais são que diferentes versões do modelo. Em cada versão tentam treinar o modelo utilizando mais informações e, consequentemente, gerando uma ferramenta mais poderosa. Conjuntos textuais como a Wikipédia e a Common Crawl foram utilizados para o treinamento do GPT.

Esse modelo foi desenvolvido visando conseguir realizar uma grande variedade de tarefas de linguagem natural, como:

  • A tradução automática;
  • A geração de respostas em chats;
  • A geração de textos longos e com determinado estilo;
  • Entre outras atividades.

O GPT pode ser acessado como API para alimentar diferentes serviços criados por desenvolvedores.

Apesar do GPT estar sendo muito utilizado e ser muito famoso, já existem outros modelos desenvolvidos por outras instituições que estão pesquisando sobre modelos de linguagem natural. Esses modelos são igualmente interessantes e podemos citar como exemplos o LLaMA da Meta e o Alpaca de Stanford.

Se você tem interesse em discussões sobre o futuro dos desenvolvimentos de inteligência artificial no que diz respeito ao processamento de linguagem natural, recomendamos esse episódio do Hipster.Tech:

NLP, Inteligência Artificial e o futuro – Hipsters Ponto Tech #217

Ouvir um pouco de:
NLP, Inteligência Artificial e o futuro – Hipsters Ponto Tech #217

3) Copilot

O Copilot é um plugin desenvolvido pelo Github com a função de sugerir trechos de código. Os desenvolvedores podem instalar o Copilot como uma extensão do VSCode. Quando o usuário comenta o código descrevendo o que irá fazer na sequência ou escreve um trecho de código, o Copilot sugere um bloco de código que se propõe a resolver o seu problema ou continuar o código na sequência.

Recentemente o Github anunciou o Copilot X, que visa adotar o modelo GPT-4 para criar uma ferramenta de chat focada no desenvolvimento de código.

4) ChatGPT

De todas as ferramentas citadas, o ChatGPT é a mais famosa no momento de escrita desse texto. Ele também usa o GPT como modelo para gerar as respostas. Porém, o grande diferencial da ferramenta foi popularizar o uso do modelo como um chatbot onde você pode fazer perguntas.

Se você pedir para o ChatGPT escrever um texto sobre algum assunto e perceber que o texto não ficou exatamente como você queria, é possível pedir para que ele faça correções. Tudo isso como se fosse uma conversa entre duas pessoas.

Entendendo o ChatGPT: Como Funciona e o Poder dos LLMs

O advento do ChatGPT fez com que a Microsoft, que investiu cerca de 1 bilhão de dólares na OpenAI, criasse o Bing Chat. Esse também é um assistente virtual em forma de chat. O diferencial em relação ao chatGPT é que o Bing Chat tem acesso à internet. Como o chatGPT se baseia em um modelo de linguagem natural pré-treinado, os dados disponíveis no modelo contam com informações até 2021 apenas na versão gratuita atual.

Como resposta ao Bing Chat o Google está desenvolvendo o Bard que busca ter funcionalidades semelhantes.

Como integrar o uso do ChatGPT ao MidJourney

Cada uma dessas inteligências pode ser combinada. Basta utilizar a criatividade. Você pode, por exemplo, pedir para o ChatGPT criar uma história e dizer quais imagens combinam com essa história. Podemos pedir para que o chat diga quais instruções devem ser passadas para o MidJorney para gerar imagens de qualidade e que sigam o mesmo estilo.

Além disso, o fato do GPT ser disponibilizado como API permite que desenvolvedores criem ferramentas que combinem as duas funcionalidades ou façam coisas novas que ainda não imaginamos.

Vantagens e desvantagens da Inteligência Artificial Generativa

Vantagens

As IAs generativas podem nos ajudar:

  • Na execução de tarefas criativas;
  • A trabalhar mais rapidamente na criação de textos; e
  • A reduzir custos em diversas áreas.

Adicionalmente, podemos personalizar essas ferramentas para atividades específicas dentro de uma empresa ou utilizá-las como ferramentas de aprendizado em uma tecnologia ou assunto que ainda não dominamos.

Desvantagens

Por outro lado, toda tecnologia nova e poderosa gera alguns medos:

  • Algumas IAs podem gerar conteúdo nocivo, se não houver nenhum tipo de trava;
  • Elas também reproduzem os vieses dos textos que foram utilizados no seu treinamento; e
  • Ainda existem limitações na capacidade de criar conteúdo totalmente original através dessas IAs.

É possível detectar o conteúdo gerado por esse tipo de ferramenta e esse conteúdo pode ser desfavorecido dependendo da plataforma. Além disso, como os modelos são fechados, pode não ficar claro quais dados foram utilizados no seu treinamento. Isso pode envolver questões de direitos autorais.

Por fim, esses modelos podem gerar informações incorretas, já foi observado, por exemplo, a dificuldade de gerarem respostas corretas em áreas de exatas, como matemática e física. Tudo isso indica que embora essas ferramentas sejam muito úteis, elas ainda não dispensam o crivo humano na análise das respostas geradas.

IA nas empresas

Nas empresas essas IAs podem ser utilizadas como ferramentas. Além dos temas já citados, podemos utilizá-las para:

  • Automatização de tarefas repetitivas;
  • Onboarding de pessoas iniciantes; e
  • Análise de dados.

No episódio 335 do Hipster.Tech, você pode conhecer um pouco mais da experiência do Bradesco com IAs:

Dados, IAs e Assistentes no Bradesco – Hipsters Ponto Tech #335

Ouvir um pouco de:
Dados, IAs e Assistentes no Bradesco – Hipsters Ponto Tech #335 

E se você quiser ainda mais contexto, recomendamos o episódio Testes de Software e Inteligência Artificial, em que se discute o uso de testes e sua relação com a inteligência artificial:

Testes de Software e Inteligência Artificial – Hipsters #154

Ouvir um pouco de:
Testes de Software e Inteligência Artificial – Hipsters #154

Embora exista a preocupação do desemprego devido à ampla gama de soluções geradas por essas ferramentas, também estão surgindo novos cargos focados no seu uso.

Um exemplo são os Engenheiros de Prompt. Prompt são as instruções passadas para as ferramentas de IA e os Engenheiros de Prompt são pessoas especializadas em passar as instruções de forma adequada para gerar as melhores respostas pelas IAs.

ChatGPT e Engenharia de Prompt: Técnicas para o Prompt Perfeito

Criação da cultura certa para o uso da IA

Esse tópico é um desafio, mas o bom uso de uma ferramenta sempre vem a partir do conhecimento. Se as pessoas souberem bem sobre as vantagens e limitações dessas ferramentas, seu uso será aprimorado.

E falando de se educar e aprender mais sobre ferramentas para dados, recomendamos o episódio Educação em Dados e Machine Learning, do Hipster.Tech:

Educação em Dados e Machine Learning – Hipsters Ponto Tech #301

Ouvir um pouco de:
Educação em Dados e Machine Learning – Hipsters Ponto Tech #301

Além da busca por conhecimento, precisa haver a comunicação clara sobre como a ferramenta poderá ser utilizada na empresa. Ao criar uma cultura que incentiva o uso de IAs generativas, as empresas podem se beneficiar de sua eficiência e inovação, ajudando a manter sua posição competitiva no mercado.

Como aprender IA Generativa

A melhor forma de aprender sobre IAs Generativas é conhecendo mais a fundo as ferramentas do momento, como o Midjourney e o ChatGPT. Aqui na Alura você pode conhecer essas ferramentas no curso:

Além disso, o tópico envolve conhecimentos de machine learning, deep learning e processamento de linguagem natural, que você pode aprender nessas formações se quiser um dia criar as suas próprias IAs do zero:

Allan Segovia Spadini
Allan Segovia Spadini

Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

Veja outros artigos sobre Inteligência Artificial