Nos últimos anos, a inteligência artificial generativa (IA) tornou-se um tópico de destaque no mundo da tecnologia. Ele trouxe avanços notáveis, como o Bard do Google, o Copilot da Microsoft e o popular ChatGPT da OpenAI, um chatbot que pode criar texto semelhante a conteúdo escrito por humanos. Mas o que é exatamente a IA generativa e como ela se diferencia dos modelos tradicionais de IA?
Especialistas em IA do Instituto de Tecnologia de Massachusetts (MIT) ajudaram a analisar os meandros dessa tecnologia cada vez mais popular e onipresente. Os especialistas em IA responderam a perguntas como quão poderosos sistemas de IA generativos como o ChatGPT funcionam, por que esses sistemas parecem estar entrando em praticamente todas as aplicações imagináveis e o que os torna diferentes de outros tipos de inteligência artificial.
Esses especialistas são Phillip Isola, professor associado de engenharia elétrica e membro do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL). Devavrat Shah, Andrew e Erna Viterbi do MIT, professor e membro do IDSS e do Laboratório de Sistemas de Informação e Decisão, e Tommi Jaakkola, professor Thomas Siebel do MIT e membro do CSAIL e do Instituto de Dados, Sistemas e Sociedade (IDSS).
Como a IA generativa difere da IA tradicional
Na sua explicação, a IA tradicional focou-se principalmente em modelos de aprendizagem automática capazes de fazer previsões com base em dados. Por exemplo, estes modelos poderiam prever condições médicas a partir de raios X ou avaliar a solvabilidade dos mutuários utilizando dados históricos.
A IA generativa, por outro lado, foi projetada para criar novos dados em vez de prever um resultado a partir dos dados existentes. Ele aprende a gerar conteúdo semelhante aos dados nos quais foi treinado, marcando uma mudança significativa nas capacidades de IA.
Origem da IA Generativa
Os especialistas traçam as origens da IA generativa até modelos mais simples, como cadeias de Markov, que eram limitadas em sua capacidade de gerar texto plausível. No entanto, o campo evoluiu com conjuntos de dados maiores e arquiteturas de aprendizagem profunda mais complexas. Os modelos básicos por trás de sistemas como o ChatGPT são semelhantes aos modelos de Markov, mas são muito maiores, com bilhões de parâmetros e treinamento em extensas fontes de dados da Internet.
Na previsão de texto, um modelo de Markov gera a próxima palavra em uma frase observando a palavra anterior ou algumas palavras anteriores. Mas como estes modelos simples só conseguem olhar para trás até certo ponto, não são bons a gerar texto plausível, diz Tommi Jaakkola.
“Já estávamos gerando coisas muito antes da última década, mas a principal distinção aqui está em termos da complexidade dos objetos que podemos gerar e da escala em que podemos treinar esses modelos”, explica ele.
Explorando as diferenças
Os modelos fundamentais que sustentam o ChatGPT e sistemas relacionados funcionam como um modelo de Markov. Porém, com bilhões de parâmetros, o ChatGPT é muito maior e mais sofisticado que o outro. E foi treinado com base numa enorme quantidade de dados – neste caso, grande parte do texto disponível publicamente na Internet.
“Quando se trata do maquinário real subjacente à IA generativa e a outros tipos de IA, as distinções podem ser um pouco confusas. Muitas vezes, os mesmos algoritmos podem ser usados para ambos”, diz Phillip Isola.
Mas embora os modelos generativos possam alcançar resultados incríveis, eles não são a melhor escolha para todos os tipos de dados. Para tarefas que envolvem fazer previsões sobre dados estruturados, como os dados tabulares de uma planilha, os modelos generativos de IA tendem a ser superados pelos métodos tradicionais de aprendizado de máquina, explica Devavrat Shah.
“O maior valor que eles têm, na minha opinião, é se tornarem uma interface incrível para máquinas que sejam amigáveis ao ser humano. Anteriormente, os humanos tinham que falar com as máquinas na linguagem das máquinas para fazer as coisas acontecerem. Agora, esta interface descobriu como falar tanto com humanos quanto com máquinas”, diz Shah.
A direção futura da IA generativa
Uma direção futura promissora que Isola vê para a IA generativa é seu uso para fabricação. Ele acredita que a IA generativa irá alterar a economia numa vasta gama de campos no futuro. Além disso, ele prevê o uso de sistemas generativos de IA no futuro para criar entidades de IA que sejam mais amplamente inteligentes.
“Existem diferenças na forma como estes modelos funcionam e como pensamos que o cérebro humano funciona, mas penso que também existem semelhanças. Temos a capacidade de pensar e sonhar mentalmente, de apresentar ideias ou planos interessantes, e acho que a IA generativa é uma das ferramentas que capacitará os agentes para fazer isso também”, diz Isola.
A opinião do repórter
Embora a IA generativa seja muito promissora, ela também apresenta desafios. Estes modelos podem herdar preconceitos dos dados de formação, amplificar potencialmente o discurso de ódio e criar conteúdos que se assemelham ao trabalho de indivíduos específicos, levando a questões de direitos de autor. O deslocamento de trabalhadores é outra preocupação à medida que os chatbots de IA substituem as funções humanas.
Apesar destes desafios, a IA generativa tem o potencial de capacitar artistas, mudar vários campos e até mesmo ser usada para fabricar e criar agentes de IA mais inteligentes em geral. A IA generativa representa uma mudança de paradigma na inteligência artificial, preenchendo a lacuna entre as máquinas e a criatividade humana, e as suas aplicações futuras estão repletas de possibilidades. Mas devem existir regulamentações adequadas para atingir esses potenciais.