Notícias de dispositivos móveis, gadgets, aplicativos Android

ImageBind: IA da Meta que se aproxima do cérebro humano

Meta, empresa fundada por Mark Zuckerberg, apresentou seu mais recente modelo de inteligência artificial (IA) chamado ImageBind. Esta IA inovadora foi concebida para aprender da mesma forma que os humanos, utilizando uma abordagem multissensorial que combina imagens, texto, vídeo e áudio, bem como dados de profundidade, térmicos e inerciais.

O que torna o ImageBind √ļnico em compara√ß√£o com outras IAs √© a sua capacidade de vincular seis tipos diferentes de dados em um √≠ndice multidimensional, o que significa que pode aprender com v√°rias fontes de entrada. Por exemplo, os usu√°rios poder√£o usar qualquer um desses seis tipos de dados como m√©todos de entrada ou fazer refer√™ncia cruzada a eles.

ImageBind: a IA revolucionária da Meta inspirada no cérebro humano

O objetivo do ImageBind √© prever conex√Ķes entre dados semelhante a como os humanos fazem isso quando imaginamos um ambiente. Esta ferramenta √© diferente de outras IA que geram imagens como Midjourney, Stable Diffusion e DALL-E 2. Este √ļltimo apenas combina palavras com imagens para gerar cenas visuais baseadas em uma descri√ß√£o de texto.

ImageBind √© mais avan√ßado, pois pode vincular diferentes tipos de dados, como texto, imagens/v√≠deos, √°udio, medi√ß√Ķes 3D (profundidade), dados de temperatura (t√©rmicos) e dados de movimento (de unidades de medi√ß√£o inerciais). Al√©m disso, faz sem precisar ser treinado antecipadamente em cada combina√ß√£o poss√≠vel.

ImagemBind est√° em seus est√°gios iniciaismas no futuro poder√° gerar ambientes complexos a partir de uma entrada t√£o simples como uma mensagem de texto, uma imagem ou uma grava√ß√£o de √°udio, ou mesmo uma combina√ß√£o dos tr√™s. √Č emocionante pensar nas possibilidades!

ImageBind aprende como um humano

Uma das coisas interessantes sobre o ImageBind √© que ele funciona de uma forma semelhante ao aprendizado humano. ¬ęQuando os humanos aprendem coisas sobre o mundo que nos rodeia, usamos os nossos sentidos natural e simultaneamente.¬ęexplica Meta. Na verdade, os humanos podem at√© imaginar experi√™ncias sensoriais ao visualizar uma imagem, como a foto de uma paisagem.

N√≥s recomendamos:  Google Play Store comemora seu d√©cimo anivers√°rio com um novo logotipo

Imagine que você está parado em uma rua movimentada da cidade. Seu cérebro (mesmo inconscientemente) absorve imagens, sons e outras experiências sensoriais para entender o que está acontecendo ao seu redor, como carros e pedestres passando, edifícios altos, o clima e muito mais. Os humanos e outros animais evoluíram para processar estes dados para nossa vantagem genética, como a sobrevivência e transmissão do nosso ADN.

Uma das principais limita√ß√Ķes das IAs √© que elas ainda n√£o conseguem compreender as informa√ß√Ķes sensoriais da mesma forma que os humanos. Mas parece que isso pode mudar com o ImageBind, que vincula diferentes tipos de dados a gerar cenas de uma forma mais avan√ßada do que outras ferramentas semelhantes.

N√£o h√° limites para ImageBind

Embora seja verdade que Midjourney pode criar uma imagem de ¬ęum gato siam√™s vestindo uma fantasia de bobo da corte enquanto se equilibra em uma bola de praia¬ę, ImageBind pode fazer algo ainda mais impressionante. Voc√™ pode criar v√≠deos dessa cena com sons e detalhes reais, como uma sala de estar suburbana detalhada, a temperatura da sala e a localiza√ß√£o precisa de objetos e pessoas na cena.

‚ÄúIsso cria oportunidades distintas para criar anima√ß√Ķes a partir de imagens est√°ticas combinando-os com sinais de √°udio‚ÄĚ, disseram hoje os pesquisadores da Meta em uma postagem de blog focada no desenvolvedor. ‚ÄúPor exemplo, um criador poderia acoplar uma imagem a um despertador e um galo cantando, e usar uma mensagem de √°udio cantando para segmentar o galo ou o som de um alarme para segmentar o rel√≥gio e animar ambos em uma sequ√™ncia de v√≠deo‚ÄĚ.

Voc√™ pode imaginar as possibilidades criativas que isso abre? Voc√™ pode criar anima√ß√Ķes incr√≠veis a partir de imagens est√°ticas! Metapesquisadores parecem sugerir que esta ferramenta poderia ser usada no futuro para criar filmes inteiros a partir de imagens est√°ticas.

N√≥s recomendamos:  Meta permite que voc√™ compre o cheque azul

Como o ImageBind evoluir√°?

No futuro, poderemos ver novos recursos e melhorias na ferramenta, o que permitiria a criação de experiências ainda mais imersivas e realistas. A coisa mais interessante sobre o ImageBind é que ele pode ajudar a melhorar a realidade virtual, a realidade mista e o metaverso.

Por exemplo, no futuro, você poderia crie cenas 3D incrivelmente detalhadas (com som, movimento e muito mais) em movimento. Nesse sentido, os desenvolvedores de jogos virtuais poderiam usar o ImageBind para reduzir o tempo e o esforço necessários no processo de design.

Os criadores de conte√ļdo poderiam at√© fa√ßa v√≠deos envolventes com paisagens sonoras e movimentos realistas, com base apenas na entrada de texto, imagem ou √°udio. Tamb√©m √© emocionante pensar em como o ImageBind poderia ajudar pessoas com defici√™ncia visual ou auditiva a perceber melhor o que est√° ao seu redor, gerando descri√ß√Ķes multim√≠dia em tempo real.

‚ÄúEm sistemas t√≠picos de IA, h√° uma incorpora√ß√£o espec√≠fica (ou seja, vetores de n√ļmeros que podem representar dados e suas rela√ß√Ķes no aprendizado de m√°quina) para cada modalidade respectiva‚ÄĚ, disse Meta. ‚ÄúImageBind mostra que √© poss√≠vel criar um espa√ßo de incorpora√ß√£o conjunta em m√ļltiplas modalidades, sem a necessidade de treinamento em dados com cada combina√ß√£o diferente de modalidades.‚ÄĚ

Meta busca expandir os limites da IA ‚Äč‚Äčal√©m dos sentidos humanos conhecidos

Meta acredita que a tecnologia acabar√° por se expandir al√©m dos seus atuais seis ‚Äúsentidos‚ÄĚ, por assim dizer. ‚ÄúEmbora exploremos seis modalidades em nossa pesquisa atual, acreditamos que o introdu√ß√£o de novas modalidades ‚ÄúEssa liga√ß√£o de tantos sentidos quanto poss√≠vel, como tato, fala, olfato e sinais de fMRI do c√©rebro, nos permitir√° criar modelos de IA mais ricos e centrados no ser humano.‚ÄĚ

N√≥s recomendamos:  Meta perde mais de seu passado com sistema de pagamento renomeado

Al√©m disso, Meta anunciou que ImageBind ser√° de c√≥digo aberto, o que significa que os interessados ‚Äč‚Äčpoder√£o acessar o reposit√≥rio no GitHub. Os desenvolvedores interessados ‚Äč‚Äčem explorar esta nova sandbox podem come√ßar mergulhando no c√≥digo-fonte aberto do Meta.

√Č incr√≠vel o que a tecnologia de intelig√™ncia artificial pode alcan√ßar hoje. O que voc√™ acha? Gostaria de experimentar o ImageBind e ver o que voc√™ pode criar com ele?

Fonte | Meta IA