Meta lança um modelo de IA que pode gerar melodias e peças musicais a partir de texto. AudioCraft é o nome da nova ferramenta que se destaca pela capacidade de abranger música, som, compressão e geração de conteúdo. Esta ferramenta inclui três modelos exclusivos: AudioGen, EnCodec e MusicGen que foram criados para fins de pesquisa e para ajudar os profissionais a avançar no campo de áudio e música gerados por IA.
Audiocraft, a nova IA da Meta que cria música a partir de texto, opera reconhecendo e replicando padrões de dados extraídos da web. Segundo a empresa, a família de modelos desta ferramenta pode produzir áudio de alta qualidade, consistente e mais longo, usando apenas interação de linguagem natural. O objetivo desta IA é permitir que os músicos criem novas composições sem ter que tocar uma única nota em um instrumento.
AudioCraft: a nova IA da Meta que faz música a partir de texto
O objetivo tem destaque em seu blog sua mais recente ferramenta de Inteligência Artificial. Isso funciona da mesma forma que plataformas capazes de gerar imagens. Basta inserir um incitar do texto e a ferramenta cuida do resto.
Segundo a empresa, AudioCraft facilita as tarefas como adicionar uma trilha sonora a um anúncio em vídeo em Instagram para pequenas empresas, economizando tempo e esforço na busca pela música certa.
Com AudioCraft, não seria mais necessário procurar por horas músicas diferentes antes de carregar um Reel em Instagram. Basta escrever uma descrição do tipo de música que você precisa e a Inteligência Artificial irá gerá-la.
As possibilidades de criação com esta IA parecem infinitas. Com ele você espera poder desfrutar da nostálgica música disco dos anos 80 até cativantes instrumentos de jazz e até efeitos e sons de animais, buzinas de carros ou passos.
AudioCraft e seus modelos de IA
Esta ferramenta É composto por três modelos, que foram projetados para músicos de som para fornecer inspiração. Além disso, eles foram projetados para ajudar as pessoas a debater ideias rapidamente e iterar suas composições de novas maneiras.
- MusicGen foi treinado em um grande conjunto de dados de cerca de 400.000 gravações musicais, incluindo 20.000 horas de música de propriedade da Meta e com licença específica. Este treinamento foi feito utilizando 10.000 faixas para gerar música a partir de prompts de texto.
- AudioGen foi treinado com efeitos sonoros públicos para gerar áudio com base em prompts de texto. O modelo pode produzir sons ambientais realistas, fornecendo uma descrição escrita de uma cena acústica.
- EnCodec é um modelo que permite gerar música a partir de Maior qualidade com menos artefatos.
Audiocraft sendo de Código aberto, dá a outros a oportunidade de experimentar abordagens inovadoras. No entanto, apesar das possibilidades interessantes que esta ferramenta oferece, alguns artistas e especialistas da indústria manifestaram a sua preocupação. Isto se deve à possibilidade de ocorrência de violações de direitos autorais, o que poderia causar problemas em termos de propriedade intelectual.
Espera-se que o AudioCraft da Meta concorra com o MusicLM do Google, uma ferramenta que também pode gerar música de alta fidelidade a partir de prompts de texto e zumbidos, que foi disponibilizada publicamente em maio.