As ferramentas de IA chegaram para o editor de áudio de código aberto ‘Audacity’

O Audacity agora está equipado com novas ferramentas de IA.

Nos últimos anos, temos visto desenvolvimentos notáveis em IA, incluindo funcionalidades alimentadas por IA sendo adicionadas a várias ferramentas populares. E mais IA é algo que já mencionamos em nossas previsões para Linux e código aberto para 2024 .

Desta vez é o Audacity, um dos melhores editores de áudio para Linux , que deu as boas-vindas à IA. Os usuários agora podem aprimorar sua experiência de edição de áudio aproveitando o poder da IA.

Vamos dar uma olhada no que esses recursos fascinantes trazem para a mesa.

Intel fabrica ferramentas de IA

O pessoal da Intel introduziu novos recursos para trabalhar com áudio falado e música, todos alimentados por IA.

Esses recursos fazem parte do conjunto de plugins OpenVINO . Para quem não sabe, o OpenVINO da Intel é uma estrutura de IA que ajuda a acelerar modelos de aprendizagem profunda.

Um aspecto interessante, mas importante, a ser observado é que todos esses recursos são executados localmente no seu PC! Mais especificamente, a CPU ou GPU do PC será utilizada para a parte de processamento.

Edição de podcast

Sempre quis transcrever ou até mesmo traduzir o áudio rapidamente?

A transcrição , que é desenvolvida pelo Whisper da OpenAI, permite que os usuários façam exatamente isso.

Ele produz uma nova faixa de rótulo que inclui texto transcrito/traduzido com base em uma determinada amostra de áudio.

A tradução sempre produzirá a saída em inglês, enquanto a transcrição produzirá a saída no mesmo idioma do áudio de origem.

Por enquanto, apenas o modelo Whisper Base é compatível por padrão. O suporte para mais modelos pode chegar mais tarde.

Semelhante ao efeito de remoção de ruído existente, há supressão de ruído que ajuda a remover ruídos de fundo indesejados de uma amostra de áudio falada.

Como é alimentado por IA, você pode esperar que esse recurso tenha um desempenho melhor do que o efeito de remoção de ruído.

Por enquanto, apenas o modelo Denseunet é suportado por padrão. O suporte para mais modelos pode chegar mais tarde.

Geração Musical

Sim, você leu certo: agora você pode gerar novas músicas dentro da sua máquina!

Music Generation permite aos usuários gerar um trecho de música. Isso é possível graças a um projeto de código aberto chamado Riffusion , que é um modelo de geração de música baseado em Stable Diffusion (um modelo popular de código aberto usado para gerar imagens).

Você gera música fornecendo um prompt de texto e ajustando alguns outros parâmetros, como a duração.

No prompt de texto, você especifica o gênero de música a ser gerado e a IA fará o possível para manter o gênero ao gerar a música.

Existe uma opção para alternar entre o modo Simples padrão e um modo Avançado opcional para obter mais controle, como especificar um prompt de início e um prompt de término.

Além disso, você pode até remixar músicas com Music Style Remix selecionando uma parte de uma faixa musical!

Separação Musical

E se você quisesse criar sua própria faixa instrumental de sua música favorita? Talvez até tenha uma divertida sessão de karaokê com seus amigos?

A Separação de Música permite dividir uma música em uma versão vocal ou instrumental. Existem dois modos de separação oferecidos:

2-Stem produz duas novas faixas para vocais e instrumentais.

4-Stem produz quatro novas faixas para vocal, bateria, baixo e a última de outros instrumentos combinados.

Como usar as ferramentas de IA?

Se você é um usuário Linux, Espere um pouco mais.

Embora a versão do plugin para Windows esteja disponível para download, sua contraparte para Linux não está disponível... ainda.

Se ainda quiser experimentar, você mesmo precisará compilar o projeto. Você pode consultar as instruções oficiais para isso.

As ferramentas de IA chegaram para o editor de áudio de código aberto ‘Audacity’

0 Comentários

Acredite ou não, você pode estar usando um comando Linux obsoleto.

Entre em Contato

Formulário de contato