As ferramentas de IA chegaram para o editor de áudio de código aberto ‘Audacity’

O Audacity agora está equipado com novas ferramentas de IA.



Nos últimos anos, temos visto desenvolvimentos notáveis ​​em IA, incluindo funcionalidades alimentadas por IA sendo adicionadas a várias ferramentas populares. E mais IA é algo que já mencionamos em nossas previsões para Linux e código aberto para 2024 .


Desta vez é o Audacity, um dos melhores editores de áudio para Linux , que deu as boas-vindas à IA. Os usuários agora podem aprimorar sua experiência de edição de áudio aproveitando o poder da IA.


Vamos dar uma olhada no que esses recursos fascinantes trazem para a mesa.


Intel fabrica ferramentas de IA 

O pessoal da Intel introduziu novos recursos para trabalhar com áudio falado e música, todos alimentados por IA.


Esses recursos fazem parte do conjunto de plugins OpenVINO . Para quem não sabe, o OpenVINO da Intel é uma estrutura de IA que ajuda a acelerar modelos de aprendizagem profunda.


Um aspecto interessante, mas importante, a ser observado é que todos esses recursos são executados localmente no seu PC! Mais especificamente, a CPU ou GPU do PC será utilizada para a parte de processamento.



Edição de podcast

Sempre quis transcrever ou até mesmo traduzir o áudio rapidamente?

A transcrição , que é desenvolvida pelo Whisper da OpenAI, permite que os usuários façam exatamente isso. 


Ele produz uma nova faixa de rótulo que inclui texto transcrito/traduzido com base em uma determinada amostra de áudio.

A tradução sempre produzirá a saída em inglês, enquanto a transcrição produzirá a saída no mesmo idioma do áudio de origem.

Por enquanto, apenas o modelo Whisper Base é compatível por padrão. O suporte para mais modelos pode chegar mais tarde.

Semelhante ao efeito de remoção de ruído existente, há supressão de ruído que ajuda a remover ruídos de fundo indesejados de uma amostra de áudio falada.


Como é alimentado por IA, você pode esperar que esse recurso tenha um desempenho melhor do que o efeito de remoção de ruído.

Por enquanto, apenas o modelo Denseunet é suportado por padrão. O suporte para mais modelos pode chegar mais tarde.

Geração Musical

Sim, você leu certo: agora você pode gerar novas músicas dentro da sua máquina!


Music Generation permite aos usuários gerar um trecho de música. Isso é possível graças a um projeto de código aberto chamado Riffusion , que é um modelo de geração de música baseado em Stable Diffusion (um modelo popular de código aberto usado para gerar imagens).




Você gera música fornecendo um prompt de texto e ajustando alguns outros parâmetros, como a duração.

No prompt de texto, você especifica o gênero de música a ser gerado e a IA fará o possível para manter o gênero ao gerar a música.

Existe uma opção para alternar entre o modo Simples padrão e um modo Avançado opcional para obter mais controle, como especificar um prompt de início e um prompt de término.

Além disso, você pode até remixar músicas com Music Style Remix selecionando uma parte de uma faixa musical!


Separação Musical

E se você quisesse criar sua própria faixa instrumental de sua música favorita? Talvez até tenha uma divertida sessão de karaokê com seus amigos?


A Separação de Música permite dividir uma música em uma versão vocal ou instrumental. Existem dois modos de separação oferecidos:



2-Stem produz duas novas faixas para vocais e instrumentais.

4-Stem produz quatro novas faixas para vocal, bateria, baixo e a última de outros instrumentos combinados.

Como usar as ferramentas de IA? 

Se você é um usuário Linux, Espere um pouco mais.


Embora a versão do plugin para Windows esteja disponível para download, sua contraparte para Linux não está disponível... ainda.


Se ainda quiser experimentar, você mesmo precisará compilar o projeto. Você pode consultar as instruções oficiais para isso.



0 Comentários

A atualização mais recente do cliente Steam melhora as gravações de jogos e o jogo remoto no Linux

 A Valve lançou hoje uma nova atualização estável do Steam Client que traz algumas melhorias para jogadores de Linux, além de vários outros aprimoramentos e correções de bugs. Para jogadores de Linux, a nova atualização do Steam Client adiciona suporte para instalação automática de dados de síntese de fala do Proton Voice Files quando necessário, melhora o suporte para gravações de jogos que contêm uma barra verde no lado direito da imagem ao usar codificação HEVC em sistemas AMD se a largura da janela do jogo não for um múltiplo de 64 e melhora os fluxos de vídeo de gravação de jogos e reprodução remota que mostram quadros verdes ao capturar jogos Vulkan em GPUs Intel. Para todas as plataformas suportadas, a nova atualização do Steam Client melhora a detecção de hotplug do controle para alguns dispositivos de terceiros, reduz o uso de memória causado steamwebhelperao iniciar jogos ou alternar para/do Modo Big Picture, corrige pré-carregamentos de jogos que mostravam atividade de d...