#59 AI Revolucionando a Indústria da Música, Novidades no DALL-E 3 e no ChatGPT e Sam Altman Criando um Hardware para AI
Mais uma semana importante de desenvolvimentos e avanços no universo das Inteligências Artificiais Generativas!
A novidades não param de chegar e aqui você sempre fica por dentro de tudo que é relevante. Os temas de hoje são:
Modelos de AI revolucionando a indústria da música; Novidades no DALL-E 3 e no ChatGPT; Sam Altman e Jony Ive criando um hardware para AI; Pesquise na internet de uma forma personalizada e inovadora com AI; Acesse todos os modelos de AI em um só lugar.
News
Modelos de AI revolucionando a indústria da música
As Inteligências Artificiais Generativas estão prestes a transformar a indústria musical!
No ano passado, uma série de modelos de AI capazes de gerar músicas foram lançados no mercado.
Mas, apesar de várias músicas modificadas por AI - como Frank Sinatra cantando Gansgta’s Paradise, Johnny Cash cantando Barbie Girl, Shrek cantando Seu Jorge e até Drake e The Weekend cantando uma música inédita - terem viralizado na internet, as AIs ainda estavam longe de afetarem a indústria da música.
Esses covers virais apenas alteravam a voz original para soar como a de outra pessoa ou personagem e os modelos de AI existentes apenas geravam curtas trilhas instrumentais de qualidade mediana.
Assim, ainda havia um longo caminho até que tivéssemos modelos que conseguissem gerar músicas inteiras e completas, com duração adequada e alta qualidade.
Isso começou a mudar recentemente com a Suno AI - falamos tudo sobre ela nessa newsletter.
O modelo da empresa é capaz de gerar músicas, com instrumental e vocal, de até dois minutos de duração. Incrivelmente, a qualidade e a criatividade das músicas é bem próxima das criadas por humanos, mas ainda é possível notar uma “robotização” nas vozes dos cantores e elas ainda são um pouco genéricas.
E a mudança continuou na semana passada: a Stability AI - empresa por trás do modelo de geração de imagens Stable Diffusion - lançou a nova versão de sua AI musical.
O modelo chama-se Stable Audio 2.0 e é a segunda versão da tecnologia.
Ele vem para solucionar os problemas de baixa qualidade nas músicas criadas por AI e curta duração. Com ele, é possível criar faixas completas de alta qualidade, com estrutura musical coerente e de até três minutos de duração, a partir de prompts de texto.
Você pode ouvir alguns exemplos por aqui.
O Stable Audio 2.0, além gerar por meio de comandos de texto, também cria a partir de outros áudios. Então é possível, por exemplo, enviar um áudio murmurando uma música que você inventou e pedir para criar um solo de guitarra a partir dele ou enviar uma linha de baixo e pedir para gerar os sons de bateria para a mesma música.
Infelizmente, o modelo não gera vocais.
As aplicações para ele são bem vastas, sendo útil para não-músicos que querem criar algo do zero com AI e para artistas que querem adicionar mais uma ferramenta em seu fluxo de trabalho.
O novo modelo pode ser acessado de forma gratuita e limitada por aqui, mas a Stability AI também oferece planos pagos que dão maiores limites de uso.
Mas calma… Isso não é tudo.
Há um novo modelo de música prestes a ser lançado que, segundo rumores, irá fazer com que esqueçamos do Suno e Stable Audio.
Algumas das principais vozes no universo das AIs têm testado esse novo modelo de maneira privada e publicando suas impressões nas redes sociais.
Alguns acreditam que ele pode ter o mesmo impacto na geração de músicas com AI que o Sora teve na geração de vídeos.
Por enquanto, os criadores do modelo não permitiram a divulgação de nenhuma música criada por ele.
Porém, nesse final de semana, três trechos de algumas destas músicas vazaram. Dá só uma olhada, neste, neste e neste exemplo.
É realmente absurdo. As músicas tem muito mais profundidade e nuance do que os modelos existentes, vocais excelentes, além de ser praticamente impossível identificar que são geradas por Inteligência Artificial.
Tudo indica que a empresa por trás do modelo é a Udio Music, fundada por ex-funcionários do Google DeepMind, e é bem provável que eles lancem a AI ainda nessa semana. Então pode ser que na próxima newsletter já traremos todos os detalhes sobre ela!
Finalmente, aproveitando o gancho musical, o Spotify, que já lançou um DJ de AI e tradução de podcasts com AI no ano passado, agora está disponibilizando para usuários do Reino Unido e Austrália a funcionalidade de criação de playlists com AI!
Em breve essa novidade deve estar disponível por aqui.
O fato é que as AIs estão chegando para todas os mercados e não vai demorar muito para impactar fortemente a criação, distribuição e consumo de músicas ao redor do mundo.
Novidades no DALL-E 3 e no ChatGPT
A OpenAI está implantando uma série de novidades no ChatGPT e em sua ferramenta de geração de imagens, DALL-E 3.
Essas novidades visam melhorar a experiência do usuário, aumentando o controle sobre o que é gerado pelas AIs e a qualidade dessas gerações.
Algumas delas já foram completamente implementadas e outras ainda estão sendo testadas e disponibilizadas gradualmente pela empresa. São 6 novos recursos, sendo 2 deles do DALL-E 3 e 4 do ChatGPT:
DALL-E 3
O DALL-E 3 é o modelo de geração de imagens mais avançado da OpenAI e está entre os melhores do mundo em termos de qualidade. Ele é conectado ao ChatGPT e pode ser utilizado por usuários dos planos pagos - Plus, Teams e Enterprise.
E agora, na hora de gerar imagens usando o DALL-E pelo ChatGPT, é possível enriquecer o comando adicionando estilos pré-definidos (como cyberpunk, pixel art, preto e branco, retrô, etc.) e selecionando o formato da imagem que será gerada (vertical, paisagem ou quadrada);
Além disso, os usuários também podem editar a imagem gerada pela AI. Basta clicar para ampliar o que foi gerado, marcar a região que deseja editar e escrever um comando especificando o que alterar. Uma nova imagem, com a edição que você pediu, será gerada em poucos segundos.
É uma função bem útil, mas, por enquanto, a qualidade do que é gerado nas edições ainda não está tão boa quanto poderia ser - destoando, muitas vezes, do resto da imagem que permaneceu intacto.
ChatGPT
Sobre as novidades mais gerais envolvendo o ChatGPT, temos as seguintes:
Não é preciso mais fazer login para acessar o ChatGPT em sua versão gratuita. Isso significa que qualquer um pode usar a ferramenta da OpenAI sem ter que fornecer dados de e-mail ou celular, nem fazer nenhum tipo de cadastro.
Ao mesmo tempo que isso torna o acesso de usuários casuais mais fácil e rápido, não há grande vantagem em não entrar com uma conta caso você use o ChatGPT com frequência. Isso, pois é muito útil ter acesso ao histórico de conversas e outros recursos de personalização;
Para os usuários que usam alguma das versões pagas, agora a OpenAI está deixando mais claro na respostas da ChatGPT quando ele faz alguma busca na internet. Os links acessados por ele estão ficando mais evidentes e fáceis de localizar visualmente.
Agora falando de algumas novidades que ainda estão sendo implantadas e testadas gradualmente:
ChatGPT conectado ao Google Drive e Microsoft 365 . Será possível conectar sua conta desses apps ao ChatGPT para que ele acesse documentos e utilize informações contidas neles para gerar suas repostas. Isso é uma novidade muito boa!
Seleção de modelos de forma dinâmica no ChatGPT Plus. Os modelos ChatGPT-3.5 e GPT-4 serão selecionados de forma dinâmica para responder as perguntas do usuário, dependendo da complexidade da tarefa.
Essas foram algumas pequenas atualizações realizadas no ChatGPT e DALL-E 3. No geral, elas ampliam as capacidades das ferramentas e melhoram a experiência.
Mas ainda estamos no aguardo do lançamento do GPT-4.5/GPT-5, que trará novidades muito mais significativas e importantes.
Sam Altman e Jony Ive criando um hardware para AI
Em outubro do ano passado, mencionei em uma newsletter que Sam Altman, CEO da OpenAI, estava discutindo sobre o desenvolvimento de um hardware de AI com o ex-chefe de design da Apple, Jony Ive.
Alguns meses se passaram e o The Information - que reportou a notícia na primeira vez - trouxe atualizações sobre esse projeto, que está avançando.
O que exatamente é o projeto?
Sam Altman e Jony Ive estão criando um dispositivo físico especializado em Inteligência Artificial. Ainda não se sabe ao certo como será esse dispositivo e nem quais serão as suas funcionalidades.
O que se sabe é que ele não terá nada a ver com um smartphone.
Pode ser que ele se pareça com algum hardware de AI existente, como o rabbit r1, o AI Pin e o Rewind Pendant, ou seja algo totalmente novo e inovador.
Para transformar o interessante projeto em algo concreto, Sam e Jony estão buscando pelo menos 1 bilhão de dólares em investimento.
E eles já estão em conversas com vários investidores. Apesar da lista de interessados não ter sido divulgada, foi reportado que a Thrive Capital - que já investiu na OpenAI - a Emerson Collective - uma empresa de capital de risco fundada por Laurene Powell Jobs (viúva de Steve Jobs) - estão entre eles.
E é bem improvável que eles tenham qualquer problema em arrecadar esse capital, tendo em vista o nome de ambos e o interesse do mercado em produtos que envolvam AI.
Aparentemente, o projeto está em fase inicial, focando em contratar novos talentos e em ideação.
No entanto, caso saia do papel, esse projeto tem de tudo para revolucionar o mercado de eletrônicos e o modo que lidamos com nossos dispositivos pessoais.
Afinal, com as AIs evoluindo para se tornarem verdadeiros agentes que realizam ações por nós, precisaremos de um novo tipo de hardware para lidar com elas. E aquele que melhor construir esse novo hardware terá uma grande vantagem competitiva.
E essa dupla parece ter tudo o que é necessário para criar algo incrível.
Jony Ive é um dos maiores especialistas em design e dispositivos eletrônicos pessoais do mundo. Tendo trabalhando junto com Steve Jobs durante sua gestão na Apple, ele desempenhou um papel vital nos designs do iMac, iPod, iPhone, iPad, MacBook e na interface de usuário do iOS.
Sam Altman é CEO da empresa de maior relevância na corrida das AIs Generativas e tem vasta experiência investindo em start-ups.
Além disso, os dois possuem contatos e recursos quase ilimitados à disposição.
Então estou ansioso para ver o que sairá dessa parceria.
Ainda não se sabe se a OpenAI investirá ou terá qualquer participação nesse projeto, mas essa é mais uma coisa para ficar de olho.
Traremos atualizações assim que tivermos.
Indicações
Morphic
Busque informações na internet de uma maneira mais eficiente e personalizada utilizando AI.
GlobalGPT
Acesse os principais modelos de AI do mundo, como Claude 3, Gemini e GPT-4, de forma barata e ilimitada.
Dica de Uso
Use o ChatGPT para criar mapas mentais completos e interativos de forma automática e gratuita!
Para isso, tudo que você vai precisar é do prompt que eu vou passar abaixo e de uma ferramenta gratuita chamada Mark Map, que é muito fácil de usar.
No ChatGPT, de preferência usando o GPT-4, escreva o seguinte comando:
“Crie um mapa mental do [tema que você quer explorar]. Liste o tópico como a ideia central, ramos e sub ramos. Não gere imagens.
Crie em formato markdown como no exemplo abaixo:
[insira o exemplo aqui]”
Use o texto que coloquei nesse arquivo como exemplo. Coloquei em um arquivo separado para não tornar newsletter muito longa.
O ChatGPT vai gerar um mapa mental em texto. Para torná-lo uma figura visual e interativa, você vai copiar o texto que ele gerou e entrar aqui.
Entrando no site, basta apagar o que está escrito no quadro do lado esquerdo e colar o texto.
E pronto! O seu mapa mental estará construído - baixe-o como como HTML interativo.
Incrível né? Esse mapa mental profissional e completo pode ser utilizado para estudar ou fazer apresentações.
Pensamento do Dia
"AI is primarily a productivity revolution. It starts with a human with a tool, transitions into a human with a machine assistant, and eventually moves into a human with a machine network."
- Konstantine Buhler
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até semana que vem!