#33 Gemini Próximo de Ser Lançado, Experimento com AIs no BCG e Stable Audio - o Novo Modelo de Geração de Música com AI
Seja bem-vindo(a) a mais uma newsletter semanal do Revolução AI sobre o universo das Inteligências Artificiais Generativas!
A de hoje está muito interessante! Falamos sobre um grande lançamento que está próximo de acontecer, uma pesquisa importante e um novo modelo de AI no mercado. Os temas de hoje são:
Gemini próximo de ser lançado; Experimento com AIs no Boston Consulting Group; Novo modelo de geração de música da Stability AI; Duble vídeos com essa AI; Aprenda sobre qualquer coisa com essa AI.
News
Gemini próximo de ser lançado
A faísca para o surgimento dos grandes modelos de linguagem (LLM) que temos hoje ocorreu dentro do Google em 2017 - um software conhecido como “transformer”, que foi a base da tecnologia por trás das AIs Generativas, foi desenvolvido por um time de pesquisa da empresa.
Mas o Google não aproveitou essa vantagem. Membros do projeto pioneiro deixaram a empresa para fazer parte de projetos, como o da OpenAI, a empresa demorou para investir no desenvolvimento de modelos de AI Generativa de ponta e a sua cultura de grande empresa líder de mercado não permitiu que houvesse inovação e criação suficiente.
O resultado disso foi que, com o lançamento do ChatGPT, o Google viu o seu bilionário negócio de busca ameaçado. Desde então, a empresa decretou código vermelho, intensificou seus esforços no desenvolvimento de modelos de AI (lançando o PaLM 2) e criando o seu próprio chatbot, o Bard.
Mas o PaLM 2 e o Bard estão muito distantes, em termos de performance, do GPT-4 e do ChatGPT, respectivamente.
Por conta disso, nos últimos meses, o Google esteve investido no desenvolvimento do Gemini, um modelo de Inteligência Artificial que é a grande aposta da empresa para superar o GPT-4.
Segundo o jornal The Information, o modelo já está nas fases finais do seu desenvolvimento, tendo algumas de suas versões testadas por um pequeno e seleto grupo de empresas.
O Gemini será multimodal, o que significa que ele conseguirá trabalhar com outras formas de conteúdo além de texto, como imagens. Além disso, foi informado que ele terá capacidades que ainda não foram vistas em nenhum modelo.
O time responsável pelo desenvolvimento do Gemini é o Google Deepmind. Esse time é resultado da união do Google Brain (laboratório de pesquisa do Google) com o DeepMind (laboratório de AI adquirido pelo Google em 2014).
Assim, muito em breve, dentro dos próximos meses, já podemos esperar um novo modelo no mercado. Se ele será tão bom quanto o prometido, só saberemos no futuro…
A grande questão é que o Google não tem margem para errar, eles já decepcionaram em lançamentos passados e precisam entregar algo.
Então vamos acompanhar de perto os desdobramentos dessa história.
Experimento com AIs no Boston Consulting Group
Buscando investigar como o uso das AIs em tarefas impacta o desempenho de profissionais, eles conduziram um experimento em parceria com o BCG - Boston Consulting Group (uma das maiores firmas de consultoria do mundo).
Os objetos de pesquisa foram 758 consultores da BCG. Os pesquisadores os dividiram em três grupos aleatórios para o experimento: os sem acesso a qualquer AI Generativa (grupo controle), os com acesso ao GPT-4 e os com acesso ao GPT-4 e uma pequena aula sobre prompt engineering.
Após isso, os três grupos performaram 18 tarefas realísticas de consultoria em um projeto fictício para uma empresa de calçados. Dentre essas tarefas, haviam:
tarefas criativas (“Propor pelo menos 10 ideias para um novo calçado direcionado a um mercado ou esporte mal atendido.”);
tarefas analíticas (“Segmentar o mercado da indústria de calçados com base nos usuários.”);
tarefas de redação e marketing (“Elaborar um textos de marketing para seu produto.”);
tarefas de persuasão (“Escreva um memorando inspirador para os funcionários detalhando por que seu produto superaria os concorrentes.”).
Os resultados foram bastante impressionantes: os consultores que usaram AI concluíram em média 12,2% mais tarefas, concluíram tarefas 25,1% mais rapidamente e produziram resultados de qualidade 40% mais altos do que aqueles que não utilizaram.
Ganhos de produtividade e qualidade expressivos!
Outro achado muito importante do experimento foi que o uso das AIs melhorou mais o desempenho dos piores funcionários do que o desempenho dos melhores. Ou seja, a tecnologia agiu como um nivelador de habilidades, aproximando o desempenho de funcionários bons e ruins.
Isso significa que, com as AIs, todos performarão em um nível parecido - mais alto que antes- e será mais difícil se destacar dentro de empresas.
Esse estudo só confirma o que sempre falamos aqui nas newsletters e nos vídeos: as AIs tem grande potencial de melhorar o desempenho de pessoas e empresas e aqueles que não as utilizarem ficarão para trás.
Então se quiser saber como aplicá-las em seu trabalho ou negócio é só aplicar para a nossa consultoria por aqui e acompanhar nosso conteúdo!
Novo modelo de geração de música da Stability AI
A Stability AI, empresa por trás do Stable Diffusion (modelo de geração de imagem) e do StableLM (modelo de linguagem), acabou de lançar um novo modelo de geração de áudio com Inteligência Artificial.
O nome do modelo é Stable Audio e ele é capaz de gerar músicas, sons de instrumentos e efeitos sonoros a partir de simples comandos de texto. E os resultados são de alta qualidade.
Ele foi treinado com mais de 800.000 arquivos de áudio contendo música, efeitos sonoros e sons de instrumentos, um conjunto de dados que soma mais de 19.500 horas de áudio.
O modelo final não é open source e não se encontra disponível para ser baixado gratuitamente, mas pode ser acessado no site criado para ele pela Stability.
Mas modelos de geração de áudio com AI não são uma novidade… No mercado já temos modelos como o como o MusicLM, do Google, o MusicGen, da Meta, e o Riffusion, da própria Stability.
O desempenho do Stable Audio aparenta se aproximar do MusicLM e do MusicGen. Porém, ele é mais acessível e utilizável que ambos, já que o MusicLM está em beta e só permite geração de músicas curtas e o MusicGen precisa ser baixado para ser acessado.
Um aspecto interessante do modelo é que ele consegue áudios com qualquer tamanho, enquanto os demais modelos geram apenas em “pedaços” - de 30 em 30 segundos, por exemplo.
Mas desvantagem é que o Stable Audio só é gratuito até certo ponto. Para ter acesso a mais gerações de músicas e com maiores durações, é necessário assinar o plano pago. Dá uma olhada na precificação:
Particularmente, eu gostei bastante do resultado quando testei. Mas você pode ver algumas amostras por aqui e/ou gerar seus próprios áudio e musicas por aqui.
No geral, o Stable Audio tem uma qualidade bem alta e uma usabilidade excelente. Então passa a ser uma alternativa relevante na categoria.
Indicações
HeyGen
Acesse ao novo recurso de dublagem com AI e produza vídeos de em qualquer língua.
Learn.xyz
Aprenda sobre qualquer coisa com cards e quizzes interativos gerados por essa AI.
Dica de Uso
Uma excelente maneira de criar imagens mais criativas e únicas nas AIs como Midjourney, Ideogram e Leonardo é escrevendo em seu prompt o nome de dois ou mais pintores ou fotógrafos famosos com estilos que você gosta!
Por exemplo, imagine misturar o estilo do van Gogh com o do Monet… Provavelmente teria um resultado bem interessante!
Para isso basta incluir o estilo no seu comando:
Painting in the style of van Gogh and Claude Monet of a landscape with a house, pine trees in the background, at morning
E esse é só um exemplo! Se você conhece de arte, pode tentar com outros artistas, mais ou menos conhecidos, ou mesmo com fotógrafos. Quanto mais criativo você for, mais diferentes e particulares serão os seus resultados!
Pensamento do Dia
“Feito é melhor que perfeito”.
Considere isso quando pensar em aplicar as AIs na sua vida e no seu negócio. Não é sobre acertar de primeira, mas começar na frente e aprender ao longo do processo.
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Tenha uma ótima semana e até segunda