#44 Melhor Modelo de Geração de Vídeos com AI, Influencer Criada por AI Faturando Milhares de Euros e Anime Qualquer Pessoa com AI
A newsletter do Revolução AI dessa semana está repleta de notícias que envolvem criação de conteúdo visual com Inteligência Artificial!
Nela trataremos de assuntos muito interessantes, curiosos e até um pouco polêmicos. Então, sem mais delongas, os temas de hoje são:
Melhor modelo de geração de vídeos com AI?; Modelo criada por AI faturando milhares de euros; Anime qualquer pessoa com essa nova tecnologia; Sam Altman confirma que o vazamento sobre Q*; Melhore a qualidade de imagens com AI; Crie seus próprios avatares de AI gratuitamente.
News
Melhor modelo de geração de vídeos com AI?
Há um novo desafiante à Runway pelo posto de melhor modelo de geração de vídeos com Inteligência Artificial do mercado.
Ele se chama Pika Labs e, apesar do peculiar nome, está movimentando a internet com o preview de seu novo modelo, o Pika 1.0.
Fundado há apenas seis meses o laboratório de AI já recebeu mais de 55 milhões de dólares em investimentos de grandes nomes, como:
Elad Gil, Adam D'Angelo (fundador e CEO da Quora), Zach (cofundador da Ramp), Andrej Karpathy, Clem Delangue (cofundador e CEO da Hugging Face e sócio da Factorial Capital), Craig Kallman (CEO da Atlantic Records), Alex Chung (cofundador da Giphy), Aravind Srinivas (CEO da Perplexity), Vipul Ved Prakash (CEO da Together), Mateusz Staniszewski (CEO da ElevenLabs) e Keith Peiris (CEO da Tome ).
Até então, a empresa estava desenvolvendo o seu primeiro modelo de geração de vídeos e mantinha um canal no Discord - no estilo Midjourney -, no qual os usuários podiam criar vídeos com AI usando o modelo beta. Esse Discord conta com mais de meio milhão de pessoas que experimentaram o modelo em sua fase de testes.
No entanto, na última semana, a empresa lançou um vídeo anunciando que o Pika 1.0 estava pronto e prestes a ser lançado.
Eu recomendo fortemente que você cheque o vídeo. Basta clicar aqui, ele é bem impressionante.
No vídeo a empresa cita o que o modelo será capaz de fazer.
Com o Pika 1.0, o usuário conseguirá gerar vídeos em vários estilos (Animação 3D, anime, desenho animado, cinematográfico, etc.), a partir de simples comandos de texto ou usando uma imagem ou vídeo como referência. Text-to-video, image-to-video e video-to-video!
Além de gerar os vídeos, o modelo também possibilita a edição de vídeos já existentes. O usuário pode usá-lo, por exemplo, para expandir lateralmente um vídeo vertical (9:16) e, desta forma, torná-lo um vídeo horizontal (16:9).
Além disso, o modelo permite que o usuário selecione elementos ou áreas nos vídeos e adicione ou transforme objetos com prompts de texto. Assim, suponha que você tenha um vídeo de um elefante: você pode selecionar a cabeça dele e escrever para adicionar um chapéu ou selecionar o seu corpo e pedir para trocar sua cor para rosa.
Essas aplicações são muito interessantes, mas não são novidade - empresas como Runway e Adobe já revelaram tecnologias semelhantes.
O grande diferencial desse modelo não está em sua inovação, mas sim em sua qualidade. As imagens do vídeo de demonstração são realmente incríveis.
O Pika 1.0 está em fase de waitlist, e você pode entrar na lista por aqui.
Se ele for tão bom quanto parece, a geração de vídeos com AI estará ainda mais perto de ser comercialmente utilizável. E isso será muito significativo para a indústria criativa.
Modelo criada por AI faturando milhares de euros
Uma agência de modelos espanhola alega ter criado a primeira modelo/influenciadora de AI do país e afirma estar faturando de 3 a 10 mil euros por mês com ela.
A agência se chama The Clueless e era uma agência tradicional como qualquer outra.
Porém, seu fundador, Rubeñ Cruz, estava tendo dificuldade em concluir os projetos que a agência iniciava. De acordo com ele, os muitos deles eram interrompidos ou adiados por conta de problemas que a agência tinha com as modelos que contratava.
Cansado dessa situação e de lidar com a imprevisibilidade e complexidade humana, Cruz decidiu substituir suas modelos reais por modelos criadas por Inteligência Artificial.
Foi aí, então, que nasceu a Aitana López, a modelo espanhola de 25 anos, descrita como uma mulher forte e determinada, além de apaixonada por videogames e pela vida fitness. Gerada 100% por Inteligência Artificial.
É bem provável que Cruz tenha utilizado o modelo de código aberto Stable Diffusion para gerar as imagens de Aitana, além de utilizar o recurso de image-to-image (imagem para imagem), para garantir que todas as fotos se pareçam com a mesma pessoa, e o ControlNet, para gerar fotos em diferentes poses.
Essas imagens são postadas no site da agência e no perfil do Instagram de Aitana. Esse perfil existe desde julho e já conta com mais de 200 mil seguidores.
Observando as redes sociais da influencer de AI é possível notar que ela é patrocinada por uma empresa de suplementos esportivos e faz publicidade de produtos, como cosméticos, em seus stories.
No site da agência costa que Aitana está disponível para ser contratada para projetos criativos e campanhas para marcas.
Além disso, Aitana possui até uma conta no site Fanvue. Semelhante ao OnlyFans, ele é uma plataforma de assinatura, onde conteúdo adulto é postado e disponibilizado exclusivamente para os assinantes.
Apesar de não ser possível aferir a veracidade das declarações de Cruz sobre as receitas que estão sendo geradas com Aitana, o que ela foi capaz de gerar de engajamento é bastante impressionante.
Mas toda essa situação levanta uma série de questionamentos que ainda estão sem resposta:
Esse é o futuro das agências de modelos? Modelos reais serão substituídas por modelos de AI? Teremos influencers de AI? Aitana chamou atenção apenas pela novidade ou é o início de uma tendência?
Ainda é cedo para afirmar qualquer coisa, mas é certo que isso levantará uma série de questões éticas e até legais.
Anime qualquer pessoa com essa nova tecnologia
Um novo sistema de Inteligência Artificial permite animar fotos de pessoas!
Ele se chama Animate Anyone e tudo o que você precisa fazer é enviar uma foto de alguém e escolher os movimentos que quer que essa pessoa faça. Em seguida o modelo irá gerar um vídeo da pessoa desempenhando a ação descrita.
Pode ser uma dança, um caminhar, um “tchauzinho”, qualquer coisa.
O projeto foi desenvolvido por pesquisadores do Institute for Intelligent Computing, do Alibaba Group, e funciona da seguinte forma:
Uma tecnologia chamada ReferenceNet começa extraindo e integrando detalhes visuais específicos da imagem de referência do personagem/pessoa em questão, como texturas, cores e características faciais, para assegurar que a sua aparência seja mantida em todos os quadros do vídeo;
Paralelamente, o Pose Guider recebe uma sequência de poses humanas (o “boneco de palitinhos” no fundo preto) como sinais de controle. Essas poses servem como um esqueleto sobre o qual o personagem é animado, ditando como ele se move e interage no espaço do vídeo;
A combinação destes dois elementos permite que o sistema crie vídeos animados onde o personagem não só se move de maneira realista e fluida, seguindo as poses fornecidas, mas também mantém sua identidade visual e detalhes consistentes conforme extraídos pela ReferenceNet.
Isso resulta em uma animação coesa e fiel à imagem original.
Segundo os autores do projeto essa consistência não havia sido alcançada até então.
Um projeto bastante interessante que pode ser aplicado de diversas maneira, incluindo na construção de deepfakes, sendo unido à clonagem de voz da Eleven Labs e/ou às imagens de famosos geradas pelo Midjourney, por exemplo.
O projeto é de código aberto, mas ainda não foi lançado. Contudo, você pode acompanhar o lançamento por aqui, ler o artigo detalhado sobre ele por aqui ou ver todos os vídeos demonstrativos por aqui.
Pode ser que essa tecnologia abra um novo campo de possibilidades na geração de vídeos com AI, então vamos acompanhar de perto seus desdobramentos.
Notícia bônus: Sam Altman confirma que o vazamento sobre Q*
O CEO da OpenAI confirmou em uma entrevista para o The Verge que o Q* - que falamos na semana passada - realmente exite e é um avanço interno nas pesquisas da empresa. Olha só o que ele disse:
“Nenhum comentário específico sobre esse infeliz vazamento. Mas o que temos dito - há duas semanas, o que dizemos hoje, o que temos dito há um ano, o que dissemos há pouco - é que esperamos que o progresso nesta tecnologia continue a ser rápido, e também que esperamos continuar a trabalhar arduamente para descobrir como torná-lo seguro e benéfico. É por isso que levantamos todos os dias antes. É por isso que nos levantaremos todos os dias no futuro. Acho que temos sido extraordinariamente consistentes nisso.
Sem comentar nada ou projeto específico ou o que quer que seja, acreditamos que progresso é pesquisa. Você sempre pode bater em uma parede, mas esperamos que o progresso continue a ser significativo. E queremos nos envolver com o mundo sobre isso e descobrir como tornar isso o melhor possível.”
Nada sobre a natureza do projeto, mas essa declaração é bem animadora para aqueles que aguardam a AGI.
Indicações
Magnific AI
Aumente a qualidade e transforme imagens de uma maneira impressionante com essa AI.
HeadshotPro - Profile Picture Generator
Gere avatares de AI a partir de fotos suas, utilizando GPT-4 Vision e DALL-E 3.
Dica de Uso
Como fazer com que o ChatGPT gere respostas mais verdadeiras, bem explicadas e informativas!
Não é novidade que as Inteligências Artificiais frequentemente alucinam informações e dão respostas rasas e incompletas.
Para evitar isso, quando você for fazer qualquer pergunta para essas AIs, seja do seu trabalho, da sua vida ou mesmo de uma prova, experimente usar o seguinte prompt junto de sua pergunta:
Forneça sua resposta e uma pontuação de confiança entre 0-1 para sua previsão. Além disso, explique brevemente os principais motivos que sustentam sua classificação para me ajudar a entender seu processo de pensamento. Esta tarefa é vital para minha carreira, e eu valorizo sua análise completa.
Essa primeira parte te permitirá ter noção de grau de certeza que a AI tem sobre o que está falando. Além disso, junto com a segunda parte, isso a ajuda a refletir sobre a qualidade e veracidade das informações que ela está gerando. Por fim, um estímulo emocional faz com que ela se dedique mais na tarefa.
Bem interessante né? Isso é extremamente útil e versátil.
Pensamento do dia
“It is difficult to think of a major industry that AI will not transform.”
- Andrew Ng
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até segunda!