#50 Novo Modelo de Geração de Vídeos do Google, AI Capaz de Induzir Sonhos Lúcidos e Novidades no ChatGPT e na API da OpenAI
Chegamos à quinquagésima edição da primeira newsletter do Brasil sobre o universo das Inteligências Artificiais Generativas!
Tem sido um prazer trazer notícias, indicações, dicas, insights e opiniões todas as semanas para vocês! Obrigado por acompanharem!
E para comemorar a edição, os assuntos estão especialmente interessantes. Os temas de hoje são:
Lumiere - o novo modelo de geração de vídeos do Google; Inteligência Artificial capaz de induzir sonhos lúcidos; Novidades no ChatGPT e na API da OpenAI; Escreva histórias completas com essa AI; Um assistente de AI agradável direto do WhatsApp e Instagram.
News
Lumiere - o novo modelo de geração de vídeos do Google
O Google acaba de lançar o seu novo modelo de geração de vídeos com Inteligência Artificial.
Ele se chama Lumiere e tudo indica que, em termos de qualidade, ele pode desafiar os modelos da Runway (GEN-2) e da Pika Labs (Pika 1.0) e competir pelo posto de melhor AI de vídeo do mercado!
O Lumiere consegue gerar vídeos do zero e/ou modificar vídeos e imagens pré-existentes. Ele é bem completo, dá só uma olhada em tudo que ele faz:
Text-to-Video: gera vídeos muito realistas a partir de simples prompts de texto.
Image-to-Video: transforma imagens comuns em vídeos completos.
Geração Estilizada: usando uma única imagem de referência, o Lumiere gera vídeos no estilo que o usuário deseja.
Estilização de Vídeo: transforma elementos de vídeos existentes de forma criativa.
Animação Localizada: anima apenas partes selecionadas de imagens, enquanto o resto permanece estático.
Video Inpainting: edita partes de vídeos selecionadas e as substitui com o que o usuário quiser.
Para ver o vídeo que as demonstra todas estas categorias na prática, basta clicar aqui.
No geral, os vídeos são bastante realistas, mas o que mais impressiona neles é a sua coesão e consistência. Diferentemente da maior parte dos modelos do mercado, os seus frames são bem coerentes entre si.
Isso ocorre, pois o Lumiere utiliza um novo modelo de difusão chamado Space-Time-U-Net (STUNet).
Esse modelo compreende onde os elementos estão em um vídeo (espaço) e como elas se movem e mudam simultaneamente (tempo). Isso permite que Lumiere crie o vídeo em um só processo, ao invés de reunir cada frame menor.
Por enquanto, o Google ainda não vai disponibilizar o modelo publicamente. Então este é mais um dos “lançamentos” da empresa ao qual não podemos ter acesso.
No entanto, a tecnologia parece bastante promissora e dá uma prévia do atual estado da geração de vídeo com AI.
O campo está evoluindo muito rápido e em breve poderemos acessar mais facilmente modelos como o Lumiere.
Inteligência Artificial capaz de induzir sonhos lúcidos
Uma startup de AI está desenvolvendo uma tecnologia que será capaz de induzir sonhos lúcidos em seus usuários.
Apesar de ser muito impressionante, isso pode ser só a ponta do iceberg e eu vou te explicar o porquê.
A startup em questão se chama Prophetic AI tem o objetivo de compreender, explorar e expandir a consciência humana. E o ponto de partida para essa missão são os sonhos lúcidos.
Sonhos lúcidos são um tipo de sonho em que o sonhador percebe e tem consciência de que está dormindo. Acredita-se que esse tipo de sonho pode trazer uma série de benefícios, como redução de ansiedade, aumento da capacidade de resolução de problemas e maior criatividade.
Para induzir esses sonhos lúcidos, a empresa desenvolveu um modelo de AI chamado Morpheus-1 e um dispositivo chamado Halo.
Eis como eles funcionam:
Diferentemente dos grandes modelos de linguagem (LLMs), como o GPT-4, que usam palavras como inputs, o Morpheus-1 usa estados cerebrais.
E ao invés de gerar palavras como resposta, o Morpheus-1 gera hologramas ultrassônicos para neuro estimular a pessoa e levá-la ao estado lúcido enquanto dorme e sonha.
Esse modelo age através do Halo, um dispositivo não invasivo para ser usado na cabeça.
O Halo coleta as informações da atividade cerebral do usuário por meio de um eletroencefalograma (EEG) e alimenta o Morpheus-1. Como citei acima, o Morpheus-1 processa esses dados e gera resposta em forma de ultrassom, que são emitidos pelo Halo.
Essas ondas emitidas pelo Halo são as responsáveis por gerar e estabilizar os estados de sonhos lúcidos.
Isso tem muita cara de ficção científica, mas é bem real.
Os seus criadores postaram um vídeo de apresentação na semana passada e já chamaram voluntários para testar essa tecnologia na prática. Então se essa fase de testes progredir como o esperado, em breve veremos o Halo no mercado.
No início do texto eu disse que essa interessante tecnologia era apenas a ponta do iceberg.
Isso, pois a Prophetic se autodenomina uma empresa de “experiências de consciência” e não pretende se limitar a sonhos lúcidos.
A ideia é que o Morpheus-1 seja o modelo base para outros modelos que agirão em nossos cérebros para outros propósitos, como induzir estados de foco ou bom humor.
Caso isso venha a se tornar realidade, as implicações - negativas e positivas - são dignas das melhores distopias.
Mas ainda estamos muito no início e não temos comprovações do funcionamento da tecnologia, então vamos acompanhar os desenvolvimentos da Prophetic AI e trazer atualizações.
Novidades no ChatGPT e na API da OpenAI
Recentemente, saíram novidades muito boas envolvendo o ChaGPT e a API dos grandes modelos de linguagem da OpenAI.
As do ChatGPT dizem respeito às novas funcionalidades que estão sendo implementadas.
Uma dessas novidades foi notada há algumas semanas e postada no Twitter (X) e se trata de uma personalização ainda maior dos GPTs. Ela fará com que os GPTs tenham uma “memória de longo prazo”, permitindo que eles guardem informações e instruções dos usuários através das conversas.
Essa nova funcionalidade ainda não está disponível para os usuários, mas deverá estar muito em breve.
Falando dos GPTs, agora será possível marcá-los nas conversas com o ChatGPT - da mesma forma que marcamos pessoas nos grupos de WhatsAPP -, chamando-os para a ação quando for necessário.
Por último, outra novidade que logo será implementada é a possibilidade de criar conversas temporárias no ChatGPT. Essas conversas não ficarão armazenadas no sistema e serão apagadas assim que o usuário sair delas.
Agora, sobre as novidades da API da OpenAI, temos duas ótimas notícias para aqueles que utilizam o GPT-3.5 e o GPT-4 para construir aplicações externas:
Nova versão do GPT-3.5 Turbo e redução de preços:
A OpenAI anunciou que está lançando nessa semana uma nova versão do GPT-3.5 Turbo (gpt-3.5-turbo-0125).
Essa nova versão é tão capaz quanto as demais, com sutis melhorias. No entanto, ela vem custando muito menos.
Pela terceira vez em um ano, a OpenAI está reduzindo os custos por token de seu modelo.
Desta vez haverá uma redução de - impressionantes - 50% no preço de input ($0.0005 por 1K tokens) e de 25% no preço de output ($0.0015 por 1K tokens).
Atualização do GPT-4 Turbo:
A OpenAI anunciou também que mais de 70% das solicitações dos clientes da API GPT-4 já migraram para o GPT-4 Turbo. Isso significa que a maior parte deles já está usando a versão mais barata e mais rápida do GPT-4.
Além disso, ela lançou uma nova versão para o GPT-4 Turbo (gpt-4-0125-preview). Essa versão vem com melhorias na geração de código e com o problema do “comportamento preguiçoso” nas repostas - relatado por muitos usuários - resolvido.
Para ver mais novidades sobre a API é só clicar aqui.
De maneira geral, essas novidades são excelentes, uma vez que reduzem os custos de desenvolvimento de soluções com AI e ampliam a suas aplicações.
Indicações
StoryBird.ai
Crie histórias completas com texto e ilustrações utilizando essa ferramenta de AI.
Pi
Acredito que já indiquei o Pi em alguma das nossas newsletters. Mas ele é muito bom para ser tão esquecido pelas pessoas.
Ele é basicamente um assistente como o ChatGPT, mas mais amigável e agradável. Além disso, ele conversa de maneira muito mais humana e natural que qualquer outra AI, acessa informações em tempo real e se lembra das conversas anteriores que teve com você.
E você ainda pode usá-lo no WhatsApp e Instagram.
Dica de Uso
Atualmente existem muitas ferramentas de AI no mercado:
ChatGPT, Claude, Bard, Bing, Pi…
Todas elas tem poderosos modelos de linguagem por trás e fazem mais ou menos a mesma coisa. Então como escolher qual delas usar?
Uma boa solução para este problema é compreender a “vocação” ou pontos fortes de cada ferramenta. Isso pode ser feito via teste, mas eu vou facilitar a sua vida e citar algumas áreas onde cada uma delas se destaca:
ChatGPT (versão gratuita): o bom e velho ChatGPT, sai bem em quase todas as tarefas, usando os comandos corretos. É a referência, o padrão de comparação, e não possui nenhuma “força” evidente;
Claude: excelente para enviar documentos e conversar sobre eles e para gerar textos com uma linguagem mais humana;
Bard: se sai muito bem em geração de códigos e textos para blogs (mais otimizados para SEO). Pode ser muito útil para resumir vídeos no YouTube e interagir com seus arquivos no Google Workspace;
Bing: por usar o GPT-4, é o melhor para tarefas mais complexas. Além disso, ele é ótimo para solicitações que envolvam assuntos atuais;
Pi: perfeito para bate papo, brainstorms e discussão de ideias.
Esses são alguns dos pontos fortes que pude identificar, então este é bom guia, mas sempre recomento que você teste-as e tire suas próprias conclusões.
Pensamento do Dia
“The beauty of dystopia is that it lets us vicariously experience future worlds - but we still have the power to change our own.”
- Ally Condie
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até segunda!