#35 ChatGPT Visualizando Imagens e Falando, 4 Novidades de AI da Meta e Spotify Traduzindo Podcasts com Inteligência Artificial
Na newsletter dessa semana falamos sobre incríveis aplicações de Inteligência Artificial que estão sendo lançadas ou estão muito próximas disso!
E, mais uma vez, temos movimentações de três grandes empresas de tecnologia!
Os temas de hoje são:
ChatGPT agora é capaz de visualizar imagens e falar; Zuckerberg anuncia integrações de AI nas aplicações da Meta; Spotify traduzindo podcasts com AI; Separe e/ou remova vozes e instrumentos de qualquer música com essa AI; Documente suas histórias de vida com ajuda dessa AI.
News
ChatGPT agora é capaz de visualizar imagens e falar
Com a Anthropic se unindo à Amazon e o Google prestes a lançar o Gemini, a OpenAI não pode se dar ao luxo de parar de melhorar os seus modelos e aplicações já existentes. E ela sabe bem disso…
Na newsletter da semana passada comentamos sobre ela ter lançado o DALL-E 3 e hoje temos novidades sobre o ChatGPT!
São duas novidades! A primeira e mais interessante é que o chatbot da OpenAI agora é capaz de interpretar imagens e responder questões a partir delas. E isso amplia suas capacidades em um nível impressionante, afinal:
Agora você poderá mandar um gráfico para ele analisar, uma foto da sua geladeira para ele planejar uma refeição pra você, o manual de montagem da sua nova mesinha e uma foto da sua caixa de ferramentas e perguntar quais você deve usar, um esboço do design de um site e pedir para ele gerar o código, uma foto de um ponto turístico e pedir informações interessantes sobre… As possibilidades são muitas!
Mas de todas as aplicações que tenho visto, três me chamaram a atenção:
Enviar um diagrama complexo e pedir para o ChatGPT explicá-lo para você em detalhes e em formato de texto. Veja um exemplo aqui;
Enviar um prints de um site que se parece com o que você está querendo programar e pedir para o ChatGPT gerar o código para você. Aqui você pode ver um vídeo disso na prática;
Enviar um manuscrito difícil de ler e pedir para o ChatGPT desvendar o que está escrito por você. Veja um exemplo aqui.
Todas essas aplicações são incríveis e podem impactar positivamente uma série de tarefas desempenhadas por pessoas todos os dias.
Você pode ver a demo dessa nova funcionalidade que a OpenAI disponibilizou em um vídeo que postamos. Mas ela já está sendo disponibilizada gradualmente para os usuários.
Como ela é parte do GPT-4, apenas os assinantes do ChatGPT Plus e ChatGPT Enterprise terão a acesso a ela. Mas é provável que ela seja integrada (gratuitamente) ao Bing no futuro, já que ele já conta com uma funcionalidade semelhante e utiliza o GPT-4.
E a outra novidade do ChatGPT é que agora ele será capaz de dar suas respostas em formato de áudios de voz, como se ele estivesse falando com o usuário.
Até então os usuários só conseguiam fazer perguntas por voz, mas agora será possível ter uma conversa completa, com as duas partes utilizando a comunicação por áudio.
Essa nova modalidade torna a ferramenta mais acessível e flexível.
Essa tecnologia de voz é alimentada por um novo modelo de conversão de texto em fala da OpenAI, capaz de gerar áudio semelhante ao humano a partir de apenas texto e alguns segundos de amostra de fala.
Assim como a primeira funcionalidade, a conversação por voz será disponibilizada gradualmente para os seus usuários nas próximas semanas - começando pelos usuários pagantes até chegar em todos os usuários da plataforma.
De qualquer forma, essas são excelentes novidades da OpenAI, que está trabalhando bem para manter sua posição de liderança no mercado.
Zuckerberg anuncia integrações de AI nas aplicações da Meta
A Meta acabou de anunciar quatro grandes novidades envolvendo Inteligência Artificial Generativa!
No Meta Connect 2023, que aconteceu nessa semana, Mark Zuckerberg contou como a empresa por trás do Facebook, Whatsapp e Instagram está integrando AI em seus produtos e serviços.
Como já falamos aqui, ela tem sido muito ativa nos últimos meses desenvolvendo modelos de Inteligência Artificial e finalmente está integrando estas tecnologias na prática e para o consumidor final.
Então eu separei as quatro novidades mais interessantes e relevantes tratadas no evento para trazer nessa newsletter:
A primeira grande novidade é que, em breve, os usuários poderão enviar mensagens e interagir com assistentes de AI pelo WhatsApp e direct do Instagram.
Haverá vários tipos de assistentes de AI (chatbots), cada um com com diferentes propósitos.
Eles poderão ajudar em tarefas, como sugestões de receitas, dicas de redação e planejamento de viagens, ou simplesmente ser uma forma de entretenimento - como os chatbots que assumirão a personalidade de pessoas famosas, como o Snoop Dogg.
A segunda novidade é que a Meta está trabalhando no AI Studio, uma plataforma na qual qualquer um poderá criar o seu chatbot de AI personalizado e integrá-lo ao seu Whatsapp ou Instagram. Isso é uma excelente aplicação para empresas e figuras públicas. E, de acordo com o que foi falado, eles poderão ser criados por qualquer um, sem que haja conhecimento prévio de programação.
A terceira novidade não é muito impactante ou revolucionária, porém é, sim, muito divertida. Em breve, os usuários das plataformas da Meta poderão criar figurinhas únicas e personalizadas, a partir de simples comandos de texto, e utilizá-las em suas conversas com outros usuários. Isto, graças ao novo modelo de geração de imagens da empresa, chamado Emu.
Por fim, Zuckerberg ainda anunciou um novo óculos inteligente, em parceria com a Ray-Ban. Esses óculos, além de gravarem o ambiente e fazerem ligações, estão ligados a AI da Meta. Isso permitirá que os usuários façam perguntas, para a Inteligência Artificial, relacionadas ao ambiente em que estão e ao que estão fazendo no momento.
Todas essas novidades estarão sendo lançadas nas próximas semanas e será interessante ver a qualidade e a usabilidade das AIs da Meta.
E vale a pena acompanhar de perto a novidade dos assistentes de AI personalizados, que podem mudar completamente a forma que as pessoas interagem com produtores de conteúdo e celebridades em geral na internet.
Então traremos atualizações.
Spotify traduzindo podcasts com AI
Imagine ouvir qualquer podcast do mundo em sua língua nativa. Agora imagine poder fazer isso e ainda por cima escutar a voz original de seus locutores e não uma voz genérica de dublagem com AI.
Estamos muito próximos disso e o Spotify é uma das empresas que está trabalhando para transformar essa ideia em realidade.
Na última semana, a empresa anunciou que está implementando um novo recurso de tradução de podcasts na sua plataforma utilizando Inteligência Artificial Generativa.
O recurso se chama Voice Translation e a tecnologia por trás dele é o modelo de geração de voz da OpenAI que falamos na primeira notícia dessa newsletter. Esse modelo consegue gerar áudio a partir de apenas texto e alguns segundos de amostra de fala, reproduzindo a voz de qualquer pessoa.
Isso fará com que as traduções geradas saiam na voz de seus locutores, o que proporcionará uma experiência auditiva mais autêntica, pessoal e natural do que a dublagem tradicional.
O Voice Translation ainda está sendo testado pelo Spotify que colaborou com cinco podcasters - Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett - para gerar traduções de alguns de seus podcasts com suas respectivas vozes. E os idiomas incluídos para tradução nessa primeira fase de testes foram espanhol, francês e alemão.
Três episódios de alguns destes citados já estão traduzidos do inglês para o espanhol:
Lex Fridman Podcast – “Entrevista com Yuval Noah Harari”
Armchair Expert – “Kristen Bell, pela graça de Deus, retorna”
The Diary of a CEO with Steven Bartlett – “Entrevista com a Dra. Mindy Pelz”
Você pode ouvi-los clicando aqui.
Apesar de ainda está em testes, é possível enxergar o potencial dessa tecnologia e imaginar como ela será aplicada no futuro. Acredito que, muito em breve, todos os criadores de conteúdo relevantes do Spotify e Youtube terão seus podcasts e vídeos traduzidos para as línguas mais faladas do mundo e poderão se comunicar de maneira mais próxima e autêntica com muito mais pessoas do que podem hoje.
E, em um futuro um pouco mais distante, imagino que qualquer pessoa poderá traduzir o áudio de qualquer vídeo, apenas apertando alguns botões e de maneira quase instantânea.
Pense quanto conteúdo e informação relevante circulará e estará disponível para pessoas que atualmente sofrem com a barreira linguística! É muito bom ver esse tipo de avanço.
Indicações
Vocal Remover
Separe e/ou remova vozes e instrumentos de qualquer música com essa AI gratuita.
Storly.ai
Documente suas histórias de vida com ajuda dessa Inteligência Artificial.
Dica de Uso
Transforme slides resumidos e difíceis de entender em textos completos, detalhados e mais explicativos utilizando AI!
Se você é estudante, na escola ou na faculdade, já deve ter perdido alguma aula e depois teve que estudar pelos slides pra fazer a prova. Mas, muitas vezes, os slides vêm em tópicos tão resumidos que você não consegue ter a menor ideia sobre o assunto sem a explicação de um professor.
No entanto, seguindo o seguinte processo, as AIs podem agir como o seu professor, expandir o tópicos desses slides e não te deixar na mão hora de estudar pelos slides:
Acesse o Claude e faça o upload do PDF dos slides ou copie o texto desses slides e cole no ChatGPT ou Bing.
Junto a isso, escreva o seguinte comando:
Esses slides são de uma aula que eu perdi. As informações estão muito resumidas. Preciso que você as interprete e detalhe-as em um longo e explicativo texto. Aprofunde as curtas sentenças com seus conhecimentos de [insira a área temática do seu slide].
E pronto, ele gerará um texto bem detalhado e explicativo, expandindo os curtos tópicos da apresentação original.
Essa aplicação de Inteligência Artificial é muito útil e vai te ajudar muito na hora de estudar!
Pensamento do Dia
As Inteligências Artificias Generativas devem potencializar as capacidades humanas, não substituí-las.
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Tenha uma ótima semana e até segunda!