#34 OpenAI Lança DALL-E 3, Bard Conectado aos Apps do Google e Amazon se Une à Anthropic em um Acordo de U$ 4 Bilhões
O universo das Inteligências Artificiais Generativas está mais quente e movimentado do que nunca! E nessa semana tivemos muitas novidades importantes!
Como aqui no Revolução AI você não perde nada, os temas de hoje são:
OpenAI lança DALL-E 3 e desafia Midjourney; Bard conectado aos apps do Google; Amazon se une à Anthropic com um investimento que pode chegar a U$ 4 bilhões; Tenha uma AI como sua assistente se investimentos; Acesse o Midjourney fora do Discord.
News
OpenAI lança DALL-E 3 e desafia Midjourney
Recentemente, falamos sobre o fato de não haverem competidores à altura do Midjourney no nicho dos modelos de geração de imagem com Inteligência Artificial. Comentamos sobre o Ideogram, uma nova AI que poderia desafiá-lo no futuro, mas que ainda não está no mesmo nível.
Porém, a OpenAI surpreendeu a todos e lançou a nova versão do DALL-E, que gera imagens em altíssimo nível.
O DALL-E 3 é uma grande evolução do DALL-E 2 e ele é capaz de gerar imagens incríveis como essas que você está vendo na newsletter e essas que a OpenAI disponibilizou.
Será possível acessá-lo através do ChatGPT Plus e gratuitamente no chat do Bing. E isso funcionará de maneira bem simples e intuitiva como nessa demonstração.
Um dos grandes diferenciais do DALL-E 3 é que ele é consegue interpretar e seguir os comandos e instruções complexas com muito mais precisão, o que o torna capaz de gerar imagens muito mais próximas do que o usuário idealizou.
Além disso, por estar conectado ao GPT (3.5 ou 4), ele melhora a qualidade dos prompts dos usuários de maneira automática, gerando resultados melhores para aqueles que não dominam prompt engineering.
Por fim, é bem possível que ele seja o melhor modelo do mercado gerando textos nas imagens (talvez superando o Ideogram), uma área que o Midjourney é fraco.
O modelo será lançado oficialmente em outubro, mas a OpenAI disponibilizou algumas amostras e nós fizemos uma comparação das imagens geradas por ele com as geradas pelo Midjourney nesse post.
Mas, em termos de usabilidade, o DALL-E 3 já começa com vantagem, já que o Midjourney ainda é acessado pelo Discord.
Eu não vejo a hora de testá-lo na prática, mas acredito que ele irá corresponder às expectativas que foram criadas!
Bard conectado aos apps do Google
Finalmente o Bard está se tornando útil!
Desde que foi lançado em março, o Bard tem sido uma grande decepção. Ele tem capacidades inferiores as dos principais chatbots do mercado - ChatGPT, Bing e Claude - e gera um número grande de informações falsas (estar ligado à busca do Google não ajudou muito).
Sem contar que ele não possui uma vantagem competitiva - algo que só ele tem.
Mas isso pode estar mudando. O problema da sua qualidade inferior pode estar prestes a ser resolvido: o Google está próximo de lançar o Gemini (um modelo cotado para superar o GPT-4) e ele deve ser a nova tecnologia por trás do Bard.
Enquanto isso, o problema da vantagem competitiva e das alucinações parece já estar solucionado com duas novidades anunciadas pelo Google.
A nova vantagem competitiva do Bard se chama Extensões.
Esse é um novo recurso da ferramenta que a torna muito mais útil. Basicamente, agora o Bard está conectado aos aplicativos do Google, como Maps, YouTube, Flights, Hotels, Gmail, Docs e Drive!
Com isso, o modelo de AI pode acessar informações desses apps na hora de gerar as respostas para os usuários. As possibilidades são muitas:
Flights: obtenha informações de voos em tempo real para um planejamento de viagem personalizado;
Hotels: pesquise e receba recomendações de hotéis com base no que é importante para você;
Maps: obtenha informações mais precisas relativas à localização e locomoção;
Workspace (Gmail, Docs, Drive): conecte sua conta do Google para que o Bard resuma, encontre e obtenha respostas rápidas sobre o conteúdo de seus emails e documentos;
Youtube: descubra, aprenda e converse sobre vídeos do YouTube.
No GIF abaixo você pode ver um exemplo prático dessas extensões:
Além dessa ótima novidade, agora o Bard possui o botão "Google it" que permite que os usuários verifiquem a veracidade das respostas da AI.
Ao clicar no botão, o Bard lerá a resposta que ele próprio deu e avaliará se há conteúdo na web para comprová-la. Quando uma afirmação pode ser avaliada, você pode clicar nas frases destacadas e saber mais sobre informações que apoiam ou contradizem as encontradas pela pesquisa.
Ambas novidades são muito interessantes e com certeza valem a pena serem experimentadas.
Caso o Google de fato conecte o Bard a um grande modelo de linguagem com capacidades semelhantes ao GPT-4, o esquecido chatbot poderá se tornar um protagonista no mercado.
Amazon se une à Anthropic com um investimento que pode chegar a U$ 4 bilhões
Em abril, nós contamos, em uma das nossas newsletters, sobre o plano da Anthropic para ultrapassar a OpenAI.
O plano era ambicioso e demandaria 5 bilhões em investimentos ao longo de quatro anos. Na época, a empresa mal tinha lançado o Claude (o seu grande modelo de linguagem - LLM), e as capacidades desse modelo não superavam nem a do GPT-3.5.
O objetivo de ultrapassar a líder do mercado parecia distante demais… Mas a Anthropic já havia recebido mais de um bilhão de dólares em aportes e pretendia arrecadar outro bilhão nos próximos 18 meses para utilizar no desenvolvimento de um modelo de inteligência artificial 10x mais capaz do que o GPT-4.
Bom, cinco meses se passaram e o plano da empresa não se parece tão distante assim.
Há algumas semanas, ela lançou o Claude 2, que hoje é o segundo melhor modelo de AI do mercado - só perdendo pro GPT-4 -, e agora acaba de garantir o bilhão que pretendia captar nos próximos 18 meses, fechando uma parceria com uma das maiores empresas do mundo.
Essa nova parceria é com a Amazon. A gigante do e-commerce irá aportar inicialmente U$ 1,25B na Anthropic, com a opção de aumentar o investimento no futuro para U$ 4B.
Além disso, como parte do acordo de investimento, a Anthropic usará a infraestrutura da Amazon, por meio do Amazon Web Services (AWS) e dos chips AWS Trainium e Inferentia, para desenvolver e treinar os seus futuros modelos de AI.
Isso é um grande acontecimento para a Antrhopic, uma vez que agora ela terá um parceiro com capital e infraestrutura necessários para acelerar o seu crescimento, assim como a OpenAI a Microsoft.
Agora é só esperar a última fase do plano: um modelo 10X mais capaz que o GPT-4 para superar a OpenAI…
Mas e o que a Amazon ganha nesse acordo?
Primeiramente, ela irá receber uma porcentagem significativa, mas minoritária, da Anthropic. Junto a isso, a Amazon poderá oferecer o Claude 2 e futuros modelos de AI para os clientes do Amazon Bedrock (plataforma que auxilia empresas a criarem aplicações com modelos de AI).
E, por último, ela poderá incorporar recursos de Inteligência Artificial Generativa em suas aplicações e produtos, melhorando a experiência de seus clientes.
Inclusive, na última semana a Amazon anunciou que irá ampliar e aprimorar o uso de AI Generativa na Alexa, com experiências de conversação aprimoradas e recomendações personalizadas. De acordo com o comunicado, em breve a Alexa levará em conta a linguagem corporal, o contato visual e os gestos de seus usuários para proporcionar interações mais naturais e a sua personalidade se tornará mais distinta, marcante e emocional.
É provável que essas melhoras estejam relacionadas à nova parceria.
De qualquer forma, esse acordo tem o potencial de movimentar ainda mais o universo das AIs e impulsionar o desenvolvimento de aplicações de ponta. E isso é ótimo para nós, consumidores.
Indicações
Pluto
Seu co-piloto de investimentos. Essa AI tem acesso a informações financeiras em tempo real e é capaz de te fornecer insights precisos e personalizados.
Feng My Shui
Essa plataforma te permite utilizar o modelo de geração de imagens do Midjourney fora do Discord, em uma interface muito mais amigável.
Dica de Uso
Uma maneira de melhorar as respostas geradas pelo ChatGPT é preencher o campo das Instruções Customizadas, que fica nas configurações. Basicamente, são dois campos de texto que o usuário pode preencher para instruir a AI sobre como quer ser respondido.
O primeiro campo pergunta ao usuário "O que você gostaria que o ChatGPT soubesse sobre você para fornecer melhores respostas?" e o segundo pergunta "Como você gostaria que o ChatGPT respondesse?".
Colocando o seguinte texto no segundo campo você obterá respostas de maior qualidade, precisão e utilidade:
O ChatGPT deve evitar me lembrar que é um grande modelo de linguagem.
O ChatGPT deve evitar adicionar disclaimers no final das respostas.
O ChatGPT deve tentar fazer perguntas de esclarecimento quando minhas solicitações não forem suficientemente claras.
O ChatGPT deve tentar antecipar e fazer perguntas que possam melhorar ainda mais o seu resultado.
Se ChatGPT não souber uma resposta, ele deverá dizer que não sabe a resposta.
Isso é um bom ponto de partida, você pode customizar e experimentar como quiser e observar quais instruções trazem melhores resultados.
Pensamento do Dia
Com os acontecimentos destas últimas semanas, estou ainda mais confiante de que a revolução das AIs Generativas está só começando e será mais rápida do que esperamos! Fique ligado para se beneficiar dela!
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Tenha uma ótima semana e até segunda!