#68 Claude 3.5 Sonnet Lançado e Superando GPT-4o, Ilya Funda sua Startup de Superinteligência e OpenAI Faz Aquisições Importantes
Seja bem-vindo(a) a mais uma newsletter do Revolução AI. Aqui você não perde nada sobre o universo das Inteligências Artificiais Generativas!
A edição de hoje está cheia de assuntos interessantes e relevantes! Os temas de hoje são:
Claude 3.5 Sonnet lançado e superando GPT-4o; Ilya funda startup para o desenvolvimento de uma Superinteligência segura; OpenAI fazendo aquisições e movimentações importantes; Use modelos de AI em tabelas; Transforme a iluminação de qualquer imagem.
News
Claude 3.5 Sonnet lançado e superando GPT-4o
A Anthropic acaba de lançar o Claude 3.5 Sonnet, o seu mais novo modelo de Inteligência Artificial e superar o GPT-4o.
O modelo, assim como o Claude 3, faz parte de uma família maior de modelos, que incluirá também as versões Opus (mais poderosa) e Haiku (mais rápida e econômica), ambas planejadas para lançamento ainda este ano. A versão Sonnet é a intermediária.
Apesar de ser a versão intermediária da nova geração, o Claude 3.5 Sonnet vem para superar o Claude 3 Opus e todos os seus concorrentes do mercado, como GPT-4o e Gemini 1.5 Pro.
Mas do que ele é capaz?
Antes de falar de suas capacidades, vale ressaltar que, como já mencionamos aqui, o Claude é um modelo de AI Constitucional.
Isso significa que ele tem o seu "comportamento" moldado por uma série de princípios e, diferentemente dos outros modelos, ele não aprende como agir via feedback humano. Ele apenas segue as suas regras fundamentais e pré-estabelecidas.
Como resultado disso, o Claude é mais confiável e menos ofensivo que os demais modelos.
Feita essa explicação, vamos às capacidades do Claude 3.5 Sonnet.
O modelo consegue interpretar textos e imagens - incluindo longos documentos de texto contendo imagens e gráficos - e gera apenas textos e códigos como resposta.
Sobre a qualidade dos resultados do que ele gera, quando testado nos principais bechmarks do mercado, o Claude 3.5 Sonnet superou todos os modelos do mercado em raciocínio (GPQA), conhecimento (MMLU) e em habilidades de programação (HumanEval). Como você pode ver abaixo:
Além disso, a Anthropic relata que o modelo mostra uma melhora significativa na compreensão de nuances, humor e instruções complexas. E isso parece realmente ser verdade, pelo o que venho testando e vendo de exemplos de outros usuários.
E, se você nunca experimentou o Claude, uma coisa muito interessante sobre ele é que seus textos sempre possuíam um tom muito mais natural e “humano” do que os outros modelos - e essa nova versão mantem isso.
Ainda sobre os aspectos técnicos do modelo, a Anthropic foi capaz de obter esse salto de qualidade, ao mesmo tempo em que dobrou sua velocidade de resposta e manteve o custo o mesmo do Claude 3 Sonnet. Isso é excelente e demonstra um avanço importante na eficiência algorítmica.
Mas o mais impressionante e legal desse lançamento não foi o modelo em si, mas sim uma nova funcionalidade na plataforma onde interagimos com ele (claude.ai).
Essa nova funcionalidade se chama Artifacts e expande de uma maneira totalmente nova a forma que interagimos com os modelos de AI.
Agora, quando um usuário pede a Claude para gerar conteúdo como partes de um código, documentos de texto ou designs de sites, os “Artifacts” aparecem em uma janela ao lado da conversa - como você pode ver abaixo:
Isso cria um espaço de trabalho dinâmico onde ele podem ver, editar os resultados do que o Claude está gerando em tempo real.
Você pode pedir para o Claude programar um jogo que você inventou. Ele irá gerar o código desse jogo e rodá-lo nessa janela lateral, permitindo que você veja o resultado final e até jogue! É quase mágico e eu recomendo muito ver os Artifacts funcionando na prática.
E isso abre muitas possibilidades de uso, veja alguns exemplos do que dá para fazer com isso:
Gerar diagramas a partir de textos ou conceitos específicos;
Enviar um artigo e pedir para o Claude gerar uma aplicação interativa para explicá-lo;
Enviar uma planilha e pedir para ele fazer análises e gerar gráficos usando as cores da sua marca;
E muito mais.
É realmente incrível e funciona muito bem!
Finalmente, a última novidade é que a Anthropic está lançando o Projetcs, a sua versão dos GPTs, da OpenAI.
O Projects é uma função que estará disponível apenas para assinantes dos planos pagos do Claude e permitirá que esses usuários criem assistentes personalizados para fins específicos.
Assim como os GPTs, basta fazer upload dos documentos que você deseja que sejam a “base de conhecimentos” do assistente e definir como ele dele se comportar por meio de instruções customizadas.
Não tive a oportunidade de testar na prática ainda, mas se funcionarem tão bem quanto os da OpenAI, teremos mais um motivo para usar o Claude ao invés do ChatGPT.
São essas as novidades da Antrhopic. A má notícia que eu tenho para te dar é que, apesar do Claude estar disponível para ser acessado em 172 países, por algum motivo, essa lista não inclui o Brasil.
Então, a não ser que você tenha um número de telefone estrangeiro e use VPN, você só conseguirá usar o Claude 3.5 Sonnet via API - então nada dos Artifacts ou Projects.
Isso é uma pena e eu espero que mude logo.
Afinal, a Anthropic está lançando produtos cada vez melhores e muito rapidamente. Ela passa a ter o melhor modelo do mercado e talvez também a melhor interface para interagir com AIs.
E, como falei no início, ainda nesse ano ela lançará o Claude 3.5 Haiku e o Opus, além de várias funcionalidades novas em sua plataforma.
Então é bom a OpenAI ficar atenta, pois a startup de seus ex-funcionários está vindo com tudo para tomar o seu lugar,
Ilya funda startup para o desenvolvimento de uma Superinteligência segura
Ilya Sutskever, co-fundador da OpenAI e um dos melhores pesquisadores em AI do mundo, está começando um novo e ambicioso projeto.
Como relatamos aqui na época, ele deixou a OpenAI em Maio deste ano, por discordâncias de opiniões entre eles e os principais líderes da empresa, como Sam Altman e Greg Brockman, sobre como abordar e lidar com a segurança dos modelos de AI.
Enquanto Altman e Brockman priorizam o desenvolvimento mais acelerado e têm um foco mais comercial, Ilya é muito mais preocupado com a segurança do que está sendo desenvolvido.
Isso, pois como explicamos nessa e nessa newsletter, o desenvolvimento de modelos de linguagem como o GPT-4 ou Claude 3.5, pode, eventualmente, levar a sistemas de AI muito mais inteligentes que os humanos. Tal fato pode ser muito benéfico, contanto que essas AIs estejam sob o nosso controle e alinhados com nossos interesses.
Porém, como controlar esses modelos na medida em que ele se tornem mais poderosos que nós é uma das questões mais importantes da humanidade. Afinal, caso atinjamos a superinteligência, o controle seja perdido e esses modelos ajam à revelia, os resultados podem ser catastróficos.
Ilya não pretende deixar isso acontecer.
Mas na OpenAI ele não recebia os recursos e não possuía a autonomia suficiente para desenvolver sua pesquisa em alinhamento.
Assim, algumas semanas após deixar a empresa, ele anunciou que está fundando seu próprio laboratório de pesquisa em AI.
A nova startup se chama Safe Superintelligence Inc (SSI) e como o nome já indica, o seu único e fundamental objetivo e desenvolver uma superinteligência segura.
Então nada de AGI, isso é trivial demais para Ilya. O foco é ASI - Artificial Super Intelligence.
De acordo com o relatado no anúncio da empresa, toda a equipe, os investidores e o modelo de negócios estão alinhados para alcançar uma superinteligência segura. Não haverá distrações com ciclos de produtos ou pressões comerciais de curto prazo.
O foco é um só: resolver as questões técnicas do alinhamento e atingir uma superinteligência segura.
Esse é um desafio enorme e que dependerá de muito talento humano e recursos financeiros para ser solucionado. Mas parece que nada disso será um problema.
O time da SSI já conta com grandes mentes como a de Daniel Gross e Daniel Levy - os outros fundadores e, levando em conta a ambição do projeto, ainda atrairá muitos dos melhores pesquisadores em AI do mundo.
Sobre capital, os financiadores do projeto não foram revelados, mas Ilya garantiu que capital não será um problema.
De qualquer maneira, essa nova startup é extremamente interessante e acredito que será muito importante para o futuro das AIs e de todas as pessoas.
O problema do alinhamento parece distante e digno de ficção científica, mas é mais importante e urgente do que muitos imaginam. E é bom ver ele sendo levado a sério.
Vamos acompanhar a SSI e Ilya e trazer atualizações.
OpenAI fazendo aquisições e movimentações importantes
Nesta terça-feira (25), a OpenAI anunciou que está adiando o lançamento do seu novo Voice Mode (demonstrado na demo do GPT-4o).
Assim, mais uma semana se passa sem que tenhamos acesso a ele e a várias promessas da empresa, como Sora e GPT-4.5/GPT-5.
Porém, a OpenAI continua trabalhando atrás das cortinas - aparentemente, preparando o terreno para o futuro. Então vamos dar uma olhada um pouco mais profunda no que a empresa tem feito nos últimos dias.
Temos duas aquisições e o anúncio de um novo membro do conselho para tratar.
Aquisição da Rockset
A OpenAI está adquirindo a Rockset.
A Rockset é uma empresa especializada em construção e pesquisas inteligentes em base de dados, com o objetivo de possibilitar indivíduos e empresas a acessarem grandes volumes de conhecimento de forma eficiente.
Mas o que isso tem a ver com a OpenAI e seus produtos?
Sabe quando você envia um documento de dezenas ou centenas de páginas para o ChatGPT e faz perguntas sobre ele? Para responder suas perguntas ele faz buscas nesse documento utilizando uma técnica chamada RAG (Retrieval-Augmented Generation).
Essas buscas funcionam muito bem, mas ainda não são tão eficientes e precisas quanto poderiam ser.
Sabendo disso, a OpenAI adquire a Rockset e traz seu time de especialistas em RAG e outras soluções em dados para melhorarem os sistemas de busca nas soluções oferecidas pela OpenAI, como o ChatGPT, os GPTs e a Assistant API.
E isso é excelente! A OpenAI já melhorou a sua arquitetura de busca de dados recentemente e é muito bom ver que ainda teremos muitos aprimoramentos no horizonte.
Aquisição da Multi
A OpenAI também anunciou na semana passada a aquisição de uma empresa chamada Multi.
A Multi é uma empresa de software que tem como produto uma plataforma que permite o controle remoto de computadores. Para explicar a solução deles, melhor dar um exemplo prático.
Pense na seguinte situação: estou programando um site e estou com problemas para fazê-lo funcionar. Chamo meu colega programador para me ajudar.
Usando a Multi, eu faço uma chamada de vídeo com ele, compartilho minha tela com e dou o controle do meu computador. Assim, do computador dele, eles é capaz de mexer no meu, acessar meus projetos e arquivos e fazer alterações necessárias.
Com esse exemplo, talvez você já tenha entendido porque a OpenAI se interessou nessa tecnologia…
Imagine conectar a Multi ao app de desktop do ChatGPT. Os usuários poderão compartilhar a tela com o ChatGPT e possibilitar que ele aja em seus computadores, desenhando na tela, navegando na internet, editando códigos, escrevendo textos e muito mais!
É um passo fundamental para a transição de assistente para verdadeiros agentes autônomos e eu achei muito interessante. Mas, claro, isso é apenas uma especulação, a OpenAI pode ter outras ideias para a tecnologia e o time da Multi, e isso o tempo dirá.
General do Exército Americano no conselho
Além dessas aquisições, a OpenAI divulgou a adição de um novo membro ao seu conselho administrativo.
Uma adição bastante surpreendente para alguns. Ela se trata de Paul Nakasone, General aposentado do Exército dos Estados Unidos.
Nakasone é especilista em segurança cibernética e sua adição tem o intuito de reforçar a segurança dos sistemas da OpenAI, principalmente no que tange a dados sobre a arquitetura e configurações de seus modelos e aos dados dos usuários.
Isso vai de encontro com o que falamos na semana passada - na medida em que os modelos avançam, a preocupação que eles caiam nas mãos erradas aumentará cada vez mais.
Em suma, a OpenAI vem fazendo parcerias estratégicas, adquirindo tecnologias e talentos, enquanto reforça a sua segurança. Então, mesmo que ela esteja decepcionando com a demora para entregar os produtos que vem prometendo, há muitos indícios que ela está construindo algo grande e irá surpreender a todos quando finalmente disponibilizar tudo.
Indicações
Otto
Modelos de AI aplicados em planilhas, tornando a interação com dados e pesquisa algo totalmente novo e eficiente.
Magnific AI - Relight
A nova função “relight” da ferramenta Magnific AI permite transformar completamente a iluminação das imagens.
Dica de Uso
Sempre que você fizer perguntas para as AIs e elas responderem de forma parcial ou totalmente incorreta, use essa dica.
Junto com a sua pergunta, escreva:
“…antes de responder, faça uma lista de suposições erradas que as pessoas às vezes fazem sobre os conceitos incluídos na pergunta.”.
Isso fará com que o modelo de Inteligência Artificial “pense” melhor sobre a pergunta e a veracidade da informação, aumentando a taxa de acerto na resposta e reduzindo as “alucinações”.
Pensamento do Dia
“We don’t see any evidence that things are leveling off.”
- Dario Amodei, CEO da Anthropic.
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até semana que vem!