#43 Sam Altman de Volta à OpenAI e Rumores de AGI, Claude 2.1 com Janela de Contexto de 200k e 3 Atualizações de AI do Google
Seja bem-vindo(a) a mais uma newsletter do Revolução AI. Aqui você não perde nada sobre o universo das Inteligências Artificiais Generativas!
Na edição de hoje temos notícias interessantes sobre três dos principais players do mercado. Os temas de hoje são:
Sam Altman de volta à OpenAI e rumores de AGI; Claude 2.1 com janela de contexto de 200k; 3 atualizações de AI do Google; Transforme desenhos em aplicações funcionais com AI; Acesse um repositório de vídeos gerados por AI.
News
Sam Altman de volta à OpenAI e rumores de AGI
Na newsletter da semana passa cobrimos toda a situação que envolvia a demissão de Sam Altman da OpenAI.
Quando enviamos aquela newsletter, Sam Altman e Greg Brockman estavam trabalhando na Microsoft e a situação da OpenAI era extremamente incerta e preocupante - mais de 90% dos funcionários pediam pela renúncia do board e ameaçavam sair da empresa.
No entanto, menos de dois dias depois, na quarta-feira, tudo mudou…
Sam e Greg retornaram a seus cargos na OpenAI e a saga chegou ao fim.
Eis o que ocorreu para que o retorno dos dois se concretizasse:
Como falamos, o novo CEO da OpenAI era Emmett Shear, co-fundador da Twitch.
Quando Emmett assumiu ele estabeleceu uma investigação pra entender o que Sam Altman fez para merecer ser demitido.
Após não encontrar nada e pressionado pelos funcionários e investidores, ele chamou Sam Altman para negociar a sua volta.
96 horas se passaram desde o início das conversas e eles chegaram a um acordo: Sam seria novamente o CEO da OpenAI, Greg voltaria ao cargo de presidente e um novo board seria estabelecido.
Investidores, funcionários e clientes ficaram satisfeitos.
A situação parece te ficado resolvida e quase tudo voltou a ser como antes.
Mas, afinal, quais foram as razões para a demissão de Sam?
É bem provável que, como suspeitávamos, uma das razões tenha sido discordâncias sobre o futuro do desenvolvimento das AIs:
Uma parte, que incluía Sam e Greg, acreditava no rápido desenvolvimento e lançamentos de modelos de AI no mercado. Enquanto outra parte, que incluía o restante do board, acreditava em um lançamento mais lento e cauteloso, por preocupação com questões de segurança e alinhamento dos modelos.
Uma evidência que corrobora para esta tese é que duas, das quatro pessoas que demitiram Sam, deixaram de fazer parte do board da empresa quando ele retornou. São elas Helen Toner e Tasha McCauley.
Ambas acreditam em um desenvolvimento lento e cauteloso das AIs, sendo que Torner até escreveu um artigo descrevendo e recomendando formas de forçar as empresas de AI a desenvolverem lentamente.
Enquanto isso, Sam Altman e Greg Brockman são otimistas sobre o futuro das AIs, pensam menos em questões de segurança e acreditam em um desenvolvimento acelerado.
Parece que foi esse choque de pensamentos que levou a tudo isso.
Mas calma! A situação não para por aí!
De acordo com o Reuters, o gatilho para a sucessão de eventos e o que trouxe a tona às diferenças dentro da empresa foi um avanço tecnológico, ocorrido dentro da OpenAI, que poderia levar à AGI - Artificial General Intelligence.
AGI pode ser definida como um sistema autônomo que supera os humanos em todas (ou quase todas) as atividades economicamente valiosas. Se desenvolvida, uma AGI poderia mudar completamente a ordem produtiva na nossa sociedade.
O tal avanço tecnológico que acreditam estar nos aproximando da AGI é um modelo chamado de Q* (Q star). Pouco se sabe sobre ele, mas acredita-se que seu nome é a combinação de duas técnicas de AI bem conhecidas, Q-learning e A* search.
Essas técnicas, quando unidas aos modelos de AI, como o GPT-4 ou o futuro GPT-5, fariam com que o modelo de AI resultante tivesse uma capacidade muito mais avançada de raciocínio, melhorasse seu desempenho em atividades matemáticas e de programação, reduzisse as suas alucinações e aumentasse sua habilidade de resolver problemas e de pensar em soluções inovadoras e criativas.
Muitos acreditam que isso é a peça que faltava no quebra-cabeça para levar os modelos de Inteligência Artificial a um outro nível.
Assim, o que se imagina é que essa iminência de desenvolver um modelo tão poderoso tenha despertado um receio, por parte de alguns membros da OpenAI, acerca de suas implicações e possíveis consequências negativas. E isso teria gerado a tal “quebra” interna, evidenciando divergências de opiniões entre os membros, que causou toda a crise das últimas semanas.
Infelizmente, não temos muitas informações concretas sobre a a situação e somos obrigados a fazer especulações. Mas se estamos tão perto da AGI quanto os rumores indicam, é bom nos prepararmos, pois muita coisa vai mudar.
De qualquer forma, traremos atualizações!
Claude 2.1 com janela de contexto de 200k
A Anthropic acaba de lançar a versão 2.1 do Claude, o maior competidor do GPT-4/ChatGPT.
A principal e mais atraente novidade desse novo modelo é que o Claude 2.1 tem uma janela de contexto de 200 mil tokens, o que significa que ele consegue compreender cerca de 150 mil palavras de uma só vez.
Em comparação, o recém-lançado GPT-4 Turbo tem uma janela de contexto de 128 mil tokens, cerca de 70 mil tokens a menos.
Dessa forma você pode enviar para o Claude documentos de até 500 páginas que ele irá “ler”, interpretar e responder perguntas e solicitações a partir deles. Com isso, é possível conversar sobre demonstrações financeiras, bases de códigos e até livros como A Ilíada ou A Odisseia.
Algo impressionante!
No entanto, apesar de ter a maior maior janela de contexto do mercado, nem sempre o Claude irá responder fatos verídicos sobre os seus documentos, podendo alucinar informações.
O gráfico abaixo mostra um teste feito com o modelo. No teste, foi fornecido um documento que preenchia toda a sua janela de contexto e perguntas sobre diferentes partes do arquivo foram feitas.
De acordo com a veracidade das informações geradas pelo Claude sobre cada parte, criou-se uma escala - na qual verde significa que 100% das informações foram recuperadas precisamente e vermelho 0%.
Como você pode ver, existem vários “pontos cegos”. Assim, ter essa janela de contexto tão grande não significa muito se ele não consegue responder de forma minimamente precisa sobre grande parte do contexto.
Comparando novamente com o GPT-4 Turbo, quando o modelo foi submetido ao mesmo teste, ele se saiu bem melhor:
Observando os gráficos, é possível notar que ambos os modelos têm mais facilidade de recuperar dados que estão bem no início ou no fim dos documentos. Então quando for utilizá-los para ler os seus, leve isso em conta.
Continuando a falar sobre o Claude 2.1, mesmo ele não sendo tão preciso quanto o ideal lendo documentos, ele melhorou 30%, em termos de precisão, quando comparado ao 2.0. Isso indica que ele está melhorando rapidamente.
Finalmente, outra novidade bem interessante é que o modelo também obteve ganhos significativos em honestidade, com uma redução de 2x nas declarações falsas em relação ao Claude 2.0. Tal fato aumenta a confiabilidade no modelo e aumenta as possibilidades de uso em aplicações comerciais.
Por enquanto nada de rumores de AGI na Anthropic, mas ela continua melhorando seu modelo e se mantendo firme como a principal adversária da OpenAI.
3 atualizações de AI do Google
O Google vem lançando uma série de recursos e ferramentas de Inteligência Artificial relevantes, como a de geração de música que falamos na semana passada.
Nessa semana resolvi trazer três atualizações de AI do Google para te deixar por dentro do que o gigante da busca anda fazendo:
Lançamento do Gemini adiado: No início deste ano, relatamos criação do Google DeepMind - uma combinação do laboratório de pesquisa do Google com o DeepMind (laboratório de AI adquirido pelo Google, mas que trabalhava de maneira independente).
Essa junção de forças teve como objetivo iniciar o desenvolvimento de um novo modelo de AI para competir com o GPT-4 da OpenAI. Esse modelo se chama Gemini e é a maior aposta do Google para se manter relevante nessa corrida das AIs, já que a empresa decepcionou a todos ao não ser capaz de lançar modelos realmente competitivos até agora.
Assim, o Gemini estava programado para ser lançado em agora em Novembro.
No entanto, de acordo com o The information, o seu lançamento foi adiado e está previsto apenas para o primeiro trimestre de 2024.
E quanto mais o tempo passa, mais expectativas e desconfianças se criam sobre o que está sendo desenvolvido.
Bard conectado ao YouTube: se o Gemini não está perto de ser lançado e integrado ao Bard, o Google está trabalhando para melhorar o seu assistente de outras formas. Já tendo conectado o Bard a aplicações como Maps, Flights e YouTube, dessa vez o Google está aprimorando uma destas integrações.
Agora o Bard, além de recomendar vídeos do YouTube, também é capaz de resumir os vídeos para usuários que não têm tempo para assisti-los. Este recurso é muito útil e para utilizá-lo basta enviar o link ou o nome do vídeo para o Bard e pedir um resumo.
Vale lembrar que essas extensões do Bard às aplicações do Google, no momento, só está disponível para usuários residentes dos EUA. Então você pode acessar usando VPN ou esperar, que em breve ele deve ser disponibilizado para o Brasil.
Google Search Generative Experience (SGE) agora disponível pro Brasil: como já relatamos em outras newsletters, o Google está integrando AI na sua ferramenta de busca, o que significa que sempre que buscarmos por algo, teremos um assistente de AI nos respondendo.
Até então, esse recurso estava disponível, de maneira experimental, apenas para residentes dos Estados Unidos. Mas agora o experimento foi estendido para mais países, incluindo o Brasil.
Para aderir a esse experimento é bem simples, basta clicar no ícone do “béquer” que fica em um dos cantos do buscador e ativar o SGE.
Esse novo recurso de AI torna as buscas muito mais rápidas e eficientes e mudará bastante o que sabemos sobre SEO.
Essas são as últimas novidades de AI do Google nesse mês. A empresa está sendo cautelosa, mas aos poucos vai lançando recursos interessantes em suas ferramentas.
Estamos ansiosos pelo Gemini, então vamos aguardar e trazer novidades assim que tivermos acesso!
Indicações
tldraw
Transforme simples rabiscos em designs de qualidade, aplicações funcionais, obras de arte e muito mais. Imagine, desenhe e deixe que a AI torne realidade!
Runway TV
Repositório de videos gerados por Inteligência Artificial através da ferramenta Runway.
Dica de Uso
Para conseguir as melhores respostas das AIs é muito importante escrever os prompts certos. Usando determinadas palavras, você consegue "desbloquear" capacidades desses modelos!
Uma das frases que, se incluída em seus comandos, melhora de maneira significativa o resultado de ferramentas de Inteligência Artificial, como ChatGPT e Claude, é:
“Aja como um [profissional relacionado ao que você está pedindo] com 30 anos de experiência…”
Esse comando irá fazer com que você obtenha respostas menos convencionais e mais completas. Lembrando que você pode obter resultados ainda melhores se usar prompts mais elaborados, como já ensinamos aqui.
Pensamento do Dia
"The greatest shortcoming of the human race is our inability to understand exponential growth"
- Albert Bartlett
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até segunda!