#86 Lançamento do Operator, Impacto do DeepSeek-R1 e Projeto Stargate de U$500 Bilhões
Seja bem-vindo(a) a mais uma newsletter do Revolução AI. Aqui você não perde nada sobre o universo das Inteligências Artificiais Generativas!
Tivemos tantos assuntos relevantes nessa semana que a edição de hoje conta com uma notícia bônus! Os temas de hoje são:
Lançamento do Operator, o novo agente autônomo da OpenAI; DeepSeek-R1 repercute e Nvidia sofre; Projeto Stargate - U$500 bilhões para infraestrutura de AI; Notícia Bônus: o3-mini e atualização no ChatGPT Canvas; Use o Claude com citações; Descubra sobre o mundo a sua volta com essa AI.
News
Lançamento do Operator, o novo agente autônomo da OpenAI
A OpenAI acaba de lançar o Operator - o seu novo agente, capaz de realizar tarefas de maneira autônoma na internet.
Ele é como o agente lançado pela Anthropic há três meses, o Computer Use.
O Operator fica dentro do ChatGPT e foi desenvolvido para executar tarefas diretamente na web, utilizando seu próprio navegador.
Ele é capaz de preencher formulários, realizar compras, agendar compromissos e interagir com interfaces gráficas de forma autônoma, como clicar em botões, digitar informações e rolar páginas.
Tudo que o usuário precisa fazer é determinar qual tarefa o Operator deve cumprir e ele irá navegar pela internet, passando por páginas e clicando em botões até finalizá-la.
A tecnologia por trás dele é um modelo chamado de Computer-Using Agent (CUA), que combina capacidades de visão do GPT-4o com raciocínio avançado fruto de aprendizado por reforço. Com essas características, ele é capaz de interagir com os elementos gráficos da web.
O Operator “vê” as páginas por meio de capturas de tela e interage com elas de todas as formas que um teclado e mouse permitem - podendo agir sem necessitar de integrações de API específicas.
Quando ele encontra por problemas durante sua navegação ou precisa que o usuário faça algum login ou tome uma decisão importante, ele pausa e o usuário pode intervir de forma pontual.
É uma interação bem fluida. Você pode ver ele em ação aqui.
Atualmente, o Operator se sai melhor para executar tarefas repetitivas e operacionais, como:
Preenchimento de formulários e planilhas;
Fazer reservas e compras online;
Fazer pesquisas em diferentes sites;
Dentre outras coisas.
Em termos de performance, quando comparado com outros agentes nos principais benchmarks do mercado, WebArena e WebVoyager, o Operator obteve a maior pontuação por um agente de AI até a presente data - mas ainda fica um pouco distante da performance de humano.
Assim, apesar de ser um grande avanço, ele ainda tem limitações importantes.
Ele pode enfrentar dificuldades em lidar com interfaces mais complexas, como criar apresentações de slides ou gerenciar calendários detalhados, e com fluxos de trabalho muito longos. Ele também tem seu acesso bloqueado em alguns sites. Além disso, não realiza tarefas de alta sensibilidade, como transações bancárias ou decisões críticas que exijam julgamento humano.
Fora o fato que ele comete alguns erros e se confunde com certa frequência.
Porém, sua performance é incrível comparado com o que tínhamos há um ano e ela vai só melhorar daqui pra frente.
Por enquanto, o Operator só está disponível para assinantes do ChatGPT Pro (que custa 200 dólares) localizados nos EUA. Então se você é um desses assinantes e tem VPN, é só clicar aqui para acessar.
Contudo, muito em breve, ele estará disponível para os assinantes dos demais planos - Plus, Teams e Enterprise - e via API.
A OpenAI também planeja lançar outros tipos agentes nas próximas semanas e meses. Então vamos acompanhar, pois os agentes são o futuro e é muito bom começar a vê-los na prática, de forma concreta e cada vez mais acessível.
DeepSeek-R1 repercute e Nvidia sofre
Na semana passada falamos sobre o lançamento do DeepSeek-R1, modelo de AI chinês especializado em raciocínio criado para competir com o o1, da OpenAI.
Ressaltei que esse lançamento era incrível, considerando que o R1 performava no nível do o1, custando quase um centésimo do valor e ainda sendo de código aberto.
Contudo, a repercussão do DeepSeek-R1 ao redor do mundo foi muito maior que eu esperava. Desde que o ChatGPT foi lançado, nunca tinha visto tantas pessoas fora da “bolha” de AI falando sobre um novo modelo.
Até minha mãe me perguntou sobre esse modelo chinês que estavam falando nos jornais.
E isso não é só a minha percepção: as buscas por “deepseek” no Google superaram as buscas por “chatgpt” ou qualquer outro modelo de AI:
Junto desse interesse massivo pelo DeepSeek-R1, houve uma queda de quase 15% nas ações da Nvidia - empresa que produz chips de AI e que, antes desta queda, era a corporação mais valiosa do mundo.
Mas o que explica tamanho interesse no novo modelo da DeepSeek e essa queda nas ações da Nvidia? Afinal, a OpenAI já teve seus modelos alcançados por concorrentes antes - por que agora é diferente?
Bom, esta não é uma pergunta simples de responder, mas alguns fatores explicam a magnitude da repercussão do R1:
Acessibilidade: enquanto para acessar o o1, da OpenAI, é necessário assinar o ChatGPT Plus (que custa 20 dólares) ou pagar um valor relativamente alto pelo uso via API, o DeepSeek-R1 pode ser utilizado de forma totalmente gratuita na plataforma da empresa e por um custo muito acessível via API.
Primeiro contato com esse tipo de modelo: por conta dessa acessibilidade, o R1 é o primeiro contato de muitas pessoas com um modelo de raciocínio avançado - que passa um tempo pensando antes de responder. E para quem nunca viu o o1 em ação, ver o R1 respondendo a questões complexas, que nem GPT-4o ou Claude 3.5 Sonnet são capazes de responder, é realmente impressionante.
Custo de treinamento: os desenvolvedores do R1 afirmam que gastaram menos de 6 milhões de dólares para treinar o modelo e, para isso, utilizaram muito menos poder computacional que a OpenAI precisou para treinar o o1.
Código aberto: o fato de um modelo dessa capacidade e performance ter código aberto é algo inédito. Qualquer pessoa ou empresa pode baixá-lo e utilizá-lo localmente e de graça.
Velocidade: a DeepSeek foi capaz de alcançar o o1 em apenas 4 meses. Até então, acreditava-se que a OpenAI tinha uma vantagem de cerca de 6 meses a 1 ano em relação a outras empresas - principalmente às chinesas.
Basicamente, a DeepSeek lançou um modelo de fronteira, fez isso de forma extremamente eficiente e barata e disponibilizou para qualquer pessoa acessar praticamente de graça.
Ok, mas e as ações da Nvidia?
A Nvidia produz chips (GPUs) que são utilizados tanto para o treinamento de novos modelos quanto para rodar modelos treinados.
Como a DeepSeek conseguiu desenvolver um modelo tão avançado como o R1 com pouco poder computacional (poucos e não tão capazes GPUs), muitos começaram a questionar a necessidade de tanto poder computacional para treinar novos modelos no futuro.
Com isso, o mercado viu a posição futura da Nvidia ameaçada, pois, em tese, não haveria uma demanda tão grande por seus chips no futuro.
Porém eu acredito que essa noção é um pouco equivocada.
Se a DeepSeek descobriu uma forma muito mais eficiente e barata de treinar modelos de AI, as outras startups do meio vão aprender com ela e aplicar tais técnicas no treinamento de seus modelos.
Então, com tais ganhos de eficiência, essas startups vão começar a usar menos poder computacional? Não, pelo contrário, elas vão simplesmente continuar utilizando o mesmo poder computacional + os ganhos de eficiência para treinar modelos ainda melhores e capazes.
E na medida que esses novos modelos são criados e custam menos para os usuários, mais pessoas vão passar a utilizá-los e, consequentemente, mais poder computacional será necessário para rodá-los.
Em suma, poder computacional atualmente é um gargalo e qualquer ganho de eficiência é positivo para acelerar o desenvolvimento das AIs. O que significa que os chips da Nvidia são mais necessários do que nunca.
Desta forma, ao meu ver, o lançamento do DeepSeek-R1 beneficia a todos do mercado: Nvidia, laboratórios de AI, startups e consumidores. A partir dele, teremos modelos mais baratos e mais capazes, sendo lançados cada vez mais rapidamente.
Projeto Stargate - U$500 bilhões para infraestrutura de AI
A OpenAI anunciou na última semana o Stargate Project (ou Projeto Stargate), uma nova empresa que está sendo criada com a intenção de investir, nos próximos quatro anos, 500 bilhões de dólares para construir uma nova e massiva infraestrutura de AI.
Nós falamos dos rumores acerca deste projeto em abril do ano passado. E tudo indica que ele será muito maior do que o imaginado.
Os fundadores deste projeto, além da OpenAI, são SoftBank, Oracle e MGX - além de contar com a parceria de outras empresas, como Microsoft, Arm e Nvidia.
A ideia com o Stargate é criar uma infraestrutura para desenvolver e rodar as Inteligências Artificiais no presente e em um futuro próximo. Construir uma espécie de “supercomputador” para suportar toda a demanda por poder computacional por parte da OpenAI nos próximos anos.
De imediato, serão investidos 100 bilhões de dólares nesta infraestrutura e outros 400 bilhões ao longo de quatro anos.
Um investimento simplesmente absurdo - um quarto do PIB anual brasileiro.
A OpenAI acredita que isso é o necessário para atingir uma AGI e garantir o protagonismo dos Estados Unidos no futuro, em uma espécie de reindustrialização americana.
É muito investimento. Muito mesmo.
E isso só demonstra que ainda não estamos nem arranhando a superfície em relação aos impactos transformadores das AIs nos próximos anos.
Eles estão se preparando para um mundo onde teremos AIs tão inteligentes ou mais inteligentes do que nós, sendo amplamente adotadas em todos os setores da economia, agindo de maneira autônoma e promovendo desenvolvimento científico e econômico em uma velocidade nunca antes vista.
É bom que fiquemos de olho em tudo isso e nos preparemos também.
Notícia Bônus: o3-mini e atualização no ChatGPT Canvas
Para finalizar, duas notícias bônus e rápidas envolvendo o ChatGPT (a OpenAI está dominando essa newsletter).
O o3 mini - a versão menor, mais barata e eficiente do o3, sucessor do o1 - está prestes a ser disponibilizado para todos o usuários do ChatGPT Plus, Pro e Teams. Esse modelo é bem melhor que o o1 e o R1, então vale a pena ficar ligado para testar.
E o ChatGPT Canvas acaba de ganhar dois upgrades importantes. Agora o Canvas é capaz de renderizar códigos em react e HTML - assim como nos Artifacts do Claude - e é possível usar o o1 dentro dentro da ferramenta.
Indicações
Claude com citações
Agora é possível fazer com que o Claude forneça citações precisas, verificáveis e confiáveis quando estiver respondendo perguntas sobre documentos. Disponível via API.
Storyrabbit
Tenha um guia turístico pessoal e personalizado de onde você estiver. Descubra sobre o mundo a sua volta com essa AI.
Dica de Uso
A cada dia, o universo das AIs fica mais complexo e difícil de acompanhar.
Até outro dia, tínhamos só o GPT-4. Hoje, temos modelos tradicionais e sucessores do GPT-4, como GPT-4o, Claude 3.5 Sonnet e Gemini 1.5 Pro, temos modelos de raciocínio, como o o1 e o DeepSeek-R1 e temos os agentes, como o Operator e o Computer Use.
Com essa crescente em complexidade e tipos de modelos e ferramentas, as vezes é difícil entender qual usar em cada situação específica.
Por conta disso, é fundamental que você experimente todas essas possibilidades o quanto antes, para que você desenvolva uma boa percepção de quais tarefas são ideais para os modelos tradicionais, quais são ideais para os modelos de raciocínio e quais são ideais para os agentes.
Comece agora mesmo, testando o R1, por exemplo, compare com modelos tradicionais, entenda em quais tipos de tarefas ele se saiu melhor ou pior e anote suas observações.
Crie este hábito e será bem mais fácil navegar na complexidade dessas novas tecnologias.
Pensamento do Dia
Em uma era onde tudo vira notícia, é importante saber com o que se impressionar.
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até semana que vem!