#56 Apple Unindo-se ao Google para Trazer AI ao iPhone, Devin - o Primeiro Sistema de AI Engenheiro de Software - e Elon Musk Torna Grok Open Source
Mais uma semana importante de desenvolvimentos e avanços no universo das Inteligências Artificiais Generativas!
A novidades não param de chegar e aqui você sempre fica por dentro de tudo que é relevante. Os temas de hoje são:
Apple se unindo ao Google para trazer AI para o iPhone; Devin - o primeiro sistema de AI engenheiro de software; Elon Musk torna Grok open source; Crie personas com essa ferramenta de AI; Gere imagens com texto usando esse novo modelo de AI.
News
Apple se unindo ao Google para trazer AI para o iPhone
A Apple tem mantido-se extremamente quieta na corrida dos modelos de Inteligência Artificial Generativa. E isso é bastante curioso tratando-se de uma das maiores empresas de tecnologia do mundo
Há alguns meses todos esperam que a empresa fundada por Steve Jobs lance uma Siri 2.0 e rivalize com a OpenAI e com o Google na disputa do mercado dos assistentes de AI.
Em setembro, parecia que esse momento finalmente chegaria.
Naquela ocasião, falei na newsletter sobre o modelo que a Apple estava desenvolvendo. Seu nome era Ajax GPT e ele era criado por um time de 16 pessoas e custava milhões de dólares diariamente para a empresa.
O Ajax GPT teria mais de 200 bilhões de parâmetros. O que é mais do que os 175 B do GPT-3.5, mas bem menos do que os mais de 1,8 trilhão do GPT-4. Então o esperado era que o modelo superasse ligeiramente o desempenho do GPT-3.5.
Quando escrevi essa newsletter lembro que achei isso muito pouco e, agora, com tantos lançamentos que tivemos desde então, isso parece menos ainda.
Certo, se então o Ajax GPT não era o caminho a ser seguido, qual é?
Vamos pensar em algumas possibilidades:
Um primeiro caminho pode ser adquirir startups de AI que estão em estágio inicial e potencializar as tecnologias inovadoras que elas estão desenvolvendo: segundo um relatório da Stocklytics, a Apple adquiriu um total de 32 startups de AI, liderando as principais empresas de tecnologia nas aquisições do setor.
No entanto, a Apple já lidera esse ranking desde 2017. Ou seja, essa não é uma estratégia nova nem pode ser considerada como a aposta da empresa para alcançar os seus concorrentes.
Um segundo caminho é o desenvolvimento de um outro modelo, além do Ajax, que seja de fato competitivo.
Essa alternativa é bem válida. No início do ano, Tim Cook, CEO da Apple, disse aos investidores que haveria um anúncio significativo relacionado à AI e que ele seria um “grande avanço”.
E, recentemente, a Apple lançou um artigo relatando a construção de um modelo de AI chamado MM1. Esse modelo é multimodal e possui versões em diversos tamanhos, mas a maior delas tem apenas 30B de parâmetros. Mesmo sendo pequeno o modelo foi capaz de se aproximar do Gemini e o GPT-4, principalmente em suas capacidades de “visão”.
Pequeno e poderoso, o MM1 pode ter a combinação ideal para ser a tecnologia de AI para funcionar em um iPhone e estar por trás da nova Siri.
Porém, um terceiro caminho possível surgiu no início dessa semana.
O Bloomberg reportou que a Apple está em conversas com o Google para fechar um acordo de uso de sua AI.
Assim, caso feche o acordo, a Apple irá usar o Google Gemini em seus dispositivos.
Essa parceria seria benéfica para as duas empresas. O Google teria seu modelo de AI sendo utilizado diariamente por mais de 2 bilhões de pessoas e a Apple teria um produto atualizado e com novas possibilidades e capacidades, desbloqueadas por uma tecnologia que está no mesmo nível do GPT-4.
Os dois gigantes da tecnologia já têm uma parceria estabelecida há anos, na qual o Google paga cerca de 20 bilhões de dólares para ser a principal ferramenta de busca nos dispositivos Apple.
E o novo acordo seria uma tentativa de competir com a OpenAI, que está perturbando a ordem do mercado e ainda nem lançou tudo que já desenvolveu.
Qual será o caminho escolhido pela Apple para conectar AI generativa ao iPhone e criar a Siri 2.0, é difícil afirmar. Mas, certamente, essa decisão não pode demorar muito mais e nós traremos atualizações quando ela for anunciada.
Devin - o primeiro sistema de AI engenheiro de software
O primeiro sistema de Inteligência Artificial engenheiro de software acaba de ser lançado. Ele se chama Devin e é capaz de performar ações de programação de forma totalmente autônoma.
A empresa por trás dele é a Cognition. Recém-fundada, ela é formada por verdadeiros gênios (não é exagero - seus fundadores somam 10 medalhas de ouro nas Olimpíadas Internacionais de Informática) e já recebeu 21 milhões de dólares em investimento antes mesmo de lançar seu primeiro produto.
A Cognition é um laboratório de AI focada em desenvolver sistemas com raciocínio aprimorado. E como já falamos aqui na newsletter, muitos acreditam que a chave para a evolução dos modelos de AI atuais em soluções mais poderosas e úteis está na melhoria da capacidade de raciocínio dos modelos.
Assim, a melhor forma de ampliar esse raciocínio é começando por tarefas que envolvem programação - uma atividade extremamente lógica.
Com isso, surgiu o Devin - o engenheiro de software. Ele foi lançado no início da semana e impressionou a todos nas redes sociais.
Devin é como um colega de trabalho incansável e habilidoso, pronto para te auxiliar 24/7 ou concluir tarefas de forma independente para você revisar.
Devin não é um modelo de Inteligência Artificial, ele é um sistema que usa de modelos já desenvolvidos por outras empresas, como GPT-4, Gemini ou Claude 3. Basicamente, ele é uma forma mais complexa, estruturada e inteligente de utilizar estes modelos.
Mas o que o Devin faz que, digamos, o ChatGPT não faz?
Bom, enquanto o ChatGPT apenas gera códigos de acordo com suas solicitações específicas, o Devin é capaz de planejar e executar tarefas complexas que exigem milhares de decisões. Ele relembra o contexto a cada passo, aprende com o tempo e corrige erros.
Além de agir autonomamente, o Devin também é ligado às ferramentas de desenvolvedor, como shell e editor de código.
Você dá uma meta pro Devin (por exemplo: “desenvolver um site para um pet shop”) e ele pensará em todas as etapas necessárias para te entregar isso, planejar, programar cada parte e implantar o código finalizado.
É um agente completo, que pode agir sozinho ou interagindo com você e coletando seus insights e feedbacks.
Na nota de seu lançamento, a Cognition linkou alguns vídeos demonstrando o Devin funcionando na prática. Dá uma olhada nos exemplos de tarefas que ele consegue fazer sozinho:
Bem legal!
Falando de números, Devin foi testado no SWE-bench, um benchmark que mede a capacidade de grandes modelos de linguagem (LLMs) de resolver problemas de software do mundo real.
Nesse teste, Devin foi capaz de resolver incríveis 13,86% dos problemas de forma autônoma.
Antes do Devin, a maior porcentagem de problemas que um modelo de linguagem conseguiu resolver de forma autônoma foi 1,96%. Já obtendo auxílio, a porcentagem máxima alcançada tinha sido de 4,80%.
Um salto enorme!
Para acessar o Devin, é necessário entrar em uma lista de espera e ainda não se sabe o quanto ele irá custar. Mas em breve ele estará com acesso mais amplo e os detalhes de custo serão revelados.
Frameworks como o Devin são o futuro. Essas estruturas que permitem as AIs performarem ações podem ser e serão replicadas em outras áreas fora da programação - a própria Cognition planeja fazer isso e a minha aposta é que a OpenAI lançará algo parecido ainda neste ano.
Ao mesmo tempo que isso trará ganhos enormes de produtividade, isso nos faz pensar o quão vulneráveis quase todas as profissões estão.
E esse é só o começo.
Elon Musk torna Grok open source
Pela terceira semana seguida, Elon Musk aparece na nossa newsletter.
Nas duas últimas semanas, falamos sobre o seu processo contra a OpenAI.
Nesse processo, Musk pede que OpenAI seja obrigada a tornar sua pesquisa e tecnologia disponíveis ao público e não use os seus ativos, como o GPT-4, para ganhos financeiros da Microsoft ou de qualquer indivíduo
Mas ele entrou em contradição ao pedir isso.
Musk também possui seu próprio modelo de Inteligência Artificial - o Grok - e sua tecnologia não era aberta para o acesso de todos. Então como poderia pedir que o GPT-3.5/GPT-4 fosse open source se nem o Grok era?
Nessa semana esse problema foi solucionado.
A xAI disponibilizou publicamente o código e a arquitetura base do Grok-1. O modelo pode ser acessado e baixado por qualquer um, gratuitamente - apesar de necessitar um computador bem poderoso para rodar.
O Grok-1 tem 314 bilhões de parâmetros e usa uma arquitetura chamada de Mixture-of-Experts (MoE).
Já falamos da MoE, nela o grande modelo é dividido em pequenos modelos especialistas, que são ativados de acordo com a relevância em relação ao tipo de input do usuário. Isso faz com que o modelo requeira bem benos poder computacional para funcional, o que o torna mais rápido e barato.
O modelo foi desenvolvido do zero pela xAI.
Mas o que impressiona sobre ele é o fato de ter tantos parâmetros - quase o dobro do GPT-3.5 - e um arquitetura sofisticada e mesmo assim superar o GPT-3.5 por pouco e perder para modelos bem menores.
Dá uma olhada na performance do Grok-1 comparado com alguns outros modelos:
Alguns especulam que o fato do Grok não ser melhor do que isso se dê por um problema em sua arquitetura MoE ou pelos dados usados no seu treinamento - talvez foi utilizado uma quantidade de dados inferior a dos demais modelos de ponta.
De qualquer maneira, agora que o Grok é open source, ele será testado e refinado pela comunidade. Em breve, versões aprimoradas dele surgirão.
Estou ansioso pelo o que será criado a partir dele, afinal este é, de longe, o maior LLM open source do mundo.
E a próxima versão do Grok já está em desenvolvimento e provavelmente será aberta como a primeira.
Nessa Musk acertou.
Indicações
Big AGI
Crie personas de AI especializadas em diversos propósitos usando os principais modelos de AI do mundo.
Ideogram
Utilize o novo modelo da Ideogram para gerar imagens de alta qualidade contendo textos.
Dica de Uso
Use o Claude 3 para melhorar os seus prompts para você. O modelo é excelente em escrita e pode te ajudar a criar comandos melhores para usar nele ou em outras AIs de sua preferência.
Basta usar o prompt abaixo e dar a ele uma ideia geral do que você deseja alcançar:
Abaixo, tenho um esboço do meu prompt e o objetivo que pretendo alcançar com ele. Levando em conta esse objetivo, torne o meu prompt mais claro e fácil de entender para um LLM.
<objetivo>
[insira seu objetivo aqui]
</objetivo>
<promptOriginal>
[insira o prompt que deseja melhorar aqui]
</promptOriginal>
<promptMelhorado>
</promptMelhorado>
Com isso, seu comando será aprimorado e você conseguira obter melhores resultados com ele.
Obs: o prompt foi formatado em uma forma otimizada para o Claude 3 e funciona melhor nele, mas você pode experimentá-lo no GPT-4 ou no Gemini e ver se o resultado é satisfatório.
Pensamento do Dia
O mundo mudará tanto nos próximos 1-5 anos que pensar em como as próximas décadas serão se tornou um enorme - e quase impossível - exercício de imaginação.
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até semana que vem!