#54 Anthropic Lança Claude 3 e Supera GPT-4, Elon Musk Processando a OpenAI e MultiOn - AI que Realiza Tarefas por Você
Mais uma semana importante e movimentada no universo das Inteligências Artificiais Generativas!
E como aqui você não perde nada, a newsletter #54 está repleta de assuntos interessantes e relevantes. Os temas de hoje são:
Anthropic lança Claude 3; Elon Musk processa a OpenAI por desviar de seus princípios fundadores; MultiOn - AI que realiza ações por você; Assistente de AI para finanças no Excel; Modelo de AI brasileiro.
News
Anthropic lança Claude 3
A Anthropic (start-up fundada por ex-funcionários da OpenAI) acaba de lançar o Claude 3, o seu novo grande modelo de linguagem (LLM) para concorrer com o GPT-4 e com o Gemini.
E algumas evidências indicam que ele está assumindo o posto de melhor modelo de AI do mundo.
Antes de falar do novo modelo, vale ressaltar que, como já mencionamos aqui, o Claude é um modelo de AI Constitucional.
Isso significa que ele tem o seu "comportamento" moldado por uma série de princípios e, diferentemente dos outros modelos, ele não aprende como agir via feedback humano. Ele apenas segue as suas regras fundamentais e pré-estabelecidas.
Como resultado disso, o Claude é mais confiável e menos ofensivo que os demais modelos.
Feita esta breve explicação, vamos ao que interessa: o Claude 3.
A terceira versão do grande modelo de linguagem da Anthropic é capaz de interpretar textos e imagens - incluindo longos documentos de texto contendo imagens e gráficos. E o modelo gera apenas textos - e códigos - como resposta.
O Claude 3 vem em três formatos distintos, cada um com capacidades e preços específicos:
Opus: o mais capaz dos três, superando modelos concorrentes como o Gemini e o GPT-4 em praticamente todos os testes de referência - como vamos falar mais abaixo. Esse também é o modelo que requer maior poder computacional, então custa mais caro que os outros - você pode ver a tabela de preços clicando aqui.
Sonnet: Oferecendo um equilíbrio ideal entre capacidade e velocidade, o Sonnet se aproxima do desempenho do GPT-4, mas a um custo muito menor. Sendo, assim, um custo-benefício excelente.
Haiku: O modelo mais rápido e econômico, superando o GPT-3.5 por uma margem significativa. Ideal para tarefas mais simples.
Falando de suas capacidades, a sua versão mais poderosa (Opus) superou o GPT-4 e as quatro versões do Google Gemini em todos os testes, como de raciocínio, de conhecimento, de matemática, etc. Dá só uma olhada:
No entanto, existe um “porém” nessa avaliação: ela leva em conta a primeira versão do GPT-4, lançada em março de 2023. Quando comparado à versão atual do modelo, o Claude ainda fica atrás, como você pode ver aqui.
De qualquer maneira, o Claude 3 tem capacidades que ainda o colocam na discussão sobre ser o melhor modelo do mercado.
Isto é, além de suas capacidades nível GPT-4, ele possui uma janela de contexto de 200 mil tokens e que pode ser expandida até 1 milhão de tokens. Ou seja, ele consegue ler e interpretar de uma só vez - e com altíssima precisão - pelo menos dois livros inteiros, na sua versão padrão, e até o equivalente a 10 livros em sua versão expandida.
Quando comparado ao modelo anterior (Claude 2.1), o Claude 3 está:
Mais rápido: a sua versão intermediária (Sonnet) responde em metade do tempo que o Claude 2.1;
Menos propenso a recusas: o novo modelo recusa solicitações dos usuários incorretamente em cerca de 10% das vezes, enquanto o Claude 2.1 recusava em mais de 25% delas - o que era um grande problema.
Mais preciso: o Claude 3 está significativamente melhor em seguir instruções e comandos complexos e em gerar respostas verdadeiras.
Falando da habilidade de interpretar imagens do Claude 3 - recurso não presente nas versões anteriores -, ela supera a do GPT-4 Vision em todos os testes, mas fica atrás da do Gemini 1.0 Ultra.
No geral, o modelo é realmente muito bom. Fazendo uma avaliação subjetiva a partir da minha experiência com o Claude 3 Sonnet na tarde de segunda-feira, posso dizer que ele não deixa a desejar em relação ao GPT-4.
A sensação que tive é que as respostas são mais “humanas” e agradáveis e que, algumas vezes, ele conseguiu entender o que eu queria mesmo sem eu ter explicado direito.
Sem contar que ele é excelente para lidar com textos longos.
Foi uma evolução notável frente ao 2.1.
Essa melhora pode ser creditada, dentre outros fatores, à uma melhora na habilidade de raciocínio do modelo e ao uso de dados sintéticos e de maior qualidade - provavelmente gerados pelo GPT-4 - para treiná-lo.
Em resumo, o Claude 3 é um modelo totalmente comparável ao GPT-4 e ao Gemini, se destacando em custo-benefício, confiabilidade e leitura de documentos. Contudo, ele decepciona por não interpretar áudios e vídeos, por não estar conectado à internet e por não gerar imagens.
Em termos de disponibilidade, o Opus e o Sonnet estão disponíveis imediatamente através da API da Anthropic, agora disponível em 159 países - incluindo o Brasil! O Haiku estará disponível em breve.
E o Sonnet pode ser acessado gratuitamente em claude.ai (mas não ainda no Brasil), enquanto o Opus está disponível para assinantes do Claude Pro.
Com esse lançamento, o Claude se torna o segundo modelo a alcançar o GPT-4. Então é bem improvável que a OpenAI não responda à altura dentro dos próximos meses.
Vamos acompanhar.
Elon Musk processa a OpenAI por desviar de seus princípios fundadores
Elon Musk foi um dos co-fundadores da OpenAI em 2015. Naquela época, a empresa tinha como objetivo desenvolver Inteligência Artificial Geral (AGI) de forma aberta e sem fins lucrativos, para o benefício da humanidade.
No entanto, Musk deixou a OpenAI em 2018, devido a divergências sobre o futuro da empresa e para se concentrar em outros projetos, como a Tesla e a SpaceX.
Ele discordava do fato da empresa ter se tornado uma instituição com fins lucrativos e se aliado à Microsoft.
Após sua saída, Musk tornou-se um crítico das empresas de AI. Ele, inclusive, assinou uma carta em 2023, juntamente com outros especialistas, pedindo uma pausa de seis meses no desenvolvimento de sistemas de Inteligência Artificial mais poderosos do que o GPT-4, da OpenAI, citando grandes riscos para a humanidade e a sociedade.
E no fim do ano passado, ele lançou sua própria empresa de AI, a xAI, com o objetivo de criar uma AI mais verdadeira e menos enviesada.
A xAI desenvolveu o Grok, um chatbot de AI, atrelado ao Twitter (X) e disponível apenas para assinantes da rede, que tem capacidades limitadas - superando apenas o GPT-3.5.
Estou contando toda esta história, pois, na semana passada, Elon Musk entrou com um processo judicial contra a OpenAI e seu CEO, Sam Altman, alegando que eles abandonaram a missão original da empresa de desenvolver IA para o benefício da humanidade e não para fins lucrativos.
O processo alega quebra de contrato e busca obrigar a OpenAI a tornar sua pesquisa e tecnologia disponíveis ao público e impedir o uso de ativos como o GPT-4 para ganhos financeiros da Microsoft ou de qualquer indivíduo.
Um pedido difícil de ser aceito.
Mas, segundo Musk, o GPT-4 e o modelo que a OpenAI está desenvolvendo no momento constituem AGI - em outras palavras, são capazes de realizar qualquer tarefa no mesmo nível ou melhor que os seres humanos - e esse tipo de tecnologia é poderosa demais para estar submetida aos interesses e objetivos financeiros de alguém.
De acordo com o processo, Musk investiu mais de US$ 44 milhões na OpenAI e foi fundamental nos primeiros dias da empresa. No entanto, ele alega que a OpenAI abandonou o acordo estabelecido em sua fundação em 2023 quando lançou o GPT-4 essencialmente “como um produto da Microsoft”.
Nesse memorando eles negam que o GPT-4 seja uma AGI, que a OpenAI tenha abandonado sua missão original e que ela é apenas uma subsidiária da Microsoft. Também é afirmado que Elon Musk buscou ter controle total da OpenAI enquanto ainda estava na empresa - sugerindo até uma fusão com a Tesla - e que o processo é reflexo de um arrependimento por não estar mais na OpenAI.
Realmente o GPT-4 não pode ser considerado uma AGI.
Porém, resta saber qual será a resposta oficial da empresa e como esse caso se desenvolverá.
Musk tem seus méritos em querer uma AI não submetida à nenhuma corporação, uma vez que essa tenologia pode tomar proporções enormes, sendo a responsável por levar à humanidade a um desenvolvimento jamais visto ou, até mesmo, à sua extinção. Pode parecer exagero, mas muitos acreditam em ambos cenários.
Essa disputa está só no começo e será interessante ver no que vai dar.
MultiOn - AI que realiza ações por você
Há pouco mais de um ano, falei na nossa newsletter sobre a empresa de AI Adept. Ela ainda estava desenvolvendo o seu primeiro modelo, mas seu objetivo era criar uma Inteligência Artificial capaz de realizar ações.
Lembro que me empolguei com a ideia, pois achava - e ainda acho - que a próxima fronteira dos modelos de AI é justamente a capacidade de realizar as tarefas por nós de maneira independente.
Desde então, algumas coisas já evoluíram significativamente. A Adept começou a testar sua tecnologia com os usuários (eu fui até um dos convidados para isso), a Rabbit lançou seu dispositivo inteligente que é capaz de executar tarefas e outras tecnologias começaram a ser lançadas no campo.
Uma delas é a da MultiOn. Talvez a que tem mais se aproximado de verdadeiro um agente de AI.
A MultiOn foi fundada por Div Garg e Omar Shaya, dois ex-alunos de Stanford com experiências na Apple, Google, Nvidia, Meta e Microsoft.
A história da empresa começou quando eles se encontraram em uma aula de AI em 2022. Ambos estavam muito atribulados com suas tarefas do dia a dia e pensaram que deveria haver uma forma de melhorar isso.
Surgiu a MultiOn AI, cuja a missão é livrar os seres humanos de tarefas entediantes e repetitivas, liberando-os para se concentrarem no que realmente importa.
Mas o que o MultiOn faz? Realiza tarefas.
Que tipo de tarefas? Qualquer tarefa online - reservar viagens, fazer pedidos online, agendar compromissos, escrever emails e muito mais. Por exemplo, o MultiOn pode reservar um voo com apenas algumas instruções de voz, pesquisando as melhores opções, completando o processo de reserva online e enviando o itinerário para o seu calendário.
Dá uma olhada nesse vídeo demonstrativo.
Como o MultiOn faz isso? O modelo consegue se conectar e interagir com praticamente qualquer site ou aplicativo. Ele pode navegar por interfaces, preencher formulários e concluir fluxos de trabalho complexos, tudo com simples comandos de texto.
Basicamente, você diz a ele qual o seu objetivo ou o que quer que ele faça. Então ele vai planejar as ações que deve realizar para cumprir o que você pediu. Finalmente, ele acessará os sites e aplicativos necessários e interagir com eles da mesma forma que você faria.
Para apps e sites conhecidos como o Gmail, o Uber ou o AirBnb, o agente da MultiOn já sabe o que fazer. Para sites desconhecidos, você pode ensiná-lo como executar as ações nele - basta gravar você realizando a ação uma só vez.
O modelo funciona muito bem e você pode acessá-lo e testá-lo por aqui.
Apesar de ainda não ser perfeito e ter suas limitações, ele é um passo importante para um futuro onde teremos agentes de AI realizando todas as tarefas chatas e repetitivas por nós e deixando-nos livres para fazer o que importa para nós.
Até a OpenAI quer desenvolver seus agentes de AI, então prepare-se para ter o seu próprio JARVIS em alguns meses ou, no máximo, anos.
Indicações
Copilot for Finance
Assistente de AI para finanças diretamente das planilhas de assinantes do Microsoft 365.
Sapiens Chat
Grande modelo de linguagem brasileiro. Vale a pena conferir, mas falaremos sobre ele em breve.
Dica de Uso
Use os chatbots de AI, como Claude, ChatGPT e Gemini, para aprender e praticar novos idiomas.
Uma forma de fazer isso é enviando o seguinte prompt para essas AIs:
Me ajude a aprender [idioma que quer aprender] através do diálogo. Enviarei mensagens para você em [idioma que quer aprender] e após cada mensagem que eu enviar, quero que você faça o seguinte:
Escreva "Mensagem do aluno:" seguida do que você acha que minha mensagem pretendia ser em português.
Escreva "Mensagem ideal para o aluno:" seguida da forma correta de expressar isso em [idioma que quer aprender].
Escreva "Resposta do professor:" seguido da sua resposta à minha mensagem, que deve ser em [idioma que quer responder].
Sou um aluno iniciante, então você deve enviar respostas muito curtas e simples em [idioma que quer prender], para que eu entenda com mais facilidade. Tente manter a naturalidade e incluir uma pergunta para mim em cada resposta que der.
Esse comando é excelente, pois te mostra onde você esta errando e como corrigir, ao mesmo tempo que mantém a conversa rolando.
Vale ressaltar que ele funciona melhor em modelos mais avançados, como o GPT-4, o Claude 3 ou o Gemini.
Pensamento do Dia
Foi necessário quase um ano para que GPT-4 fosse ligeiramente superado por dois concorrentes.
A sensação é que a OpenAI está tão a frente no desenvolvimento de seus LLMs, que chocará o mundo mais uma vez quando lançar o seu próximo modelo (GPT-4.5 ou GPT-5).
Prepare-se.
Por hoje é só!
Se está gostando do nosso conteúdo ou tem algum feedback para dar, sinta-se livre para responder o e-mail ou nos mandar mensagem nas redes sociais. Vamos adorar ler!
Aproveita para nos seguir no Instagram e no Tiktok (@revolucao.ai)!
Não se esqueça de compartilhar a newsletter com um amigo para ganhar prêmios!
Tenha uma ótima semana e até segunda!