Retrospectiva - Inteligências Artificias 2024
Seja bem-vindo(a) à nossa segunda retrospectiva das AIs!
Reunimos tudo que houve de mais relevante no universo das Inteligências Artificiais Generativas em 2024 e montamos uma retrospectiva completa. Com ela, você poderá recapitular os fatos e ficar por dentro daquilo que você perdeu (é difícil acompanhar tudo!).
No final da retrospectiva, damos uma prévia do que esperar para 2025 em relação às Inteligências Artificiais e seus desenvolvimentos.
2024
Em 2024 vimos os avanços no campo das AIs continuarem no mesmo ritmo, ou até mais rapidamente, que em 2023!
Neste ano, as AIs tiveram um crescimento absurdo em termos de adoção. E hoje é bem mais difícil conhecer alguém que nunca tenha experimentado uma ou outra ferramenta.
Tivemos um ano de grandes saltos evolutivos, nos mais diversos tipos de AI. Até hoje me impressiono com cada lançamento - e admito que não é fácil acompanhar tantas novidades.
Assim, separei o tudo que aconteceu mês a mês.
Contudo, vale ressaltar que alguns fatos podem ter escapado a minha memória ou não terem sido colocados na ordem exata. Mas me esforcei para cobrir o máximo de eventos possíveis para dar a perspectiva completa do que se passou neste ano.
Sem mais delongas, fiquem com nossa retrospectiva 2024!
Janeiro
New York Times processa OpenAI por violação de copyright.
GPT Store é lançada no ChatGPT, permitindo o acesso a milhares de GPTs criados pelos usuários.
Milhares de especialistas preveem o futuro das AI e seus impactos em um novo estudo.
OpenAI lança o ChatGPT Team, plano pago do ChatGPT para empresas.
Mark Zuckerberg anuncia que o novo e principal objetivo da Meta é desenvolver uma Artificial General Intelligence (AGI) e torná-la o mais aberta e acessível possível.
Microsoft lança um plano pago para o Copilot, o seu assistente de AI.
Importante universidade americana passa a adotar o ChatGPT em seu currículo.
Google lança Lumiere - o seu melhor modelo de geração de vídeos com AI até então.
ChatGPT ganha a funcionalidade de “memória”.
Fevereiro
Mistral AI lança modelo de código aberto quase tão capaz quanto o GPT-4.
Google lança Genie, um modelo de AI capaz de gerar ambientes 2D interativos ou “jogáveis”.
Gemini causa polêmica ao ser inclusivo até demais na geração de imagens.
Nvidia ganha concorrente no mercado de chips para rodas modelos de AI.
Ideogram 1.0 é lançado e se torna um dos melhores modelos de geração de imagem do mercado - se destacando na geração de texto em imagens.
Março
Elon Musk processa a OpenAI por supostamente desviar de seus princípios fundadores.
Suno V3 é lançado, se torna o melhor modelo de geração de músicas com AI e viraliza na internet.
Devin - o primeiro sistema de AI “engenheiro de software” autônomo - é lançado pela Cognition.
OpenAI explora parcerias com Hollywood para o Sora.
Stability AI e perde o seu CEO e começa a ter cada vez menos protagonismo no universo das AIs Generativas.
Abril
Hume lança EVI, AI capaz de detectar emoções dos usuários a partir da voz.
OpenAI demonstra uma ferramenta de clonagem de voz que desenvolveu, chamada de Voice Engine.
Grok-1.5 é lançado pela xAI e se aproxima bastante do nível do GPT-4 e semelhantes.
É revelado o projeto da Microsoft e da OpenAI de construir um “supercomputador” de 100 bilhões de dólares até 2028.
Stability AI lança segunda versão de seu modelo de geração de músicas, o Stable Audio 2.0.
Udio é lançado e passa a disputar o posto de melhor modelo de geração de músicas com o Suno.
OpenAI abre uma unidade no Japão.
Maio
Google lança o Med-Gemini, modelo de AI especializado na área médica.
Empresa chinesa lança o modelo SenseNova 5.0, que chega muito perto do GPT-4.
Microsoft lança Phi-3, uma série de modelos de linguagem muito pequenos, capazes de rodarem em celulares e com performance nível GPT-3.5.
Junto com o GPT-4o, a OpenAI anuncia um novo e muito melhorado modo de conversa por voz no ChatGPT.
Gemini 1.5 passa a ter uma janela de contexto de 2 milhões de tokens - a maior até hoje.
Google lança Veo, seu modelo de geração de vídeos para competir com o Sora.
Ilya Sutskever, co-fundador e líder do time de “superalinhamento” na OpenAI, deixa a empresa.
A Microsoft acaba de anunciar uma nova categoria de PCs Windows projetados para AI, os “PCs+Copilot”.
Inteligências Artificiais superando 99% dos humanos em tarefas criativas.
Integração de AI no Google Search enfrenta problemas com confiabilidade e veracidade das respostas.
A Scarlett Johansson processa a OpenAI por supostamente “usar sua voz” em seus modelos de Inteligência Artificial.
Junho
Luma AI lança Drem Machine, outro modelo de geração de vídeos de alta qualidade com AI.
Runway lança Gen-3, o seu novo modelo de geração de vídeos com AI e alcança os melhores do mercado.
Ex-funcionário da OpenAI prevê AGI em três anos em um artigo muito interessante.
Ilya Sutskever funda a SSI, startup para o desenvolvimento de uma Superinteligência segura.
OpenAI inclui um ex-General do Exército Americano no seu conselho.
Julho
A OpenAI lança o GPT-4o mini, uma versão reduzida e mais acessível do GPT-4o, para substituir o GPT-3.5.
Sam Altman anuncia startup de AI na área de saúde, chamada Thrive AI Health.
OpenAI anuncia o lançamento da primeira versão da sua ferramenta de busca, o SearchGPT.
Modelos do Google ganham medalha de prata em olimpíada de matemática.
Agosto
Primeira versão de um cientista de AI autônomo é criado pela startup japonesa Sakana AI.
Google lança o Gemini Live - sua nova experiência de conversas por voz com o seu chatbot de AI.
Luma Labs lança o Dream Machine 1.5.
Google atualiza seu modelo de geração de imagens com o Imagen 3
Assistentes de AI que programam de forma quase autônoma, como Cursor AI e Replit Agent, tomam a internet, aumentando, drasticamente, a produtividade de programadores e permitindo que pessoas que não sabem programar criem softwares completos.
Setembro
MiniMax, startup chinesa, lança o Video-01, um modelo de geração de vídeos muito competitivo.
Pesquisadores do Google criam uma versão totalmente gerada por AI do jogo Doom.
Adobe lança seu modelo de geração de vídeos com AI, o Adobe Firefly Video.
Microsoft integra AI ainda mais profundamente nos apps do Microsoft 365.
Modo de Voz Avançado, que utiliza o GPT-4o, é liberado no ChatGPT.
Runway fecha parceria com a Lionsgate para levar AI à produção de filmes e série.
Outubro
OpenAI passa por mudanças internas e perde sua CTO, Mira Murati.
Meta lança o Llama 3.2, que se torna multimodal.
Meta lança um modelo de geração de vídeos com AI, o Meta Movie Gen.
Pika Labs lança a segunda versão do seu modelo de geração de vídeos, o Pika 1.5.
App do ChatGPT é disponibilizado para Windows e para macOS.
Genmo lança Mochi1, modelo de geração de vídeos de código aberto.
Novembro
OpenAI abre uma unidade em Paris.
Dezembro
OpenAI lança um plano de 200 dólares no ChatGPT - o ChatGPT Pro.
Google anuncia o Project Jules - um agente autônomo de programação também em desenvolvimento.
OpenAI libera Sora para todos os assinantes do ChatGPT.
Google anuncia Veo 2, e o modelo de geração de vídeo promete superar o Sora.
Hunyuan Video é lançado e se coloca como melhor modelo de geração de vídeos open source.
Grok, chatbot de AI do Elon Musk, tem seu acesso aberto a todos gratuitamente.
ElevenLabs lança agente de vendas capaz de fazer ligações.
2025 - o que está por vir
Neste último ano, vimos os concorrentes diminuírem a distância em relação à OpenAI. Apesar dela e outras empresas mais pioneiras ainda terem uma vantagem significativa, 2024 mostrou que esse não é um jogo de tão poucos jogadores e que “basta” tempo, poder computacional e talento humano para alcançar resultados semelhantes.
Outro fato marcante deste ano foi o - previsto - salto de qualidade nos modelos de geração de áudios, músicas e vídeos. Os resultados gerados por estes modelos saíram de experimentais e estranhos para muito impressionantes e úteis.
Ainda há um caminho importante a ser percorrido por estes modelos, mas eles estão na direção certa e a pleno vapor.
Em 2024, o mundo do software foi impactado fortemente por novas ferramentas de AI. Ferramentas estas que estão aumentando drasticamente a produtividade de programadores e possibilitando que pessoas com nenhuma experiência em programação - com um pouco de esforço e tentativa e erro - criem softwares completos .
Finalmente, talvez o fato mais importante de 2024 tenha sido o lançamento da linha de modelos “o” da OpenAI.
O o1 estabelece um novo paradigma no meio. Agora os modelos não terão suas capacidades limitadas apenas pelo seu tempo de treinamento ou pelo seu número de parâmetros, mas também pelo tempo seu tempo de inferência (tempo que ele passa respondendo, “pensando”).
Mas mesmo com tantos avanços, as AIs ainda vêm sendo aplicadas de forma bastante superficial pela maior parte das pessoas - falta conhecimento sobre o que usar e como usar. Porém, isso não é nenhuma surpresa.
Mas falando de 2025, o que podemos esperar?
Modelos de AI que geram vídeos, áudios e músicas vão continuar evoluindo e, muito provavelmente, atingirão o nível de qualidade humana ainda neste ano - sendo integrados cada vez mais nos fluxos criativos de profissionais da área.
O campo da programação verá uma explosão de softwares sendo criados, na medida em que os assistentes de programação ficam ainda mais poderosos.
Com a criação de sites, apps e extensões cada vez mais barata, rápida e simples, a chave para o sucesso será a distribuição. Aqueles que souberem explorar canais de marketing para comercializar estes softwares terão uma vantagem importante.
Mas o que mais se fala sobre 2025 são os agentes. Isto é, AIs que serão capazes de planejar e agir de forma autônoma na internet, seja para agir como um assistente pessoal, um pesquisador, um programador ou um vendedor.
OpenAI, Google, Anthropic… Todas as principais empresas já deixaram a entender que o desenvolvimento de agentes será um dos principais objetivos para este ano.
Assim será cada vez mais normal dar uma meta para a AI e vê-la navegando em diversas abas e aplicativos no nosso computador, realizando uma série de tarefas em sequência, e cumprindo esta meta após alguns minutos.
Falando dos grandes modelos de linguagem, podemos esperar o lançamento de um novo e poderoso modelo para substituir o GPT-4o. Além disso, os modelos de raciocínio continuarão a serem explorados e desenvolvidos.
Em termos de capacidades, teremos modelos com janelas de contexto muito maiores e com memória de longo prazo muito mais funcional.
Talvez esses avanços e os ganhos com modelos de raciocínio sejam suficientes para atingirmos uma AGI ainda em 2025.
De qualquer forma, tenho que certeza que será mais um ano de grandes avanços no campo.
Nós vamos continuar acompanhando tudo o que acontece. E se você quiser entender como aplicar AI no seu dia a dia, implementar assistentes de AI dentro do seu negócio ou apenas conversar, estamos sempre a disposição!
Obrigado pela confiança e um ótimo ano a todos!