Nos últimos seis meses, mais ou menos, testemunhamos o grande avanço público e comercial do modelo de linguagem. Por mais impressionantes e úteis que sejam os modelos de IA como ChatGPT e GPT-4, o que vemos é apenas o resultado final finamente polido. Sob a superfície amigável, não vemos os investimentos de $ 100 milhões que foram gastos no treinamento do GPT-4, as pesadas pegadas de carbono que ele deixa para trás ou os trabalhadores mal pagos nos países em desenvolvimento que trabalharam longas horas para filtrar o conteúdo tóxico. para ChatGPT.
Além disso, grandes modelos de linguagem foram treinados em gerações de conteúdo gerado pelo usuário, esforços coletivos e não pagos que agora podemos pagar para acessar. Sob essa luz, as incríveis capacidades dos modelos modernos de linguagem ampla podem ser um pouco enganosas e uma consequência natural da lacuna de conhecimento e poder entre os monopólios de tecnologia e o público em geral. Estamos sendo servidos com um delicioso e caro bife no estilo gourmet, sem saber do trabalho não pago que envolve o abate da vaca e o preparo da carne.
Agora é hora de os legisladores intervirem e regularem o desenvolvimento e o uso da IA. Este trabalho exige que os legisladores sejam extraordinariamente previdentes. Quando uma nova regulamentação, como a Lei de IA da UE , finalmente entrar em vigor, o cenário provavelmente será muito diferente de hoje.
Supostamente, o ChatGPT já quebrou o plano da Comissão da UE de regular a IA . E agora, como o ChatGPT e outros grandes modelos de linguagem estão no radar da Comissão da UE, muitos especialistas, incluindo o CEO da OpenAI, Sam Altman, disseram que a era dos modelos gigantes de IA já acabou .
As grandes empresas de tecnologia estão competindo entre si para capturar a atenção das pessoas com medidas cada vez mais sedutoras, e os legisladores estão ficando várias voltas atrás. A única maneira de a tartaruga vencer o coelho nesta corrida em particular seria se os reguladores pudessem esperar os próximos desenvolvimentos anos e décadas à frente.
A julgar pelos desenvolvimentos recentes, a próxima grande novidade na IA pode muito bem ser agentes autônomos.
Vejo agentes autônomos como a próxima geração de chatbots avançados. Embora o ChatGPT seja útil para realizar tarefas simples baseadas em texto, a próxima geração de chatbots avançados tem muito mais agência. Em outras palavras, eles serão capazes de agir por conta própria, sem muita ou nenhuma influência humana.
Atualmente, a tecnologia para uso generalizado de agentes autônomos não está pronta . No entanto, isso não significa que não devamos ser. Aqui está uma breve visão geral dos desenvolvimentos recentes.
Há um mês, a OpenAI anunciou que havia implementado o suporte inicial para plugins no ChatGPT .
O novo plug-in do navegador da Web permite que o ChatGPT acesse a Internet e recupere informações atualizadas fora de seus dados de treinamento. Uma funcionalidade que os usuários pedem desde a chegada do ChatGPT. Outro novo plug-in da OpenAI é um interpretador de código experimental que pode usar o Python em um ambiente sandbox, lidar com uploads e downloads e facilitar a vida de programadores, bem como de pessoas interessadas em programação sem habilidades na área.
Com plug-ins adicionais para serviços de terceiros, como Klarna, Expedia, OpenTable Shopify, Zapier e Slack, o ChatGPT pode ajudá-lo a escolher as melhores ofertas e descontos, dar dicas de viagem, escrever listas de compras e comprar mantimentos, fazer reservas para jantar, componha e-mails comerciais e envie-os no Gmail ou por meio de mensagens de bate-papo no Slack.
No início deste mês, o Hugging Face publicou um artigo: HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face .
Os autores mostram como o ChatGPT pode atuar como um controlador para gerenciar modelos de IA existentes com o uso da linguagem. Ao conectar o ChatGPT e outros modelos de IA, você pode solicitar ao ChatGPT não apenas para gerar texto, imagem, vídeo e áudio, mas também para identificar e descrever objetos em diferentes formatos de conteúdo.
Por exemplo, você pode enviar um document.jpg para o ChatGPT, pedir que ele recupere algumas informações que você está procurando e fazer com que ele leia o texto em voz alta para você. Ou você pode solicitar que o ChatGPT conte o número de determinados objetos em uma imagem, descreva a imagem em detalhes e faça um vídeo com base na descrição.
Dessa forma, o ChatGPT pode ser usado para resolver tarefas complicadas de IA, aproveitando outros modelos de IA.
Na semana passada, #AutoGPT foi a hashtag mais popular no Twitter. AutoGPTs tornaram-se uma área de estudo e experimentação extremamente popular para desenvolvedores de código aberto.
Em essência, modelos de código aberto como AutoGPT e BabyAGI ou Jarvis da Microsoft visam dar “o cérebro” de grandes modelos de linguagem como braços e mãos GPT 3.5 ou GPT-4 para realizar tarefas com base em uma meta ou objetivo definido. Por exemplo, pode pedir a um AutoGPT para encontrar o melhor e mais barato restaurante nas proximidades e reservar uma mesa. Ou você pode pedir que destrua a humanidade, estabeleça o domínio global e alcance a imortalidade. Com acesso a um grande modelo de linguagem, a internet, e equipado com memória de longo e curto prazo, o AutoGPT passará a se autopromover com tarefas para atingir o objetivo previsto.
Embora o AutoGPTs exija um pouco de habilidade de codificação para configurar e usar, você pode experimentar a versão baseada na web, AgentGPT , para ter um gostinho da experiência.
Em um experimento recente conduzido pela Universidade de Stanford e pelo Google Research, os chamados "agentes generativos" simulam o comportamento humano e agem por conta própria em um mundo simulado que lembra The Sims . De acordo com o jornal :
Ao conectar nossa arquitetura ao modelo de linguagem grande do ChatGPT, manifestamos uma pequena sociedade de vinte e cinco agentes em um ambiente de jogo. Os usuários finais podem observar e interagir com esses agentes. Se um usuário final ou desenvolvedor desejasse que a cidade hospedasse uma festa de dia dos namorados no jogo, por exemplo, os ambientes de jogos tradicionais exigiriam o script de dezenas de comportamentos de personagens manualmente. Demonstramos que, com agentes generativos, basta simplesmente dizer a um agente que quer dar uma festa (..) a festa, tudo a partir desta única sugestão inicial gerada pelo usuário.
Você pode seguir os agentes generativos no ambiente simulado do Sims aqui .
Na minha opinião, a maneira mais simples de pensar em agentes autônomos é como assistentes digitais pessoais. Eles são como mordomos sempre presentes que podem cuidar de nossas necessidades no mundo digital. E ajude com tarefas tediosas que ninguém gosta de fazer. À medida que a IA cresce nas agências, não é difícil imaginar que eventualmente veremos empresas autônomas prosperando sem funcionários ou gerenciamento.
Os agentes autônomos ampliarão a profundidade e a escala dos sérios problemas que enfrentamos com a IA e as mídias sociais já hoje. Questões como privacidade, vício em smartphone, problema de caixa preta de IA, problema de alinhamento, etc. terão significados totalmente novos.
Se você estiver interessado em acompanhar meus escritos sobre essas questões e ainda não o fez, pode se inscrever no The Gap aqui .