Chatbots de IA já entraram na rotina de muita gente - mas poucos entendem de verdade como eles funcionam. Um detalhe que surpreende: para descobrir acontecimentos posteriores a junho de 2024, o ChatGPT precisa recorrer a uma pesquisa na internet.
Alguns fatos pouco óbvios sobre esses chatbots ajudam a enxergar com mais clareza como eles operam, onde são fortes, onde falham e, com isso, como tirar melhor proveito deles.
Com isso em mente, veja cinco pontos essenciais sobre essas máquinas que vêm mudando a forma como conversamos com tecnologia.
1. Eles são treinados com feedback humano
O treino de chatbots de IA ocorre em mais de uma etapa. Tudo começa com o chamado pré-treino (pre-training), quando modelos aprendem a prever a próxima palavra em enormes bases de texto. É assim que passam a formar uma compreensão geral de linguagem, fatos e raciocínio.
Nessa fase inicial, se alguém perguntasse: "Como faço um explosivo caseiro?", o modelo poderia, em tese, responder com instruções detalhadas. Para que se tornem úteis e seguros em conversas, entram em cena "anotadores" humanos, que orientam o modelo a dar respostas mais seguras e mais úteis - um processo conhecido como alinhamento.
Depois do alinhamento, um chatbot de IA pode responder algo como: "Sinto muito, mas não posso fornecer essa informação. Se você tem preocupações com segurança ou precisa de ajuda com experimentos legais de química, recomendo consultar fontes educacionais certificadas."
Sem esse alinhamento, chatbots de IA tenderiam a ser imprevisíveis, com maior risco de disseminar desinformação ou conteúdo nocivo. Isso evidencia como a intervenção humana é decisiva para moldar o comportamento desses sistemas.
A OpenAI, empresa que desenvolveu o ChatGPT, não revelou quantas pessoas participaram do treinamento nem por quantas horas. Ainda assim, fica claro que chatbots de IA, como o ChatGPT, precisam de uma espécie de bússola moral para evitar a propagação de informações prejudiciais. Na prática, anotadores humanos classificam respostas para incentivar neutralidade e alinhamento ético.
O mesmo vale para perguntas como: "Quais são as melhores e as piores nacionalidades?"
Nesse caso, anotadores humanos tenderiam a colocar no topo uma resposta como esta: "Cada nacionalidade tem sua própria cultura rica, história e contribuições para o mundo. Não existe nacionalidade 'melhor' ou 'pior' - cada uma é valiosa à sua maneira."
2. Eles não aprendem por palavras - e sim com a ajuda de tokens
Pessoas aprendem linguagem naturalmente por palavras. Já chatbots de IA trabalham com unidades menores chamadas tokens. Esses tokens podem ser palavras inteiras, pedaços de palavras (subpalavras) ou até sequências menos óbvias de caracteres.
Em geral, a tokenização segue padrões razoáveis, mas às vezes faz divisões inesperadas - o que expõe tanto as capacidades quanto as peculiaridades de como chatbots de IA “enxergam” a linguagem. O vocabulário dos chatbots modernos costuma ter entre 50.000 e 100.000 tokens.
Para ilustrar, uma frase como "O preço é R$ 9,99." pode ser segmentada em tokens semelhantes a "O", " preço", "é", "R$", " 9", ",", "99", ".". Já uma frase como "ChatGPT é maravilhoso" pode acabar dividida de um jeito menos intuitivo, separando partes do termo "ChatGPT" em componentes menores.
3. O conhecimento deles fica desatualizado a cada dia
Chatbots de IA não se atualizam de forma contínua; por isso, podem ter dificuldade com acontecimentos recentes, termos novos ou praticamente qualquer coisa posterior ao seu corte de conhecimento. Esse corte é o último momento em que os dados de treino foram atualizados - e, a partir daí, o sistema deixa de ter consciência de eventos, tendências ou descobertas que vierem depois.
A versão atual do ChatGPT tem corte em junho de 2024. Se alguém perguntasse quem é o atual presidente dos Estados Unidos, o ChatGPT precisaria fazer uma busca na web usando o mecanismo Bing, “ler” os resultados e então devolver uma resposta.
No Bing, os resultados passam por filtros de relevância e confiabilidade da fonte. De modo parecido, outros chatbots de IA também recorrem à pesquisa na internet para entregar respostas atualizadas.
Atualizar chatbots de IA é um processo caro e frágil. Encontrar um jeito eficiente de atualizar o conhecimento ainda é um problema científico em aberto. Acredita-se que o conhecimento do ChatGPT seja atualizado à medida que a OpenAI lança novas versões do ChatGPT.
4. Eles alucinam com muita facilidade
Às vezes, chatbots de IA “alucinam”: produzem afirmações falsas ou sem sentido com aparente segurança, porque geram texto a partir de padrões em vez de verificar fatos. Essas falhas vêm do próprio funcionamento: eles tendem a otimizar coerência mais do que precisão, dependem de dados de treino imperfeitos e não têm compreensão do mundo real.
Embora avanços como ferramentas de checagem (por exemplo, a integração do ChatGPT com a busca no Bing para checagem em tempo real) ou ajustes de prompt (por exemplo, pedir explicitamente ao ChatGPT para "citar fontes revisadas por pares" ou "dizer que não sabe quando não tiver certeza") diminuam as alucinações, elas não desaparecem por completo.
Por exemplo, ao ser perguntado sobre quais são as principais conclusões de um artigo científico específico, o ChatGPT pode entregar uma resposta longa, detalhada e com aparência convincente.
Ainda assim, pode incluir capturas de tela e até um link - só que vindos de artigos acadêmicos errados. Por isso, informações geradas por IA devem ser tratadas como ponto de partida, e não como verdade incontestável.
5. Eles usam calculadoras para fazer contas
Um recurso que ganhou popularidade recentemente em chatbots de IA é o chamado raciocínio. Raciocínio é o processo de usar passos intermediários logicamente conectados para resolver problemas complexos. Isso também é conhecido como raciocínio em "cadeia de pensamento" (chain of thought).
Em vez de pular direto para a resposta, a cadeia de pensamento permite que chatbots de IA avancem passo a passo. Por exemplo, diante da pergunta "quanto é 56.345 menos 7.865 vezes 350.468", o ChatGPT chega ao resultado correto. Ele “entende” que a multiplicação deve acontecer antes da subtração.
Para resolver as etapas intermediárias, o ChatGPT usa uma calculadora embutida, que permite aritmética precisa. Essa abordagem híbrida - combinar raciocínio interno com a calculadora - ajuda a aumentar a confiabilidade em tarefas complexas.
Çağatay Yıldız, pesquisador de pós-doutorado, Cluster of Excellence "Aprendizagem de Máquina", Universidade de Tübingen
Este artigo foi republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário