Pular para o conteúdo

Anthropic reúne cristianismo, judaísmo, hinduísmo, sikhismo e igreja mórmon em busca de “princípios éticos” para a IA Claude

Grupo multicultural em reunião ao redor de mesa com notebook exibindo gráfico de rede digital.

Criadores do modelo de IA Claude se reuniram com representantes do cristianismo, judaísmo, hinduísmo, sikhismo e da igreja mórmon para tentar encontrar “princípios éticos” para a inteligência artificial

A Anthropic está ampliando um projeto incomum: buscar referências morais que orientem o seu chatbot, o Claude. Depois de uma sequência de encontros fechados com lideranças cristãs, representantes da empresa - junto com funcionários da OpenAI - participaram, em Nova York, de uma mesa-redonda inter-religiosa chamada Faith-AI Covenant. O objetivo foi discutir ética em inteligência artificial com vozes de diversas religiões.

A iniciativa anterior e a “constituição” do Claude

O encontro em Nova York dá continuidade a uma iniciativa anterior da própria Anthropic. Em abril, a empresa promoveu uma série de reuniões e jantares com 15 líderes cristãos para conversar sobre o “desenvolvimento espiritual do Claude” e pedir orientações sobre moral e comportamento de sistemas de IA.

A Anthropic não detalhou oficialmente de que maneira esse tipo de aconselhamento será aplicado na evolução do Claude. Ainda assim, a empresa há tempos estrutura o modelo em torno da ideia de uma “constituição” - um conjunto de princípios éticos que deveriam guiar as decisões do sistema.

O ponto crítico é que construir uma moral que funcione de forma universal se mostrou bem mais difícil do que os desenvolvedores de IA generativa imaginavam. Dentro da própria Anthropic, há o reconhecimento de um risco: a tentativa de embutir valores morais “bons o suficiente” no modelo pode simplesmente não dar certo.

É nesse contexto que a empresa passou a procurar fontes externas de orientação ética - incluindo organizações religiosas.

Quem coordena os encontros e os próximos países

Segundo a Associated Press, as reuniões são coordenadas por uma organização não governamental suíça chamada Interfaith Alliance for Safer Communities. A ideia é levar encontros semelhantes para outros locais no futuro, com planos citados para China, Quênia e Emirados Árabes Unidos.

As conversas também passaram a contar com a participação de Joanna Shields, política britânica e ex-executiva de tecnologia, conhecida por trabalhos na área de segurança digital.

O que se sabe (e o que não se sabe) sobre o impacto no Claude

Por enquanto, não está claro o quanto essas rodadas de diálogo de fato mudam o comportamento do Claude. As empresas não divulgaram recomendações específicas recebidas de líderes religiosos e tampouco relataram a adoção direta de princípios religiosos no modelo.

Mesmo assim, a movimentação expõe um problema central que a indústria de IA vem enfrentando: modelos de linguagem acabam tomando decisões em situações nas quais não dá para escrever regras rígidas com antecedência.

E não se trata apenas de bloquear respostas perigosas ou conteúdo tóxico. Os desenvolvedores estão tentando preparar as IAs para agir em cenários moralmente ambíguos - por exemplo, quando valores entram em choque e uma decisão errada pode trazer consequências sérias.

A diretora da organização sem fins lucrativos Humane Intelligence, Rumman Chowdhury, avalia que empresas de tecnologia estão, aos poucos, aceitando que não existe uma ética única que sirva para todo mundo. Como ela descreve, o Vale do Silício por muito tempo partiu de uma ideia ingênua: a de que seria possível definir um conjunto único de princípios morais aplicável a todas as pessoas. “Agora os desenvolvedores começam a perceber que isso é praticamente inalcançável e, por isso, recorrem à religião como uma das formas de lidar com a zona cinzenta das decisões éticas”.

Ao que tudo indica, a Anthropic não pretende transformar o Claude em porta-voz de uma doutrina religiosa específica. A busca parece estar mais voltada a padrões morais compartilhados, que ajudem o modelo a se comportar de maneira mais previsível e segura.

Ainda assim, permanece em aberto uma dúvida central até mesmo dentro do setor: a inteligência artificial é capaz de “assimilar” moralidade - ou esses esforços apenas criam a aparência de comportamento ético em sistemas que, na prática, não compreendem nem valores nem as consequências das próprias decisões?

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário