Algo muda quando um químico experiente olha para uma rota que outra pessoa desenhou. Em poucos segundos, muitas vezes ele diz que aquilo não vai funcionar - não porque fez um cálculo, mas porque a sequência de decisões simplesmente “parece” errada.
Fazer um software reproduzir esse tipo de julgamento sempre foi um dos desafios mais difíceis da química. Algoritmos conseguem gerar centenas de rotas.
Avaliar essas rotas do jeito que um especialista avaliaria é outra história - e um novo sistema da EPFL mostra que essa diferença pode diminuir.
IA e síntese de moléculas
Na maioria das vezes, a síntese começa pelo fim. Químicos partem da molécula-alvo e trabalham de trás para a frente - uma abordagem chamada retrosíntese. A molécula é “desconectada” em partes menores. Em seguida, pergunta-se quais ingredientes mais simples poderiam reconstruí-la do zero.
Cada desconexão abre novas escolhas. É melhor formar esse anel agora ou mais tarde? Vale proteger aquele grupo frágil, ou é preferível arriscar? Compensa usar uma reação rápida com baixo rendimento, ou outra mais lenta, mas que escala melhor?
Os programas atuais de retrosíntese conseguem listar alternativas em cada etapa. O que ainda não conseguiam fazer de forma consistente era indicar quais combinações de decisões um químico criterioso realmente seguiria.
Foi justamente esse vazio que uma equipa liderada por Philippe Schwaller, químico da École Polytechnique Fédérale de Lausanne (EPFL), decidiu preencher.
Um papel diferente
O grupo de Schwaller desenvolveu uma estrutura chamada Synthegy. Ela usa modelos de linguagem de grande porte, mas não do modo como muita gente imagina. Os modelos não “inventam” a química por conta própria.
Os programas padrão de retrosíntese continuam a gerar as rotas candidatas, apoiados em enormes bases de dados de reações e em décadas de pesquisa sobre como substâncias químicas se combinam. O Synthegy entra em cena depois disso.
Um modelo de linguagem lê cada rota candidata, descrita em texto simples, e avalia o quanto ela se alinha ao que o químico escreveu no início. O químico pode, por exemplo, pedir: evitar grupos protetores. Ou então: formar o anel ciclohexano logo no começo.
A partir dessa instrução, o modelo atribui uma pontuação a cada rota, ordena as opções e detalha o motivo da avaliação.
Rotas em linguagem simples
À primeira vista, mudar a interface pode parecer pouca coisa. Não é. Ferramentas antigas dependiam de filtros rígidos - reações proibidas, preferências “engessadas” no código, limites numéricos - e, para fazer o programa “pensar” de outra forma, o químico precisava reensiná-lo escrevendo novas regras.
Com o Synthegy, o mesmo químico digita uma frase. O software que gera as rotas devolve uma lista longa, e o que retorna ao utilizador é um ranking curto dos caminhos que melhor atendem à instrução, cada um acompanhado de uma explicação por escrito.
Com isso, a iteração cai de horas para minutos. Segundo a equipa, avaliar 60 rotas candidatas leva cerca de 12 minutos e custa por volta de US$ 2 a US$ 3 em taxas de computação.
“Com o Synthegy, estamos a dar aos químicos o poder de simplesmente conversar, permitindo que eles iterem muito mais rápido e naveguem por ideias sintéticas mais complexas”, disse Andres M. Bran, primeiro autor do artigo.
Rastreando movimentos de elétrons
A mesma lógica funciona numa escala menor. Mecanismos de reação descrevem, etapa por etapa, como uma reação ocorre - elétrons a mover-se entre átomos, ligações a quebrar e a se formar novamente.
É por meio dos mecanismos que químicos explicam por que uma reação dá certo, e não apenas o que ela produz. O Synthegy consegue percorrer esses movimentos eletrónicos e sinalizar quais sequências fazem sentido do ponto de vista químico.
Além disso, os químicos podem fornecer contexto extra. A temperatura. Uma intuição sobre uma via específica. O modelo usa essas informações para restringir a busca.
Testado por químicos
Em vez de se limitarem a métricas internas, os autores conduziram um estudo duplo-cego. Trinta e seis químicos viram pares de rotas de síntese para a mesma molécula-alvo e tiveram de escolher qual delas combinava melhor com uma instrução escrita.
As escolhas do grupo foram comparadas com as escolhas do Synthegy em 368 avaliações válidas. O sistema concordou com os químicos em 71.2 percent das vezes. Não é perfeito. Ainda assim, os autores defendem que o resultado é alto o suficiente para indicar que o modelo acompanha um raciocínio estratégico real, e não apenas características superficiais do texto.
Até esse estudo, ninguém havia demonstrado que um modelo de linguagem conseguiria classificar centenas de rotas de síntese com múltiplas etapas, confrontando-as com a estratégia declarada por um químico, e ainda concordar com especialistas humanos na maior parte das vezes.
Onde ele falha
O Synthegy também tem limitações claras. Modelos de linguagem menores ficaram perto do aleatório ao julgar rotas, o que torna o sistema dependente dos modelos maiores e mais caros para entregar algo útil.
Em alguns casos, os modelos interpretam errado o sentido em que uma reação ocorre. Isso leva a avaliações incorretas de viabilidade. E, quando as rotas passam de 20 etapas, o sistema começa a ter dificuldade para acompanhar o encadeamento de forma coerente.
Um teste mais restrito
A taxa de concordância de 71.2% vem de um recorte específico do problema. No teste com humanos, os pares de rotas foram limitados a entre 6 e 15 etapas.
Além disso, todas as rotas foram avaliadas contra um único tipo de instrução estratégica. Ainda não se sabe se a mesma taxa se mantém para rotas mais curtas ou para um conjunto mais amplo de instruções.
O que isso viabiliza
O que já ficou claro é que um sistema capaz de pontuar rotas de síntese a partir de instruções em linguagem comum consegue acompanhar as escolhas de químicos especialistas em quase três quartos dos casos - sugerindo que o raciocínio estratégico, que normalmente leva anos para amadurecer, pode ser capturado, ao menos em parte, com a instrução certa.
Em laboratórios de descoberta de fármacos, isso reduz o custo de testar estratégias mais agressivas dentro de prazos apertados. Para estudantes de pós-graduação, coloca o “instinto” de um químico sénior a um comando de distância.
A técnica pode até ser integrada a robôs de síntese automatizada, permitindo que as máquinas executem rotas já triadas por coerência estratégica antes mesmo de qualquer vidraria ser usada.
Uma ferramenta que entende estratégia também consegue fazer crítica. O Synthegy já aponta etapas de proteção desnecessárias e avalia a viabilidade - um tipo de feedback que antes exigia um químico sénior a observar por cima do seu ombro.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário