Pular para o conteúdo

MFTI desenvolve Un-ViTAStereo, estereovisão para robôs e carros autônomos

Carro esportivo branco futurista em exposição moderna com display holográfico ao lado, ambiente iluminado.

Cientistas planejam criar uma rede neural autoaprendente capaz de se adaptar a diferentes ambientes

Tecnologia de estereovisão Un-ViTAStereo

Pesquisadores do MFTI (Instituto de Física e Tecnologia de Moscou) e de centros internacionais de investigação criaram a tecnologia de estereovisão Un-ViTAStereo, pensada para permitir que robôs e carros autônomos percebam o mundo em 3D, sem pontos cegos. Segundo a assessoria de imprensa do MFTI, o algoritmo calcula a distância até os objetos sem recorrer a lidars caros nem a marcação manual de dados, o que torna a solução mais acessível e aplicável a diferentes cenários.

Treinamento com o Depth Anything V2

O Un-ViTAStereo é treinado com o apoio do modelo Depth Anything V2, que estima a profundidade relativa dos objetos a partir de uma única imagem, identificando sombras, perspectiva e sobreposições. Com isso, o algoritmo consegue selecionar apenas as previsões que estão alinhadas com as pistas fornecidas pelo “mentor”, aumentando a precisão do método.

Processo em três etapas e resultados no KITTI 2015

O funcionamento do sistema é dividido em três fases: primeiro, cada pixel é verificado para confirmar se corresponde às pistas; em seguida, para os pontos vermelhos, são procurados vizinhos verdes; por fim, os contornos são formados com o uso de uma função de suavização de disparidade. Como resultado, a proporção de erros grosseiros no teste de carros autônomos KITTI 2015 caiu para 5%, o que representa 23% menos erros perigosos na determinação das distâncias até os objetos.

Próximos passos no MFTI

O MFTI ressalta que a versão atual do Un-ViTAStereo é apenas o ponto de partida. Os cientistas pretendem desenvolver uma rede neural autoaprendente, capaz de se ajustar a diferentes ambientes, e também empregar medições precisas de lidars para elevar ainda mais a exatidão. O estudo foi publicado na IEEE Transactions on Circuits and Systems for Video Technology.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário