- A Nvidia revelou o Alpamayo, uma arquitetura de IA de código aberto que introduz raciocínio humano na condução autónoma, com capacidade de explicar as decisões em linguagem natural.
- A tecnologia usa a camada VLA (vision language action) para interpretar contexto rodoviário e relações entre objetos, não apenas detetar obstáculos.
- O Alpamayo pretende tornar a condução mais transparente, evitando as caixas negras e permitindo que autoridades compreendam o raciocínio por trás de cada manobra.
- A Mercedes-Benz é pioneira na integração, com o novo Mercedes CLA a usar a plataforma Nvidia Drive baseada nesta arquitetura, embora a ativação dependa da legislação local.
- O modelo aberto visa reduzir dependência de sensores caros, potencialmente diminuindo custos a médio prazo, enquanto levanta questões sobre a gestão de alucinações e a segurança do uso em mundo real.
A Nvidia anunciou uma nova arquitectura de IA para condução autónoma que adiciona raciocínio humano ao processo. O Alpamayo, de código aberto, integra-se na plataforma Drive e chega ao mercado em parceria com a Mercedes-Benz. A proposta é deixar de apenas ver o ambiente para interpretar o contexto e as intenções no cenário rodoviário.
Este sistema usa a camada VLA (vision language action) para que o computador de bordo possa entender relações causais entre objetos e ações. Em vez de uma resposta puramente reativa, o Alpamayo tenta explicar, em linguagem natural, por que razão uma decisão foi tomada. O objetivo é aumentar a confiança de utilizadores e reguladores.
A arquitetura aberta permite que a comunidade analise o código e contribua para a melhoria do sistema. Ao disponibilizar modelos de base e o simulador AlpaSim, a Nvidia pretende criar um padrão comum que facilite certificações e reduza o tempo de desenvolvimento por parte dos fabricantes.
Desafio à Tesla
A iniciativa representa um desafio direto à hegemonia da Tesla, que tem defendido um sistema de condução autónoma fechado, baseado em redes neuronais que não são auditáveis por terceiros. Ao contrário, o Alpamayo é disponibilizado como código aberto, com uma estratégia de colaboraçao global.
A Nvidia aposta na abertura para acelerar a evolução do ecossistema. Ao permitir conhecimento partilhado entre universidades, institutos de segurança e reguladores, pretende-se detectar falhas com maior rapidez e promover uma evolução coordenada da tecnologia.
Chegada à estrada e custos
A Mercedes-Benz será pioneira na integração do Alpamayo, com o novo Mercedes CLA a usar a plataforma Nvidia Drive baseada nesta arquitectura. A activação total depende, porém, da legislação de cada mercado. O custo inicial está ligado ao hardware necessário para processar o raciocínio em tempo real, o que pode limitar a inclusão nas gamas ampla no curto prazo.
A avaliação aponta para uma possível redução de custos a médio prazo, caso o raciocínio visual avançado substitua parte dos sensores mais caros. Se o software interpretar o ambiente com precisão semelhante à humana usando câmaras, a dependência de sensores LiDAR dispendiosos pode diminuir.
E as alucinações?
O debate sobre as “alucinações” da IA surge com a integração de modelos de linguagem na condução. A Nvidia assegura que o Alpamayo foi treinado com regras de segurança no AlpaSim, impedindo que o raciocínio viole leis da física ou código da estrada. O objetivo é aumentar a fiabilidade e a transparência das decisões.
Entre na conversa da comunidade