Meta na quarta -feira revelou seu novo V-Jepa 2 O modelo de IA, um “modelo mundial” projetado para ajudar os agentes da IA a entender o mundo ao seu redor.
V-jupa 2 é uma extensão do V-Jepa Modelo que a Meta divulgou no ano passado, que foi treinado em mais de um milhão de horas de vídeo. Esses dados de treinamento devem ajudar os robôs ou outros agentes de IA a operar no mundo físico, entendendo e prevendo como conceitos como a gravidade afetarão o que acontecerá a seguir em uma sequência.
Esses são os tipos de conexões de bom senso que as crianças pequenas e os animais fazem à medida que seus cérebros se desenvolvem – quando você joga com um cachorro, por exemplo, o cachorro (espero) entenderá como saltar uma bola no chão fará com que ela se recupere ou como deve correr para onde ela pensa que a bola pousará, e não para onde a bola está naquele momento preciso.
A Meta mostra exemplos em que um robô pode ser confrontado, por exemplo, o ponto de vista de segurar um prato e uma espátula e caminhar em direção a um fogão com ovos cozidos. A IA pode prever que uma próxima ação muito provável seria usar a espátula para mover os ovos para o prato.
De acordo com a meta, o V-Jepa 2 é 30x mais rápido que o de NVIDIA Cosmos modelo, que também tenta melhorar a inteligência relacionada ao mundo físico. No entanto, a Meta pode estar avaliando seus próprios modelos de acordo com diferentes benchmarks que a NVIDIA.
“Acreditamos que os modelos mundiais levarão uma nova era para a robótica, permitindo que os agentes da IA do mundo real ajudem com tarefas e tarefas físicas sem precisar de quantidades astronômicas de dados de treinamento robótico”. explicado O principal cientista da Meta da AI, Yann Lecun, em um vídeo.
Deixe um comentário