A NVIDIA lança Nemotron 3 Nano Omni open source multimodal
A NVIDIA divulga o Nemotron 3 Nano Omni, um modelo multimodal de código aberto, integrando visão, voz e linguagem num único modelo, como camada de perceção para agentes de IA. O núcleo é um 30B-A3B MoE, um context de 256K e um throughput de 9x. Suporta entradas como texto, imagem, áudio e vídeo, com saída em texto. Em conjunto com o Nemotron 3 Super/Ultra, é aplicável a cenários como operação de computadores, inteligência documental e compreensão audiovisual, e publica os pesos e os dados de treino, com implementação cobrindo o local, NIM e plataformas de terceiros.
ChainNewsAbmedia·04-28 18:15