NVIDIA e MIT lançam framework Lightning OPD, aumentando 4x a eficiência da distilação de modelos enquanto eliminam problemas de memória da GPU

Segundo as informações, investigadores da NVIDIA e do MIT lançaram o Lightning OPD (Offline On-Policy Distillation), um novo quadro de pós-treino para modelos de linguagem de grande dimensão que elimina a necessidade de manter um modelo “teacher” em funcionamento durante o treino. Ao pré-computar, offline, as log-probabilidades do modelo “teacher”, o quadro melhora a eficiência do treino em 4x, libertando todos os recursos da GPU para o treino do modelo “student”.

Em testes com 8 GPUs NVIDIA H100, o Lightning OPD conseguiu destilar com sucesso o Qwen3-30B-A3B-Base (um modelo MoE com 30 mil milhões de parâmetros) e atingiu 71,0 no benchmark AIME 2024, enquanto o OPD standard ficou sem memória no mesmo hardware. Para o modelo Qwen3-8B mais pequeno, o quadro exigiu apenas 30 horas de GPU para alcançar 69,9 pontos.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A TT Chain integra o sistema de segurança AegisAI para proteção de RWA em 11 de maio

De acordo com o anúncio da TT Chain de 11 de maio, a rede blockchain de camada 2 integrou a infraestrutura de segurança orientada por IA da AegisAI no seu ecossistema de ativos do mundo real. A colaboração reforça a proteção para transações de ativos tokenizados e operações entre cadeias, através de capacidades avançadas de deteção de ameaças e auditoria de contratos inteligentes. Os agentes autónomos de IA da AegisAI detetam ataques de phishing, impedem tentativas de acesso não autorizado e ide

GateNews5m atrás

A startup de IA Wispr em negociações de financiamento a uma avaliação de $2B em 12 de maio

Segundo a PANews, a startup de IA Wispr está em negociações de captação de fundos a 12 de maio, com uma avaliação de 2 mil milhões de dólares.

GateNews11m atrás

Sam Altman vai depor hoje no processo da $38M OpenAI de Musk

De acordo com a BlockBeats, Sam Altman está previsto para testemunhar hoje (12 de maio) em tribunal federal em Oakland, Califórnia, no âmbito do processo de Elon Musk contra a OpenAI. Altman deverá prestar declarações depois de Bret Taylor, presidente do conselho de administração da OpenAI, concluir o seu depoimento. Musk apresentou a ação em 2024, alegando que a OpenAI, Altman e o presidente Greg Brockman violaram a missão original sem fins lucrativos e de benefício público da empresa. Musk afi

GateNews37m atrás

A Depthfirst Encontra Falhas Críticas na Internet a um Décimo do Custo do Mythos da Anthropic

De acordo com a BlockBeats, a 12 de maio, a startup de cibersegurança com IA Depthfirst anunciou que o seu modelo de descoberta de vulnerabilidades de IA desenvolvido internamente encontrou múltiplas falhas de segurança críticas que terão sido falhas pela Mythos, alegando que o custo total foi apenas um décimo do da última. O CEO da Depthfirst, Qasim Mithani, afirmou que a empresa consegue “concluir o trabalho por 1.000 dólares que a Mythos exigiria 10.000 dólares para realizar” ao otimizar a ar

GateNews57m atrás

Os IPO da Cerebras esta semana com uma avaliação de 55 mil milhões de dólares, dando à OpenAI uma potencial participação de 11%

De acordo com a Odaily, o fabricante de chips de inteligência artificial Cerebras vai abrir capital esta semana com uma avaliação de IPO de 55 mil milhões de dólares. O compromisso de investimento da OpenAI de 200 mil milhões de dólares poderá atribuir-lhe uma participação de 11% na empresa.

GateNews1h atrás

A Cerebras vai estrear-se em bolsa esta semana com uma avaliação de 5,5 mil milhões de dólares; a participação de 11% da OpenAI poderá render mais de 5 mil milhões de dólares

Segundo o The Information, o fabricante de chips de IA Cerebras vai abrir capital esta semana com uma valorização de 5,5 mil milhões de dólares num IPO. O compromisso de investimento de 20 mil milhões de dólares da OpenAI poderia dar-lhe uma participação de 11% na empresa, potencialmente gerando mais de 5 mil milhões de dólares em receitas.

GateNews1h atrás
Comentar
0/400
Nenhum comentário