Beating informó que Microsoft recientemente publicó como código abierto la familia de modelos Phi-Ground, diseñada para resolver el problema de dónde debe hacer clic la IA en una pantalla de computadora. La versión de 4 mil millones de parámetros, combinada con modelos lingüísticos más grandes para la planificación de instrucciones, superó la precisión de clic de OpenAI Operator y Claude Computer Use en el benchmark Showdown y quedó en el primer lugar entre todos los modelos de menos de 100 mil millones de parámetros en cinco evaluaciones, incluyendo ScreenSpot-Pro.
El equipo se entrenó con más de 40 millones de muestras de datos y descubrió que tres técnicas de entrenamiento comunes usadas en artículos académicos perdieron efectividad a escala. El enfoque clave resultó ser simple: generar coordenadas como números normales, como “523, 417”. Investigaciones previas inventaron vocabularios de posición especializados para coordenadas, pero no lograron escalar. El equipo también descubrió que colocar instrucciones de texto antes de las imágenes mejoró el rendimiento, ya que los modelos podían identificar los objetivos mientras procesaban los píxeles. Además, métodos de aprendizaje por refuerzo como DPO mejoraron la precisión incluso después del ajuste fino.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Cerebras ajusta el rango de precios de su IPO a 150–160 USD por acción el lunes, con una subida del 30%
Según Bloomberg, Cerebras Systems está considerando elevar su rango de precios de IPO a $150–$160 por acción el lunes (12 de mayo), frente a $115–$125, en medio de una demanda en aumento. El fabricante de chips de IA planea incrementar la emisión de acciones de 28 millones a 30 millones de acciones, lo que potencialmente elevaría aproximadamente $4,8 mil millones frente al objetivo original de $3,5 mil millones. Las órdenes de suscripción han superado las acciones disponibles en más de 20 veces,
GateNewsHace29m
El riesgo geopolítico lidera la encuesta de primavera de 2026 de la Reserva Federal, y la IA asciende al tercer lugar
Según una encuesta de la Reserva Federal realizada en la primavera de 2026, los encuestados clasificaron el riesgo geopolítico como su principal preocupación, subiendo una posición frente a la encuesta de otoño de 2025. La inteligencia artificial pasó al tercer puesto desde el quinto, mientras que el crédito privado subió al cuarto desde el noveno. La inflación y el endurecimiento monetario cayeron al quinto lugar desde el tercero, reflejando un cambio en los riesgos económicos percibidos por lo
GateNewshace3h
Google lanza un protocolo de pago para agentes de IA con 120+ socios, incluidos PayPal
Según CoinDesk, ejecutivos de Google Cloud y PayPal analizaron cómo los pagos con criptomonedas impulsarán el comercio guiado por agentes de IA. El responsable de la estrategia Web3 de Google Cloud, Richard Widmann, anunció que Google lanzó el Agentic Payments Protocol (AP2), donado a la FIDO Foundation, con más de 120 socios, incluido PayPal, ahora participando. Widmann señaló que los agentes de IA no pueden abrir cuentas bancarias tradicionales debido a limitaciones técnicas y regulatorias, po
GateNewshace9h
Apple resuelve demanda por 250 millones de dólares por publicidad engañosa del marketing de IA del iPhone: compensación de hasta 95 dólares por cada unidad
Apple acuerda pagar 250 millones de dólares en un acuerdo para resolver una demanda colectiva que acusa a la empresa de exagerar las funciones de IA “Apple Intelligence” en el iPhone. Top Class Actions lo resume así: los demandantes alegan que Apple, en campañas de marketing para el iPhone 16 y algunos modelos de iPhone 15, dio a entender que las funciones de IA (incluida Siri con una mejora importante) estarían disponibles en el momento del lanzamiento del dispositivo, pero en realidad su imple
ChainNewsAbmediahace9h
Alphabet registró un aumento del 160% en un año y su capitalización bursátil llegó a superar a Nvidia tras una pausa: la valoración de “todo el stack de IA” se hace realidad
Las acciones de Alphabet (GOOGL) subieron aproximadamente un 160% en el último año; tras el reporte financiero de Q1 2026, los analistas atribuyeron esta subida a la posición competitiva de Google en un stack completo de IA (full stack). CNBC resume: ingresos consolidados de Alphabet en Q1 aumentaron un 22% interanual hasta 109,9 mil millones de dólares, y el beneficio neto se disparó un 81% hasta 62,6 mil millones de dólares; los ingresos de Google Cloud crecieron un 63% interanual hasta 20 mil
ChainNewsAbmediahace9h
Las inversiones de capital de Nvidia superan los 400 mil millones de dólares en 2026, ampliando el ecosistema de IA
Según Gelonghui, las inversiones de Nvidia en participaciones patrimoniales han superado los 400 mil millones de dólares en 2026 a 9 de mayo. Las inversiones abarcan empresas upstream y downstream en todo el sector de la IA, formando un ecosistema integrado desde la fabricación de chips hasta el desarrollo de modelos de IA. Observadores de la industria señalan que esta estrategia de inversión le permite a Nvidia asegurar clientes downstream mientras fortalece su canal de demanda de hardware.
GateNewshace10h