OpenAI lanza tres modelos de voz en la API de tiempo real; GPT-Realtime-2 incluye una ventana de contexto de 128K

Beating afirma que OpenAI lanzó tres modelos de voz en su Realtime API: GPT-Realtime-2 para conversaciones de voz con razonamiento, GPT-Realtime-Translate para traducción en tiempo real y GPT-Realtime-Whisper para transcripción en streaming. GPT-Realtime-2 es el primer modelo de voz de OpenAI con capacidad de razonamiento a nivel GPT-5, ampliando la ventana de contexto de 32K a 128K tokens, y permitiendo hasta 1-2 horas de conversación densa.

GPT-Realtime-2 mejoró un 15,2% en el benchmark Big Bench Audio y un 13,8% en Audio MultiChallenge frente a GPT-Realtime-1.5. GPT-Realtime-Translate admite 70+ idiomas de entrada para traducir a 13 idiomas de salida. Precios: GPT-Realtime-2 a 32 USD por millón de tokens de entrada y 64 USD por millón de tokens de salida; Translate a 0,034 USD por minuto; Whisper a 0,017 USD por minuto.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Altman declara que Musk interrumpió las conversaciones para una fusión entre OpenAI y Tesla para mostrar memes; el reportero judicial quedó atónito

Según el informe de sala del Intelligencer, Sam Altman declaró durante el reciente litigio de OpenAI que Elon Musk interrumpió una discusión crítica de una fusión entre OpenAI y Tesla sacando su teléfono para mostrar memes. Altman recordó que Musk insistió en que todos vieran las imágenes durante un periodo prolongado mientras ambas partes negociaban con tensión una posible adquisición. La escena en el tribunal provocó exclamaciones cuando el reportero judicial pidió a Altman que repitiera su de

GateNewsHace1m

Exaforce recauda $125M Series B con $725M valoración para ampliar su plataforma de ciberseguridad con IA

Según TechCrunch, Exaforce recaudó 125 millones de dólares en una ronda de financiación Serie B con una valoración de 725 millones de dólares, ya que las empresas aumentan el gasto en herramientas para detectar y responder a ciberataques. La ronda estuvo liderada por HarbourVest, Peak XV, Mayfield, Khosla Ventures y Seligman Ventures, lo que eleva la financiación total de la startup de ciberseguridad con IA a 200 millones de dólares después de su Serie A de 75 millones de dólares, que se complet

GateNewsHace19m

El CEO de Nvidia, Jensen Huang, acompañará a Trump a China el 13 de mayo

Según confirmación de la Casa Blanca, el CEO de Nvidia, Jensen Huang, acompañará al presidente Trump a China el 13 de mayo. Huang ya se ha subido al Air Force One para viajar a China.

GateNewsHace25m

Meta prueba al asistente de @meta.ai en Threads en cinco países

Meta está probando una nueva función de Threads que permite a los usuarios con cuentas públicas mencionar a @meta.ai en publicaciones y respuestas para recibir respuestas y contexto, según TechCrunch. El despliegue beta ya está activo en Malasia, Arabia Saudita, México, Argentina y Singapur. Funcionalidad de la función La herramienta @meta.ai está diseñada para proporcionar información en tiempo real sobre tendencias e historias de última hora. Al mencionarla, la cuenta publicará respuestas públ

CryptoFrontierHace58m

Anthropic lanza 12 plugins legales para Claude el 12 de mayo

Según Bloomberg, Anthropic lanzó 12 plugins legales para Claude el 12 de mayo, con funciones de revisión de contratos, preparación para el examen de abogacía e integraciones con DocuSign, Thomson Reuters y Harvey. Los plugins estarán disponibles para clientes de pago a través de Claude Cowork, el producto de IA de oficina de Anthropic, y a través de servicios de terceros creados sobre Claude.

GateNewshace1h

Google lanza Googlebook, una nueva categoría de cuadernos impulsada por IA que pone fin a 15 años de era Chromebook

De acuerdo con Beating, Google lanzó oficialmente Googlebook, una nueva categoría de cuadernos que marca el final de la era cloud-first de 15 años de los Chromebook. El dispositivo combina las pilas tecnológicas de ChromeOS y Android, con funcionamiento nativo impulsado por Gemini, y los primeros equipos llegarán este otoño. Googlebook será fabricado por Acer, Asus, Dell, HP y Lenovo, y cada uno incorporará la distintiva tira de luz Glowbar de Google como identificador visual de la nueva categor

GateNewshace1h
Comentar
0/400
Sin comentarios