Alibaba Qianwen meluncurkan model AI multi-modal penuh Qwen3.5-Omni, mendukung 113 jenis pengenalan suara

Berita Gate News, pada 30 Maret, Ali Qianwen mengumumkan peluncuran model multimodal penuh Qwen3.5-Omni. Seri ini mencakup versi Instruct dalam tiga ukuran: Plus, Flash, dan Light, mendukung konteks panjang 256k, serta model mendukung input audio lebih dari 10 jam dan input audio-visual lebih dari 400 detik pada 720P (1FPS). Model menjalani pra-pelatihan multimodal asli pada teks dalam skala besar, visi, serta data audio-visual lebih dari 100 juta jam, menunjukkan kemampuan persepsi dan generasi multimodal yang luar biasa. Dibandingkan pendahulunya Qwen3-Omni, kemampuan Qwen3.5-Omni untuk banyak bahasa meningkat secara signifikan, mampu mendukung pengenalan suara untuk 113 bahasa dan dialek serta generasi suara untuk 36 bahasa dan dialek.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar