Али Qianwen выпустила мультимодальную модель Qwen3.5-Omni, поддерживающую распознавание 113 видов речи

Новости Gate News, 30 марта, Alibaba Qianwen объявила о запуске универсальной мультимодальной модели Qwen3.5-Omni. Эта серия включает Instruct-версии трех размеров: Plus, Flash и Light; поддерживает контекст длиной 256k. Модель поддерживает ввод аудио более 10 часов и ввод аудио/видео более 400 секунд в формате 720P (1FPS). Модель проходит нативное мультимодальное предобучение на огромных массивах текстовых, визуальных данных и аудио/видео данных объемом более 100 млн часов, демонстрируя выдающиеся способности к мультимодальному восприятию и генерации. По сравнению с предыдущей Qwen3-Omni, Qwen3.5-Omni значительно усилила мультиязычные возможности: она может поддерживать распознавание речи на 113 языках и диалектах, а также генерацию речи на 36 языках и диалектах.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев