Xiaomi 的 MiMo-V2.5 系列开源:1T 参数,且相较 GPT-5.4 具备更高的 token 效率

ข้อความข่าว Gate วันที่ 27 เมษายน — ทีม MiMo ของ Xiaomi ได้ทำการเปิดซอร์สชุดโมเดลภาษา MiMo-V2.5 ภายใต้ใบอนุญาต MIT รองรับการนำไปใช้ในเชิงพาณิชย์ การฝึกต่อเนื่อง และการปรับแต่งด้วยการเรียนรู้แบบเฉพาะทาง ทั้งสองโมเดลมีหน้าต่างบริบท 1 million(หนึ่งล้าน)token MiMo-V2.5-Pro เป็นโมเดล pure-text mixture-of-experts (MoE) ที่มีพารามิเตอร์ทั้งหมด 1.02 trillion(1.02 ล้านล้าน)และพารามิเตอร์ที่ใช้งานอยู่ 42 billion(42 พันล้าน)ส่วน MiMo-V2.5 เป็นโมเดลมัลติโหมดดั้งเดิมที่มีพารามิเตอร์ทั้งหมด 310 billion(310 พันล้าน)และพารามิเตอร์ที่ใช้งานอยู่ 15 billion(15 พันล้าน)รองรับความเข้าใจด้านข้อความ รูปภาพ วิดีโอ และเสียง

MiMo-V2.5-Pro มุ่งเป้าสำหรับงานของเอเจนต์ที่ซับซ้อนและงานด้านการเขียนโปรแกรม ในเกณฑ์มาตรฐาน ClawEval ทำได้ 64% Pass@3 ขณะใช้ประมาณ 70,000 tokens ต่อหนึ่งไทม์ไลน์ของงาน—ลดลง 40% ถึง 60% ของจำนวน token เมื่อเทียบกับ Claude Opus, Gemini 3.1 Pro และ GPT-5.4 โมเดลได้คะแนน 78.9 บน SWE-bench Verified ในเดโมหนึ่ง V2.5-Pro สามารถใช้งานคอมไพเลอร์แบบสมบูรณ์จาก SysY ไปยัง RISC-V สำหรับโปรเจกต์คอร์สของ Peking University ด้วยตัวเองภายใน 4.3 ชั่วโมง ด้วยการเรียกใช้เครื่องมือ 672 ครั้ง ทำคะแนนเต็ม 233/233 บนชุดทดสอบที่ซ่อนอยู่

MiMo-V2.5 ออกแบบมาสำหรับสถานการณ์เอเจนต์มัลติโหมด โดยติดตั้งวิชันเอนโค้ดแบบเฉพาะ (729 million parameters) และเอาดิโอเอนโค้ด (261 million parameters) โดยได้คะแนน 62.3 ในส่วนย่อยทั่วไปของ Claw-Eval ทั้งสองโมเดลใช้สถาปัตยกรรมแบบผสมผสานที่รวม sliding window attention (SWA) และ global attention (GA) โดยจับคู่กับโมดูล 3 ชั้นสำหรับการทำนายหลายโทเคน (MTP) เพื่อเร่งการอนุมาน น้ำหนักโมเดลมีให้ที่ Hugging Face

นอกเหนือจากการเปิดซอร์สแล้ว ทีม MiMo ยังได้เปิดตัว “Orbit Quadrillion Token Creator Incentive Program” โดยมอบ 100 quadrillion tokens ฟรีภายใน 30 วันให้กับผู้ใช้งานทั่วโลก นักพัฒนารายบุคคล ทีม และองค์กรสามารถสมัครผ่านหน้าโปรแกรม โดยมีรอบการประเมินประมาณ 3 วันทำการ ผลประโยชน์ที่ได้รับการอนุมัติจะถูกจัดสรรเป็น Token Plans หรือเครดิตโดยตรง เข้ากันได้กับเครื่องมืออย่าง Claude Code และ Cursor

news.article.disclaimer

btc.bar.articles

Public เข้าซื้อแอป Treasury ของแพลตฟอร์มการลงทุน AI เพื่อขยายการเทรดคริปโต

ตามรายงานของ ChainCatcher Public ได้ประกาศเข้าซื้อแพลตฟอร์มบริการลงทุนด้าน AI อย่าง Treasury App เพื่อเสริมความแข็งแกร่งให้กับธุรกิจโบรกเกอร์ที่ขับเคลื่อนด้วย AI ของบริษัท มูลค่าการเข้าซื้อกิจการไม่ได้มีการเปิดเผย ปัจจุบัน Public รองรับการซื้อขายหุ้น พันธบัตร และสกุลเงินดิจิทัล รวมถึง Bitcoin, Ethereum, a

GateNews42 นาที ที่แล้ว

Blitzy ปิดการระดมทุนรอบ $200M แล้ว โดยมี Northzone เป็นผู้นำ

ตามรายงานของ ChainCatcher บริษัท Blitzy ซึ่งเป็นบริษัทเทคโนโลยี AI ด้านการเขียนโค้ดที่ก่อตั้งร่วมโดย Sid Pardeshi อดีตสถาปนิกของ Nvidia ได้ปิดรอบระดมทุนมูลค่า 200 ล้านดอลลาร์ โดยมี Northzone เป็นผู้นำการลงทุน Battery Ventures, Jump Capital และ Morgan Creek Digital เข้าร่วมในรอบนี้ แพลตฟอร์มสามารถแยกวิเคราะห์ระบบที่ซับซ้อนได้ด้วย

GateNews1 ชั่วโมง ที่แล้ว

สหภาพยุโรปห้ามสื่อลามกปลอมแปลงด้วย AI แบบ deepfake ในวันที่ 7 พฤษภาคม

ตามรายงานของสำนักข่าวซินหัว เมื่อวันที่ 7 พฤษภาคม สมาชิกสภายุโรปและรัฐสมาชิกได้บรรลุฉันทามติในการห้ามระบบปัญญาประดิษฐ์จากการสร้างเนื้อหาลามกเชิงลึกปลอม (deepfake pornographic) ข้อห้ามดังกล่าวจะถูกนำไปรวมไว้ในร่างแก้ไขพระราชบัญญัติปัญญาประดิษฐ์ปี 2024 สภายุโรป

GateNews1 ชั่วโมง ที่แล้ว

Tether เปิดตัวโมเดล AI ทางการแพทย์ QVAC MedPsy และทำคะแนนได้ 62.62 จากเวอร์ชันที่มีพารามิเตอร์ 17 พันล้านพารามิเตอร์

ตามรายงานของ Odaily กลุ่มวิจัย Tether AI ปล่อยตัว QVAC MedPsy ซึ่งเป็นโมเดล AI ทางการแพทย์ที่ออกแบบให้ทำงานแบบออฟไลน์บนสมาร์ทโฟนและอุปกรณ์สวมใส่โดยไม่ต้องพึ่งพาระบบคลาวด์ เวอร์ชัน 1.7 พันล้านพารามิเตอร์ทำคะแนนได้ 62.62 จากเกณฑ์การประเมินทางการแพทย์ 7 รายการ โดยทำได้ดีกว่า MedGemma-1.5-4B ของ Google อยู่ 11.42 poi

GateNews2 ชั่วโมง ที่แล้ว

B.AI API เปิดตัวโมเดลใหม่ 4 รุ่น รวมถึง GPT-5.5 Instant ภายใน 48 ชั่วโมงหลังการเปิดตัวของ OpenAI

B.AI API เปิดตัวโมเดลใหม่ 4 รุ่น ได้แก่ GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 และ GLM-5.1 โดย GPT-5.5 Instant ได้ดำเนินการปรับใช้ระบบพื้นฐานและรวมอินเทอร์เฟซให้เสร็จภายใน 48 ชั่วโมงหลังการเปิดตัวของ OpenAI ทำให้สามารถเข้าถึงได้แบบไม่ต้องรอดีเลย์ถึง

GateNews2 ชั่วโมง ที่แล้ว

โมเดล AI ด้านการแพทย์ของ Tether มูลค่า 1.7B ทำผลงานเหนือคู่แข่งที่ใหญ่กว่า 16 เท่าในวันนี้

ตามทีมวิจัย AI ของ Tether บริษัทได้เปิดตัวโมเดลภาษาทางการแพทย์ซีรีส์ QVAC MedPsy วันนี้ โดยออกแบบมาเพื่อการรันแบบออฟไลน์ในเครื่องสำหรับสมาร์ทโฟนและอุปกรณ์สวมใส่ โดยไม่ต้องพึ่งพาระบบคลาวด์ เวอร์ชันที่มีพารามิเตอร์ 1.7B ทำคะแนนได้ 62.62 จากการทดสอบเกณฑ์ทางการแพทย์ 7 รายการ ซึ่งสูงกว่า Google MedGemma-4B

GateNews2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น