โมร์เธรด MT T S5000 GPU เสร็จสิ้นการปรับใช้โมเดลขนาดใหญ่ MiniMax M2.7

ข่าว Gate News เมื่อวันที่ 12 เมษายน Moore Threads ประกาศว่า GPU แบบครบวงจรสำหรับการฝึกและการอนุมาน AI ของตนคือ MTT S5000 ได้เสร็จสิ้นการปรับใช้งานตั้งแต่วันแรก (Day-0) สำหรับโมเดลขนาดใหญ่ MiniMax M2.7 แล้ว การปรับใช้งานนี้แสดงให้เห็นถึงความสามารถด้านเทคโนโลยีของ GPU ภายในประเทศในการรองรับโมเดลขนาดใหญ่ด้าน AI

news.article.disclaimer

btc.bar.articles

DeepSeek เปิดตัววิธี Visual Primitives เพื่อยกระดับการให้เหตุผลแบบมัลติโหมดในวันที่ 30 เมษายน

ตามรายงานทางเทคนิคของ DeepSeek เมื่อวันที่ 30 เมษายน บริษัทได้เปิดตัว Visual Primitives ซึ่งเป็นวิธีที่ฝังหน่วยภาพพื้นฐาน เช่น จุด (points) และกรอบครอบ (bounding boxes) ลงในสายโซ่การให้เหตุผล เพื่อแก้ปัญหา Reference Gap ในงานมัลติโหมด วิธีนี้ช่วยลดการใช้โทเคนของภาพ

GateNews6 นาที ที่แล้ว

NVIDIA เปิดตัวน้ำหนักโมเดลเรือธง Cosmos-Reason2-32B และขยายขนาดบริบทเป็น 256K โทเค็น

ตาม Beating NVIDIA ได้เปิดตัวน้ำหนัก (weights) สำหรับ Cosmos-Reason2-32B ซึ่งเป็นรุ่นเรือธงของโมเดลการให้เหตุผลเชิงกายภาพด้านวิสัยทัศน์-ภาษา (VLM) ที่ออกแบบมาเพื่อช่วยให้หุ่นยนต์และระบบขับเคลื่อนอัตโนมัติเข้าใจหลักการเชิงพื้นที่ เชิงเวลา และเชิงกายภาพ โมเดลพารามิเตอร์ 32 พันล้าน ซึ่ง

GateNews8 นาที ที่แล้ว

OpenAI เปิดเผยว่าเหตุใด Codex จึงห้ามพูดคำว่า “ก็อบลิน”: การให้รางวัลบุคลิกแบบนักเนิร์ดหลุดการควบคุม

OpenAI ในบล็อกทางการได้อธิบายว่า Codex ถูกห้ามไม่ให้พูดถึงสิ่งมีชีวิตจำพวกก็อบลินและสิ่งมีชีวิตอื่น ๆ เนื่องมาจากสัญญาณรางวัลที่ชอบการเปรียบเทียบกับสิ่งมีชีวิตในกระบวนการฝึกบุคลิกของ “คนขี้หมกมุ่น” ทำให้เกิดการปนเปื้อนข้ามบุคลิกและทำให้ RLHF เข้าใจผิด เหตุการณ์นี้ถูกเปิดโปงโดย Barron Roth หลังจากที่มีการเผยคำสั่งระบบ จากนั้น OpenAI จึงใช้สองกลยุทธ์ ได้แก่ การฮาร์ดโค้ดแบบระยะสั้นและการล้างสัญญาณรางวัลในระยะยาว เพื่อเตือนถึงความเปราะบางของการออกแบบสัญญาณรางวัล และการตรวจสอบหลังการฝึกจำเป็นต้องละเอียดมากขึ้น

ChainNewsAbmedia52 นาที ที่แล้ว

โมดูลการตีความ Qwen-Scope แบบโอเพนซอร์สของ Alibaba เปิดเผยแล้ว ครอบคลุม 7 โมเดล ในวันที่ 30 เมษายน

ตาม PANews เมื่อวันที่ 30 เมษายน Qwen ของ Alibaba ได้ประกาศการเปิดซอร์ส Qwen-Scope ซึ่งเป็นโมดูลด้านความสามารถในการตีความ (interpretability) ที่ฝึกบนโมเดลตระกูล Qwen3 และ Qwen3.5 โดยการเปิดตัวครอบคลุมโมเดลภาษาขนาดใหญ่ 7 รุ่น ทั้งในแบบ dense และแบบ mixture-of-experts พร้อมด้วย sparse autoencoder จำนวน 14 ชุด

GateNews1 ชั่วโมง ที่แล้ว

เซิร์ฟเวอร์ AI ของ Nvidia B300 ทำยอดทะลุ 1 ล้านดอลลาร์ในจีน ท่ามกลางภาวะขาดแคลนอุปทาน

ตามรายงานของ Reuters เซิร์ฟเวอร์ AI B300 ของ Nvidia ขณะนี้ขายได้ในจีนในราคาโดยประมาณ 7 ล้านหยวน (1 ล้านดอลลาร์สหรัฐ) โดยได้รับแรงหนุนจากการปราบปรามเครือข่ายลักลอบนำเข้าอย่างเข้มงวด และความต้องการที่ยังคงสูงจากบริษัทเทคโนโลยีท้องถิ่น ราคาดังกล่าวพุ่งขึ้นจากราว 4 ล้านหยวน (585,000 ดอลลาร์สหรัฐ) ในช่วงปลายปี 2025 อย่างมีนัยสำคัญ

GateNews1 ชั่วโมง ที่แล้ว

กำไรจากการดำเนินงานของ LG CNS เพิ่มขึ้น 19% ในไตรมาส 1 จากการเติบโตของ AI และคลาวด์

ตามรายงานของ Chosun Daily เมื่อวันที่ 30 เมษายน LG CNS รายงานว่ากำไรจากการดำเนินงานไตรมาสแรกเพิ่มขึ้น 19.4% เมื่อเทียบปีต่อปี สู่ 94.2 พันล้านวอน (64.1 ล้านดอลลาร์สหรัฐ) โดยได้รับแรงหนุนจากความต้องการด้าน AI และคลาวด์ รายได้เพิ่มขึ้น 8.6% สู่ 1.3 ล้านล้านวอน (894 ล้านดอลลาร์สหรัฐ) หน่วยงานด้าน AI และคลาวด์ของบริษัทสร้าง 765.4 พันล้าน

GateNews2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
dumpkillervip
· 04-17 05:02
ไปยังดวงจันทร์ 🌕
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0
GateUser-fac335fdvip
· 04-13 07:06
เข้าสู่ตลาดในจังหวะต่ำสุด 😎
ดูต้นฉบับตอบกลับ0