ต้นทุน GPU Nvidia Blackwell เพิ่มขึ้นเป็น 2 เท่า แต่ค่าใช้จ่ายสำหรับการอินเฟอเรนซ์ต่อ 1 โทเคนลดลง 35 เท่าเมื่อเทียบกับ Hopper

จากการวิเคราะห์บล็อกล่าสุดของ Nvidia ระบุว่า GPU ตระกูล Blackwell มีต้นทุนต่อชั่วโมงสูงเกือบ 2 เท่าเมื่อเทียบกับรุ่น Hopper แต่กลับให้ต้นทุนการอินเฟอเรนซ์ต่อโทเค็นต่ำลงถึง 35 เท่า ใช้ DeepSeek-R1 เป็นโมเดลทดสอบ พบว่า Blackwell (GB300 NVL72) ให้บริการเช่าในราคา $2.65 ต่อ GPU ต่อชั่วโมง ขณะที่ Hopper อยู่ที่ $1.41 อย่างไรก็ตาม ประสิทธิภาพแบบต่อ GPU เพิ่มจาก 90 เป็น 6,000 โทเค็นต่อวินาที การเพิ่มขึ้นของทรูพุต 65 เท่านี้ทำให้ต้นทุนต่อโทเค็น 1 ล้านโทเค็นลดจาก $4.20 เหลือ $0.12

ตัวเลข $0.12 ตั้งสมมติฐานว่ามีการปรับแต่งซอฟต์แวร์เต็มรูปแบบ รวมถึงการอินเฟอเรนซ์ความแม่นยำต่ำ FP4 และการทำนายหลายโทเค็น (MTP) หากปิด MTP ต้นทุนต่อโทเค็น 1 ล้านโทเค็นจะพุ่งขึ้นไปอยู่ที่ประมาณ $2.35 ก่อนจะลดลงเหลือ $0.11 เมื่อเปิดใช้งาน โดยแสดงให้เห็นว่าฟีเจอร์นี้เพียงอย่างเดียวมีผลต่อการเพิ่มประสิทธิภาพถึง 21 เท่า

news.article.disclaimer

btc.bar.articles

Reid Hoffman: NFTs อาจกลับมาอีกครั้งเมื่อ AI Agents จำเป็นต้องใช้ความเชื่อถือด้านคริปโท

เรด ฮอฟฟ์แมน พาร์ทเนอร์ของ Greylock และผู้ร่วมก่อตั้ง LinkedIn กล่าวว่า เอเจนต์อัตโนมัติจะต้องมีระบบความน่าเชื่อถือที่ใช้คริปโทเพื่อทำธุรกรรมข้ามอินเทอร์เน็ตสาธารณะ โดยเขาแนะนำว่า NFT อาจกลับมาอีกครั้ง จากคำกล่าวของเขา เอเจนต์ AI และโครงสร้างพื้นฐานด้านความน่าเชื่อถือ คำพูดของฮอฟฟ์แมนชี้ไปที่ความเป็นไปได้

CryptoFrontier29 นาที ที่แล้ว

Scale AI ได้รับสัญญา $500M จากเพนตากอนสำหรับการประมวลผลข้อมูล AI

ตามรายงานของ ChainCatcher กระทรวงกลาโหมสหรัฐได้มอบสัญญามูลค่า 500 ล้านดอลลาร์สหรัฐให้กับ Scale AI ซึ่งได้รับการสนับสนุนโดย Meta Platforms เพื่อช่วยประมวลผลข้อมูลและสนับสนุนการตัดสินใจทางทหาร โดยมูลค่ารางวัลดังกล่าวสูงกว่าสัญญา 100 ล้านดอลลาร์สหรัฐที่บริษัทซึ่งตั้งอยู่ในซานฟรานซิสโกได้รับใน

GateNews1 ชั่วโมง ที่แล้ว

xAI ของ Elon Musk จะปรับแบรนด์เป็น SpaceXAI เนื่องจากสถานะบริษัทอิสระสิ้นสุดลง

ตามรายงานของ Odaily อีลอน มัสก์ประกาศว่า xAI จะถูกรีแบรนด์เป็น SpaceXAI เนื่องจากบริษัทจะไม่ดำเนินงานในฐานะองค์กรอิสระอีกต่อไป

GateNews1 ชั่วโมง ที่แล้ว

IBM ขยายชุดซอฟต์แวร์ AI สำหรับองค์กรด้วยเครื่องมือใหม่แบบเอเจนต์ในงาน Think 2026

ตามที่ IBM ระบุ บริษัทได้ประกาศการขยายขีดความสามารถด้าน AI สำหรับองค์กรที่งาน Think 2026 ในบอสตัน โดยเปิดตัวเครื่องมือใหม่แบบใช้เอเจนต์เพื่อช่วยให้องค์กรนำปัญญาประดิษฐ์ไปผนวกเข้ากับการปฏิบัติงานประจำวัน Context Studio ซึ่งขณะนี้พร้อมใช้งานทั่วไป ช่วยให้องค์กร

GateNews1 ชั่วโมง ที่แล้ว

Hut 8 Shares พุ่ง 30% จากสัญญาเช่าศูนย์ข้อมูล AI มูลค่า 9.8 พันล้านดอลลาร์

Hut 8 หุ้นพุ่งขึ้นมากกว่า 30% หลังมีข่าวข้อตกลงเช่าศูนย์ข้อมูล AI มูลค่า 9.8 พันล้านดอลลาร์สหรัฐ ขยายไปสู่โครงสร้างพื้นฐานด้าน AI ด้วยสัญญาระยะยาวแบบไฮเปอร์สเกลที่ตั้งอยู่ในเท็กซัส การขยายโครงสร้างพื้นฐานด้าน AI สัญญาฉบับนี้มีตัวเลือกที่อาจเพิ่มยอดรวมทั้งสิ้น

CryptoFrontier2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น