Brian Armstrong ซีอีโอของ Coinbase กล่าวเมื่อวันที่ 26 มิถุนายนว่า Coinbase ได้ตั้งค่า GLM 5.2 ที่เพิ่งเปิดตัวโดย Zhipu AI และ Kimi 2.7 ของ Moonshot AI (บริษัทปักกิ่ง) เป็นโมเดลภาษาขนาดใหญ่ตั้งต้นสำหรับวิศวกรภายในบริษัท ค่าใช้จ่ายด้าน AI ของ Coinbase ลดลงเกือบครึ่งหนึ่ง ขณะที่ปริมาณการใช้งาน Token ยังคงเติบโตแบบทวีคูณในช่วงเวลาเดียวกัน
Armstrong อธิบายว่า GLM 5.2 และ Kimi 2.7 ถูกปรับใช้ในสถานการณ์งานทั่วไปเป็นหลัก เช่น การช่วยเขียนโค้ดมาตรฐานและเวิร์กโฟลว์วิศวกรรมทั่วไป สำหรับงานที่ต้องการการวางแผนที่ซับซ้อน วิศวกรยังสามารถเลือกใช้โมเดลล้ำสมัยได้ ในการตรวจสอบโค้ด Coinbase ใช้กลยุทธ์แบบหลายโมเดลขนานกัน ให้โมเดลต่างๆ ตรวจสอบผลลัพธ์ซึ่งกันและกันเพื่อรักษามาตรฐานคุณภาพ
Armstrong อ้างว่าผลลัพธ์ที่ค่าใช้จ่าย AI ของ Coinbase ลดลงเกือบครึ่งหนึ่งนั้นเป็นผลมาจากการปรับโครงสร้างพื้นฐานสามชั้นดังต่อไปนี้:
Smart Routing (การกำหนดเส้นทางอัจฉริยะ) : ระบบจะประมวลผล prompt ล่วงหน้า โดยพิจารณาจาก cache hit rate และราคาโมเดล แล้วกระจายงานไปยังโมเดลที่เหมาะสมและคุ้มค่าที่สุดโดยอัตโนมัติ
Aggressive Caching (การแคชเชิงรุก) : กำหนดให้คำขอทั้งหมดต้องรองรับการแคช ทำให้ cache hit rate ของ LibreChat เพิ่มขึ้นจาก 5% เป็น 60%
Context Trimming (การตัดทอนบริบท) : แนะนำให้วิศวกรเริ่มเซสชันใหม่เมื่อเปลี่ยนงาน และจำกัดขอบเขตไฟล์ เพื่อลด Token ที่สูญเปล่า
Armstrong เน้นย้ำว่าเป้าหมายของการปรับต้นทุนครั้งนี้ไม่ใช่การจำกัดปริมาณการใช้งาน แต่เป็นการขยายขนาดการนำ AI มาใช้ เขาระบุว่าเป้าหมายคือให้วิศวกรสามารถใช้ Token และโมเดลในปริมาณเท่าใดก็ได้อย่างอิสระ โดยไม่มีเพดานต้นทุน ขณะเดียวกันก็เชื่อมโยงปริมาณการใช้งานกับผลกระทบทางธุรกิจ Armstrong เชื่อว่ารูปแบบนี้สามารถเป็นแบบอย่างให้กับองค์กรใดๆ ก็ได้ ข้อความข้างต้นเป็นคำแถลงสาธารณะของเขาเอง
GLM 5.2 เป็นโมเดลล่าสุดที่เปิดตัวโดย Zhipu AI บริษัท AI ของจีน ส่วน Kimi 2.7 เป็นโมเดลภาษาขนาดใหญ่ของ Moonshot AI (บริษัทปักกิ่ง) โมเดลทั้งสองเปิดตัวในรูปแบบโอเพนซอร์ส Armstrong กล่าวว่า Coinbase นำไปปรับใช้ในสถานการณ์งานด้านวิศวกรรมทั่วไป ส่วนงานที่ซับซ้อนยังคงใช้โมเดลล้ำสมัย
ตามคำอธิบายของ Armstrong แกนหลักของการลดต้นทุนคือการปรับโครงสร้างพื้นฐานสามชั้น: Smart Routing (กำหนดเส้นทางไปยังโมเดลที่คุ้มค่าที่สุดโดยอัตโนมัติ) Aggressive Caching (cache hit rate ของ LibreChat เพิ่มจาก 5% เป็น 60%) และ Context Trimming (ลด Token ที่สูญเปล่า) บนพื้นฐานนี้ การใช้โมเดลโอเพนซอร์สของจีนที่ต้นทุนต่ำกว่าแทนที่การใช้งานโมเดลล้ำสมัยของสหรัฐฯ สำหรับงานทั่วไป ช่วยลดค่าใช้จ่ายโดยรวมลงอีก
ตามแถลงการณ์สาธารณะของ Armstrong เมื่อวันที่ 26 มิถุนายน 2026 เขาไม่ได้กล่าวถึงรายละเอียดการตรวจสอบความปลอดภัยของข้อมูลหรือข้อกำหนดด้านการปฏิบัติตามข้อกำหนดที่เกี่ยวข้องกับการใช้ GLM 5.2 และ Kimi 2.7 Coinbase เป็น exchange สินทรัพย์เข้ารหัสที่อยู่ภายใต้การกำกับดูแลของสหรัฐฯ รายละเอียดเฉพาะของกรอบการปฏิบัติตามข้อกำหนดดังกล่าวไม่ได้รับการเปิดเผยในแถลงการณ์นี้
CZ สัมภาษณ์พิเศษวิเคราะห์สาเหตุหลัก 3 ประการของตลาดหมี ประกาศไม่รับตำแหน่งบริหารกระดานเทรดคริปโต
กำหนดการปลดล็อกโทเค็นทำให้ $241M Supply อยู่ในความสนใจ
ตารางการปลดล็อกโทเค็นทำให้ $241M Supply เป็นที่สนใจ
โมเดล AI จีน GLM 5.2 ดึงดูดผู้ใช้องค์กรที่กำลังมองหาทางเลือกแบบเปิด