2025-12-23 07:21:04

Grok 4.1 từ xAI đang nâng cao tiêu chuẩn cho hiệu suất mô hình dựa trên RAG trong nhiều lĩnh vực. Các tiêu chuẩn mới nhất kể một câu chuyện thú vị — khi bạn xử lý các nhiệm vụ lập trình, Grok đạt 86, chiếm vị trí hàng đầu. Trong các ứng dụng tài chính cụ thể, nó càng nỗ lực hơn với điểm số 93.0, thiết lập một lợi thế cạnh tranh rõ rệt. Trong phân tích pháp lý, nó giữ vững vị thế trước các lựa chọn dẫn đầu.

Điều làm cho điều này đặc biệt liên quan là cách những con số này chuyển đổi thành việc sử dụng trong thế giới thực. Các tài liệu phức tạp, dài dòng - loại tài liệu thường thách thức hầu hết các hệ thống - dường như được xử lý với độ nhất quán có thể đo lường. Điều này định vị Grok không chỉ là một người chơi khác trong lĩnh vực AI, mà còn là một lựa chọn có ý nghĩa cho người dùng cần hiệu suất đáng tin cậy khi xử lý khối lượng thông tin phức tạp.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

9 thích

Phần thưởng
9
3
Đăng lại
Retweed

Bình luận

0/400

MoneyBurnerSociety

· 12-23 07:44

Tài chính 93.0... Tỷ lệ thua lỗ của thuật toán kinh doanh chênh lệch giá của tôi cũng là con số này, chỉ khác là hướng ngược lại. Grok thật sự tuyệt vời, hợp đồng thông minh của tôi không thể so sánh.

Xem bản gốcTrả lời0

MEVvictim

· 12-23 07:40

Tài chính 93.0? Điểm số này có hơi mạnh đấy, phải thử xem có thực sự dùng được không Tôi tin vào hiệu suất của Grok trên các tài liệu phức tạp, nhưng sợ rằng lại chỉ là dữ liệu trên giấy Mã hóa 86 đầu tiên... Nhưng những benchmark này đều là ảo, thực chiến mới là điều cốt yếu Lĩnh vực pháp lý cũng có thể cạnh tranh? Cảm giác lần này xAI đến thật rồi Số liệu đẹp mắt thì đẹp mắt, nhưng vấn đề là có thể xử lý ổn định các tài liệu dài hay không, đó mới là điều quan trọng Mô hình RAG hiện giờ đang cạnh tranh như vậy, ai mới là công cụ sản xuất thực sự?

Xem bản gốcTrả lời0

SnapshotStriker

· 12-23 07:37

Tài chính 93 điểm? Con số này có chút khắc nghiệt, nhưng mức độ thực tế còn phải xem... --- Mã hóa 86 đầu tiên, tài chính 93... Dữ liệu trên giấy luôn đẹp mắt như vậy, vấn đề thực sự là khi chạy có ổn định không --- Khả năng xử lý tài liệu dài mạnh thực sự chạm vào vấn đề nhạy cảm, nhưng Grok thật sự có thể làm việc này hay không thì vẫn phải thử mới biết --- Một đống số benchmark đổ tới, nhưng tôi chỉ muốn biết liệu cái này có thể thay thế công cụ tôi đang dùng không --- Ứng dụng tài chính 93 điểm nghe có vẻ mạnh, nhưng trong lĩnh vực tài chính thì ngưỡng cao, độ ổn định quan trọng hơn rất nhiều so với điểm số --- Ôi, vậy có nghĩa là Grok có chút khả năng trong việc xử lý tài liệu phức tạp, nhưng giá cả sẽ rẻ đến mức nào? --- Mã hóa, tài chính, pháp luật đều đến? Đây là muốn đa năng hay chỉ cần biết chút ít là đủ?

Xem bản gốcTrả lời0

Chủ đề thịnh hànhXem thêm
#Gate2025AnnualReportComing
74.79K Phổ biến
#JapanToRaiseInterestRatesInMid-to-lateDecember
18 Phổ biến
#CryptoMarketMildlyRebounds
31.84K Phổ biến
#GateChristmasVibes
15.26K Phổ biến
#SantaRallyBegins
5.2K Phổ biến

Gate Fun hotXem thêm

1
CROSSCross
Vốn hóa:$3.5KNgười nắm giữ:1
0.00%
2
SLMiSolmiau
Vốn hóa:$3.49KNgười nắm giữ:1
0.00%
3
rowrow
Vốn hóa:$3.5KNgười nắm giữ:1
0.00%
4
SIBSanta's Inevitable Bag
Vốn hóa:$3.53KNgười nắm giữ:1
0.21%
5
VPNVirtual Private Network
Vốn hóa:$5.47KNgười nắm giữ:44
9.27%

Ghim

sơ đồ trang web