Lần đầu tiên trong lịch sử AI tạo ra AI! GPT-5.3 tham gia phát triển chính mình, viễn tưởng trở thành hiện thực

OpenAI đã phát hành GPT-5.3-Codex, mô hình đầu tiên “tham gia vào việc tự tạo” để gỡ lỗi mã của chính nó, quản lý triển khai và chẩn đoán thử nghiệm. Karpathy gọi bản sửa đổi là “gần nhất với cảnh cất cánh AI”.

AI bắt đầu tạo ra những điểm kỳ dị và đột phá về công nghệ trong AI

Tài khoản chính thức của OpenAI được phát hành: GPT-5.3-Codex chính thức ra mắt, đây là “người đầu tiên tham gia tạo mô hình của riêng bạn”. Nó có nghĩa là gì? Nói cách khác, trong quá trình phát triển, AI này đã giúp gỡ lỗi mã đào tạo của chính nó, quản lý quá trình triển khai của riêng nó và chẩn đoán kết quả kiểm tra của chính nó. Theo thuật ngữ của con người, AI đã bắt đầu tạo ra AI.

Andrej Karpathy, cựu nhà nghiên cứu OpenAI và giám đốc AI của Tesla, đã tweet trực tiếp sau khi đọc nó: “Đây là điều gần nhất mà tôi từng thấy với cảnh cất cánh AI trong khoa học viễn tưởng”. Đánh giá này từ các nhà nghiên cứu AI hàng đầu có trọng lượng vì Karpathy đã trải qua một số giai đoạn quan trọng của quá trình phát triển AI và phán đoán của anh ấy dựa trên sự hiểu biết kỹ thuật sâu sắc.

AI lặp lại chính nó, đây không phải là hùng biện tiếp thị. Theo tiết lộ nội bộ của OpenAI, GPT-5.3-Codex đã thực hiện những điều này trong quá trình phát triển: phân tích các bài kiểm tra không gắn cờ nhật ký đào tạo, đề xuất các bản sửa lỗi cho tập lệnh và hồ sơ đào tạo, tạo công thức triển khai, tóm tắt và đánh giá các điểm bất thường để con người xem xét. Điều này có nghĩa là gì? AI không còn chỉ là một công cụ, nó bắt đầu trở thành một phần của nhóm phát triển và nó là loại có thể tự cải thiện.

Khả năng tham gia phát triển này thúc đẩy thông qua định vị AI truyền thống. Trước đây, các mô hình AI được thiết kế, đào tạo và triển khai hoàn toàn bởi con người, còn AI là một sản phẩm thụ động. Giờ đây, GPT-5.3 đã đóng một vai trò tích cực trong sự ra đời của chính nó và trong khi vẫn dưới sự giám sát của con người, sự thay đổi vai trò này có ý nghĩa sâu rộng. Nó gợi ý về một khả năng: các mô hình AI trong tương lai phần lớn có thể được thiết kế và tối ưu hóa bởi chính AI, với con người chỉ cung cấp định hướng và đánh giá cuối cùng.

GPT-5.3 tự tham gia phát triển

Phân tích nhật ký đào tạo: Tự động gắn cờ các bài kiểm tra không thành công để xác định các điểm bất thường trong quá trình đào tạo

Kế hoạch sửa chữa được đề xuất: Đề xuất cải tiến tập lệnh và hồ sơ đào tạo

Tạo công thức triển khai: Tự động hóa quy trình triển khai và giảm thao tác thủ công

Đánh giá bất thường tóm tắt: Sắp xếp các kết quả đánh giá phức tạp thành các báo cáo mà con người dễ hiểu

Một bài báo gần đây của SEAL được xuất bản bởi MIT (arXiv: 2506.10943) mô tả một kiến trúc AI liên tục học hỏi sau khi triển khai, tự phát triển mà không cần đào tạo lại. Đáng chú ý, một số nhà nghiên cứu SEAL hiện đã tham gia OpenAI. Điều này có nghĩa là AI đã thay đổi từ “công cụ tĩnh” sang “hệ thống động”, việc học không còn dừng lại ở việc triển khai và ranh giới suy luận và đào tạo đang tan chảy. GPT-5.3 có thể là ứng dụng thương mại đầu tiên của kiến trúc mới này.

77,3% nghiền nát vụ giết mổ chuẩn của Claude

Vào ngày 5 tháng 2, OpenAI và Anthropic đều phát hành một thế hệ mô hình mới chỉ cách nhau 20 phút. Đầu tiên, Anthropic phát hành Claude Opus 4.6, sau đó OpenAI ra mắt GPT-5.3-Codex. Vì OpenAI muốn sử dụng GPT-5.3-Codex để bắn tỉa các mô hình mới của người khác, nên nó phải có một số khả năng. Dữ liệu không nói dối, GPT-5.3-Codex đã lập kỷ lục mới trong nhiều tiêu chuẩn ngành ngay khi nó được ra mắt.

Terminal-Bench 2.0 kiểm tra khả năng hoạt động của AI trong môi trường thiết bị đầu cuối thực, biên dịch mã, đào tạo mô hình và định cấu hình máy chủ. GPT-5.3-Codex đạt 77.3%, trong khi GPT-5.2-Codex chỉ có 64.0% và Claude Opus 4.6 báo cáo 65.4%. Đây là mức tăng 13 điểm phần trăm giữa các thế hệ, đây đã là một bước nhảy vọt trong lĩnh vực AI. So sánh 77.3% so với 65.4% cho thấy GPT-5.3 thiết lập một lợi thế đáng kể trong các nhiệm vụ kỹ thuật trong thế giới thực.

SWE-Bench Pro là một điểm chuẩn được thiết kế đặc biệt để kiểm tra khả năng kỹ thuật phần mềm trong thế giới thực, bao gồm bốn ngôn ngữ lập trình: Python, JavaScript, Go và Ruby. GPT-5.3-Codex đạt 56.8%, vượt qua 56.4% của người tiền nhiệm GPT-5.2-Codex và tiếp tục duy trì vị trí đầu tiên trong ngành. Quan trọng hơn, OpenAI tiết lộ rằng GPT-5.3-Codex sử dụng số lượng mã thông báo đầu ra nhỏ nhất so với bất kỳ mô hình nào khi đạt được điểm số này, có nghĩa là nó không chỉ chính xác mà còn hiệu quả.

OSWorld-Verified kiểm tra khả năng hoàn thành các tác vụ năng suất của AI trong môi trường máy tính để bàn trực quan, chỉnh sửa bảng tính, tạo bản trình bày, làm việc trên tài liệu, v.v. GPT-5.3-Codex đạt 64.7%, so với mức trung bình của con người là 72%. Điều này có nghĩa là nó đã tiếp cận hiệu suất của những người bình thường trong các tác vụ vận hành máy tính, gần gấp đôi so với người tiền nhiệm. Hiệu suất gần như con người này khiến AI thực sự có khả năng làm việc văn phòng lần đầu tiên, thay vì chỉ là một công cụ phụ trợ.

Claude đếm 100K Token và Nhóm Đại lý

Điều đáng chú ý hơn là Claude Opus 4.6 lần đầu tiên hỗ trợ cửa sổ ngữ cảnh mã thông báo 100K (beta) trong mô hình cấp Opus, có thể xử lý toàn bộ cơ sở mã hoặc hàng trăm trang tài liệu cùng một lúc và ra mắt chức năng Agent Teams, nơi nhiều tác nhân AI có thể cộng tác trên lập trình, thử nghiệm và viết tài liệu cùng một lúc.

Khi OpenAI và Anthropic phát hành các mô hình hàng đầu của họ trong cùng một ngày và cùng một thời điểm, cuộc thi này không còn chỉ là một cuộc thi kỹ thuật, mà là một cuộc chiến về hình dạng tương lai của AI: lộ trình “tự tiến hóa” của OpenAI hay lộ trình “hợp tác nhiều tác nhân” của Anthropic? Chiến lược của OpenAI là làm cho một AI mạnh mẽ hơn và thậm chí cải thiện chính nó. Chiến lược của Anthropic là cho phép nhiều AI cộng tác trong các nhiệm vụ phức tạp thông qua phân công lao động và cộng tác.

Bối cảnh của 100K token là một bước đột phá về công nghệ. Con số này tương đương với khoảng 75 triệu từ tiếng Anh hoặc 300 ký tự tiếng Trung, đủ để phù hợp với toàn bộ mã của một dự án phần mềm cỡ trung bình hoặc một tài liệu kỹ thuật dày. Khả năng này cho phép Claude “nhìn thấy” toàn bộ dự án thay vì một sự hiểu biết rời rạc. Đối với phân tích kiến trúc và tái cấu trúc các dự án quy mô lớn, quan điểm toàn cầu này là rất quan trọng.

Agent Teams mang khái niệm cộng tác vào AI. Một Agent viết code, một Agent khác kiểm tra và một Agent thứ ba viết tài liệu, và họ có thể giao tiếp và phối hợp với nhau. Mô hình này bắt chước cách các nhóm phần mềm của con người hoạt động và có thể phù hợp hơn với một số tình huống nhất định so với một siêu AI duy nhất. Tuy nhiên, cộng tác nhiều tác nhân cũng đưa ra những phức tạp mới: cách phối hợp, cách tránh xung đột và cách đảm bảo tính nhất quán.

Cả hai tuyến đường đều có ưu điểm và nhược điểm riêng. Con đường tự tiến hóa của OpenAI tích cực hơn và nếu thành công, nó có thể dẫn đến những cải thiện theo cấp số nhân về khả năng, nhưng nó cũng có thể vượt khỏi tầm kiểm soát. Lộ trình đa tác nhân của Anthropic thận trọng hơn, giảm thiểu điểm rủi ro đơn lẻ bằng cách lan tỏa khả năng, nhưng chi phí điều phối có thể hạn chế hiệu quả. Khi AI bắt đầu phát triển trong tự nhiên, các câu hỏi về quản trị sẽ chuyển từ “nó thông minh như thế nào” sang “làm thế nào để chúng ta quản lý một hệ thống liên tục thay đổi?” Và khi hai công ty AI hàng đầu phát hành các mô hình đột phá liên tiếp trong vòng 20 phút, cửa sổ thời gian còn lại cho suy nghĩ và chuẩn bị của con người đang thu hẹp với tốc độ có thể nhìn thấy bằng mắt thường.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Trump đe dọa leo thang xung đột Mỹ-Iran, vàng bị bán tháo, tạo mức giảm lớn nhất trong 4 ngày

Tuần này, do các phát biểu cứng rắn của Trump nhắm vào Iran, giá vàng giảm. Vàng giao ngay và vàng kỳ hạn lần lượt giảm 2% và 2,5%. Giá dầu tăng vọt thúc đẩy kỳ vọng lạm phát tăng lên, khiến sức hấp dẫn của vàng giảm. Ngoài ra, toàn bộ nhóm kim loại quý chịu áp lực, UBS hạ dự báo giá vàng; nhà đầu tư cần theo dõi tình hình Trung Đông và các tác động từ biến động của thị trường.

GateNews4phút trước

Tiger Research: Sự trỗi dậy của ETF Bitcoin, tài chính truyền thống xâm chiếm thị phần của các sàn giao dịch

Báo cáo cho biết các tổ chức tài chính truyền thống đang tăng tốc tiến vào thị trường tiền mã hóa, khiến các sàn giao dịch phải chịu áp lực cạnh tranh. Khi ETF giao ngay Bitcoin được đẩy mạnh, nhà đầu tư có xu hướng ưu tiên các sản phẩm ngân hàng và chứng khoán, dẫn đến khối lượng giao dịch của sàn giảm và có tình trạng cắt giảm nhân sự. Nếu sàn giao dịch không cung cấp các dịch vụ độc đáo, thì sẽ rất khó để tồn tại. Xu hướng hòa trộn giữa tài chính truyền thống và ngành crypto cũng đang gia tăng, và các sàn giao dịch trên toàn cầu đang đối mặt với thách thức.

GateNews22phút trước

BlackRock Bitcoin ETF có khối lượng giao dịch trong ngày lên tới 18Bỷ USD, sánh ngang với các CEX hàng đầu.

Quỹ ủy thác Bitcoin iShares của BlackRock (IBIT) có khối lượng giao dịch trong ngày tăng vọt, trở thành đơn vị dẫn đầu về khối lượng giao dịch giao ngay tại Mỹ. Mặc dù dòng tiền tổng thể của ETF đang chảy ra, nhưng mức độ giao dịch sôi động của IBIT cho thấy các nhà đầu tư tổ chức đang quan tâm sâu hơn đến thị trường tiền mã hóa, phản ánh mức độ cạnh tranh ngày càng gia tăng giữa tài chính truyền thống và tài sản kỹ thuật số. Trong tương lai, giá Bitcoin và các tín hiệu kinh tế sẽ ảnh hưởng đến dòng vốn của ETF.

GateNews31phút trước

IMF cảnh báo: Bốn rủi ro hoặc cú sốc lớn của tài chính được mã hóa có thể ảnh hưởng đến hệ thống tài chính toàn cầu

Báo cáo của Quỹ Tiền tệ Quốc tế (IMF) cảnh báo rằng tài chính được mã hóa (token hóa) mang lại bốn rủi ro lớn, bao gồm làm gia tăng sự phân mảnh của thị trường, tăng rủi ro ổn định tài chính, xung đột trong thanh toán xuyên biên giới và thách thức đối với các nền kinh tế mới nổi. IMF khuyến nghị thực hiện các chính sách như neo tiền tệ an toàn, quản lý thống nhất, v.v. để ứng phó với các rủi ro này và cho biết thị trường tài chính được mã hóa đang tăng trưởng nhanh chóng.

GateNews39phút trước

Vụ kiện về cổ phần của SpaceX thu hút sự chú ý, việc phân chia lợi nhuận từ đợt IPO hàng chục tỷ USD đang đối mặt với sự không chắc chắn

Các vụ kiện liên quan đến cổ phần của SpaceX có thể ảnh hưởng đáng kể đến việc phân bổ lợi nhuận từ đợt IPO sắp tới. Tranh chấp bắt nguồn từ sự hợp tác giữa Trellis Software và ClearList Holdings: Trellis cáo buộc ClearList tìm cách loại trừ quyền lợi của mình, trong khi ClearList phản biện rằng Trellis đã không bàn giao phần mềm. Diễn biến của vụ án sẽ ảnh hưởng đến các quỹ đầu tư tư nhân lên tới hàng chục tỷ đô la và đồng thời khơi dậy sự quan tâm đối với việc bảo vệ cổ đông và các quy tắc của thị trường.

GateNews45phút trước

13B USD rút lui bị cản trở: Tín dụng tư nhân “chen lấn” làm gia tăng sự hoảng loạn, rủi ro đồng thời của token hóa trên chuỗi cũng được khuếch đại

Năm 2026, thị trường tín dụng tư nhân phải đối mặt với áp lực thanh khoản; nhu cầu nhà đầu tư rút vốn cao nhưng việc thực hiện chi trả thực tế không đạt quá một nửa. Nhiều tổ chức đã khởi động các biện pháp hạn chế rút vốn. Cảm xúc căng thẳng trên thị trường gia tăng, tỷ lệ vỡ nợ lập kỷ lục mới, vấn đề về cơ cấu tài sản nổi bật. Các thử nghiệm liên quan đến blockchain không thể cải thiện thanh khoản, và áp lực vĩ mô đã tác động mạnh lên người đi vay. Nhìn chung, tín dụng tư nhân có thể trở thành một nguồn rủi ro hệ thống.

GateNews1giờ trước
Bình luận
0/400
Không có bình luận