Phỏng vấn đồng sáng lập OpenAI Karpathy: LLM là máy tính mới, mọi thứ đều phải được "viết lại"

robot
Đang tạo bản tóm tắt

原视频标题:Andrej Karpathy: Từ Lập trình Vibe đến Kỹ thuật Tác nhân

原视频来源:Sequoia Capital
原文编译:Bào Y Long, Thị trường Wall Street

Người sáng lập hợp tác của OpenAI Andrej Karpathy trong cuộc phỏng vấn mới nhất chỉ ra rằng, mô hình ngôn ngữ lớn đang đóng vai trò như “máy tính mới” toàn diện định hình lại kiến trúc tính toán.

Vào ngày 29 tháng 4, Andrej Karpathy, người từng dẫn dắt phát triển Autopilot của Tesla và có vị trí quan trọng tại OpenAI, đã phân tích sâu về sự tiến bộ công nghệ của AI đại diện và ảnh hưởng sâu rộng của nó đối với hệ sinh thái phần mềm và phần cứng trong một sự kiện do AI Sent tổ chức.

Karpathy cho biết, kể từ tháng 12 năm ngoái, ông bắt đầu nhận thức rằng quy trình làm việc dựa trên tác nhân đã thực sự khả thi, và sự chuyển đổi này đánh dấu sự thực của thời đại Software 3.0.

Ông nói: Nhiều người vẫn còn ấn tượng về AI vào năm ngoái là ChatGPT, nhưng bạn phải xem xét lại, đặc biệt là từ tháng 12 trở đi — mọi thứ đã thay đổi căn bản.

Ông cũng đề xuất khái niệm mới gọi là “kỹ thuật tác nhân” (agentic engineering), để phân biệt với “lập trình vibe” (vibe coding) mà ông đặt tên năm ngoái, trong đó, trước đây, đề cập đến việc duy trì và tăng tốc tiêu chuẩn chất lượng trong phát triển phần mềm chuyên nghiệp.

Ông thẳng thắn nói rằng, rất nhiều mã nguồn và ứng dụng hiện có “không nên tồn tại” trong mô hình mới này, và hầu hết các tổ chức hiện nay vẫn thiết kế quy trình tuyển dụng, công cụ phát triển và hạ tầng dựa trên con người chứ không phải tác nhân.

Bình minh của Software 3.0: Chuyển giao quyền lực của kiến trúc tính toán nền tảng

Ngành công nghệ đang đứng trước một ngã rẽ từ biến đổi lượng sang biến đổi chất.

Tháng 12 năm ngoái là một điểm ngoặt quan trọng, Karpathy thừa nhận, khi đối mặt với các mô hình AI mới nhất, ông đã trải qua một cú sốc sâu sắc:

Các đoạn mã do hệ thống tạo ra ngày càng hoàn hảo, tôi thậm chí không nhớ lần cuối cùng chỉnh sửa nó là khi nào. Tôi chỉ ngày càng tin tưởng hệ thống này… (Điều này khiến tôi) chưa từng cảm thấy mình còn tụt hậu như vậy trong vai trò lập trình viên.

Sự tác động này là sự thay đổi hoàn toàn về phương thức tính toán. Theo Karpathy, thị trường hiện đang đánh giá thấp độ sâu của sự thay đổi này.

Ông chỉ ra rằng, chúng ta đang nói lời tạm biệt với “phần mềm 1.0 (viết mã)” và “phần mềm 2.0 (tổ chức dữ liệu để huấn luyện mạng neural)”, chính thức bước vào thời đại “phần mềm 3.0”.

Trong kỷ nguyên mới này, mô hình ngôn ngữ lớn chính là một “máy tính mới”.

Ông nói: Bây giờ, lập trình của bạn trở thành việc viết các gợi ý, và nội dung trong cửa sổ ngữ cảnh chính là đòn bẩy để bạn điều khiển mô hình ngôn ngữ lớn như một trình thông dịch, để nó thực hiện các phép tính trong không gian thông tin số.

Điều khiến thị trường chú ý hơn nữa là dự đoán táo bạo của ông về sự tiến hóa của kiến trúc phần cứng nền tảng trong tương lai.

Hiện tại, mạng neural vẫn hoạt động dưới dạng ảo hóa trên máy tính hiện có, nhưng ông tin rằng trong tương lai, mối quan hệ chủ-tớ này sẽ đảo ngược: bạn có thể tưởng tượng, mạng neural sẽ trở thành tiến trình chính, còn CPU sẽ biến thành một loại bộ xử lý phụ trợ. Mạng neural sẽ đảm nhận phần lớn công việc nặng nhọc.

Điều này có nghĩa là, “tính toán thông minh” — chiến lược trung tâm của toàn bộ chi tiêu vốn thị trường — sẽ tiếp tục củng cố vị trí chiến lược của nó trong tương lai.

Cơ sở hạ tầng thế hệ tiếp theo: Tái cấu trúc hệ sinh thái “tác nhân nguyên bản” (代理原生)

Khi thực thi và mã hóa bị máy móc tiếp quản, giá trị cốt lõi của con người và hình thái hạ tầng tương lai sẽ đi về đâu?

Karpathy thẳng thắn: Tất cả mọi thứ đều phải được viết lại.

Hiện tại, các tài liệu hướng dẫn về các khung và thư viện internet vẫn là “viết cho con người”, điều này khiến ông cảm thấy vô cùng phiền lòng.

Karpathy phàn nàn: Tại sao vẫn phải nói cho tôi biết phải làm thế nào? Tôi không muốn làm gì cả. Tôi nên sao chép và dán văn bản gì cho AI tác nhân của mình?

Cơ hội lớn trong tương lai nằm ở việc xây dựng hạ tầng “ưu tiên tác nhân”.

Trong thế giới này, hệ thống được phân tách thành các “cảm biến” để nhận thức thế giới và “thiết bị thực thi” để biến đổi thế giới, cấu trúc dữ liệu phải cho phép mô hình ngôn ngữ lớn đọc hiểu cao độ, và các tác nhân máy móc đại diện cho cá nhân và tổ chức để tương tác trên đám mây.

Trong một tương lai tự động hóa cao như vậy, giá trị cốt lõi của con người sẽ trở lại với thẩm mỹ, khả năng đánh giá và hiểu biết sâu sắc về kinh doanh.

Karpathy trích dẫn một câu nói khiến ông phải nghiền ngẫm nhiều lần để tổng kết: Bạn có thể thuê ngoài suy nghĩ của mình, nhưng bạn không thể thuê ngoài sự hiểu biết của mình.

Kỹ thuật tác nhân: Vượt xa “kỹ thuật 10 lần” của các kỹ sư để bùng nổ năng suất

Trong lĩnh vực nâng cao năng suất, Karpathy phân biệt hai khái niệm cốt lõi: “lập trình vibe” (Vibe coding) và “kỹ thuật tác nhân” (Agentic engineering).

Ông chỉ ra rằng, “lập trình vibe” nâng cao giới hạn tối thiểu của việc phát triển phần mềm toàn diện, còn “kỹ thuật tác nhân” nhằm duy trì giới hạn tối đa về chất lượng phần mềm chuyên nghiệp.

“Kỹ thuật tác nhân” không chỉ đơn thuần là tăng tốc, mà còn yêu cầu các nhà phát triển phối hợp các “tác nhân AI có phần dễ sai sót, mang tính ngẫu nhiên nhưng cực kỳ mạnh mẽ”, để tiến về phía trước với tốc độ tối đa mà không làm giảm chất lượng.

Điều này cũng sẽ mở rộng đáng kể khả năng sáng tạo của doanh nghiệp.

Karpathy nhấn mạnh: “Người ta thường nói về kỹ thuật 10 lần, nhưng 10 lần đã không còn đủ để mô tả tốc độ tăng trưởng bạn đạt được. Theo tôi, những người xuất sắc trong lĩnh vực này có thể đạt hiệu suất vượt xa 10 lần.”

Đối mặt với sự bùng nổ năng suất này, cấu trúc tổ chức và logic tuyển dụng nhân tài của các doanh nghiệp cần phải được tái cấu trúc.

Ông đề xuất các doanh nghiệp từ bỏ các phương pháp phỏng vấn dựa trên thuật toán truyền thống, chuyển sang đánh giá cách ứng viên sử dụng nhiều tác nhân AI để hợp tác xây dựng các dự án lớn và có khả năng chống lại các cuộc tấn công từ các tác nhân AI khác.

Điểm nhấn trong ứng dụng thương mại AI

Đối với các nhà sáng lập và nhà đầu tư đang khẩn trương tìm kiếm các kịch bản ứng dụng AI, Karpathy cung cấp một khung đánh giá thực tiễn cực kỳ hữu ích: khả năng xác minh.

Hiện tại, khả năng của AI thể hiện một dạng “gợn sóng” cực kỳ kỳ quặc.

Ông ví dụ: Các mô hình tiên tiến nhất ngày nay có thể đồng thời tái tạo 100.000 dòng mã hoặc tìm lỗ hổng zero-day, nhưng lại bảo tôi đi rửa xe cách đó 50 mét — điều này thật điên rồ.

Nguyên nhân của sự chia rẽ này là các phòng thí nghiệm tiên phong (như OpenAI) đã đổ nguồn lực lớn vào các lĩnh vực dễ xác minh kết quả như “toán học” và “mã nguồn”.

Vì vậy, chỉ cần đặt trong các bối cảnh kinh doanh có thể xác minh kết quả, AI mới có thể phát huy sức mạnh to lớn.

Karpathy gợi ý rằng, vẫn còn rất nhiều môi trường học tập có giá trị cao nhưng chưa được các phòng thí nghiệm hàng đầu chú trọng, chính là những thị trường ngách để các công ty khởi nghiệp tinh chỉnh (fine-tuning) và thương mại hóa, mở ra một thị trường màu mỡ.

原视频链接

Nhấp để xem các vị trí tuyển dụng của BlockBeats theo nhịp điệu

Chào mừng gia nhập cộng đồng chính thức của BlockBeats:

Nhóm theo dõi trên Telegram: https://t.me/theblockbeats

Nhóm thảo luận trên Telegram: https://t.me/BlockBeats_App

Tài khoản chính thức Twitter: https://twitter.com/BlockBeatsAsia

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim