Автоматичний фреймворк оптимізації AI забезпечив перше місце у результатах Haiku 4.5: Лінь Цзюньянь зазначив, що саме це є його передбаченням повороту у «дизайні середовища»

BlockBeatNews

Згідно з моніторингом 1M AI News, дослідники зі Стенфорду, MIT і південнокорейської ігрової компанії KRAFTON опублікували Meta-Harness — метод для автоматичної оптимізації виконання фреймворку для ШІ (harness, тобто обгортка для моделі та виконувальні риштування, що керують діями Agent, які включають дизайн промптів, виклики інструментів і керування контекстом). На відміну від вручну написаних виконувальних фреймворків, Meta-Harness дозволяє Agent, що кодує, зчитувати код, журнали виконання та оцінки попередніх кандидатних фреймворків і автоматично ітерувати для їхнього покращення.

На термінальному операційному бенчмарку TerminalBench-2 Meta-Harness довів прохідність Claude Haiku 4.5 до 37.6%, що перевищує Goose (35.5%) і Claude Code (27.5%), і є першим серед усіх оприлюднених фреймворків виконання для Haiku 4.5. Для Claude Opus 4.6 прохідність становить 76.4%, і це друге місце.

Технічний керівник “Qianwen” (前通义千问) Лінь Цзюньян (Lin Junyang) переслав пост авторів роботи й прокоментував: «“Модель + виконувальний фреймворк” уже випередили “лише модель”; на результат Agent суттєво впливає дизайн і якість фреймворку, тож я справді вважаю, що це правильний напрям». У лонгріді, опублікованому Лінь Цзюньян 27 березня (зараз видаленому), він заздалегідь спрогнозував, що проєктування середовища перетвориться з побічного напрямку на справжню підприємницьку категорію продуктів. Meta-Harness підтвердив це експериментальними даними: та сама модель, але з іншою AI-оптимізованою системою виконання, різниця в результатах може сягати 10 відсоткових пунктів.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів