Урок 2

Дані та запити — структура вхідних даних і дисципліна валідації

Цей розділ пояснює, як упорядкувати матеріали, що подаються до ШІ, з трьох аспектів — джерел інформації, часових меж і обмежень запитів, — щоб зменшити забруднення торгових суджень галюцинаціями та наративами виживання.

1. Початкова точка: якість виходу залежить від структури входу

Урок 1 окреслив шість позицій, де ШІ вписується в торговий робочий процес, з організацією інформації на першому місці. Якщо підсумки неточні, дати переплутано або джерела неможливо відстежити, то подальша генерація гіпотез, обговорення бектестування та контрольні списки ризику лише посилюють початкові упередження. Тому Урок 2 не надає пріоритет технікам «постановки кращих запитань», а натомість обговорює структурну дисципліну, необхідну на етапі входу, щоб виходи моделі за замовчуванням розглядалися як такі, що підлягають перевірці, а не як встановлені факти.

У торговому контексті галюцинації зазвичай означають не те, що модель навмисно вигадує, а те, що вона генерує плавний і впевнений контент, який не можна співставити з перевіреними первинними джерелами. Поширені форми включають: вигадування оголошень або посилань, плутанину ринкової капіталізації з обіговою пропозицією, застосування застарілих даних до поточних питань, використання фраз на кшталт «ончейн-дані показують» без надання адрес, часових вікон або статистичних стандартів. Рішення полягає не в тому, щоб повністю відкидати ШІ, а в тому, щоб вказувати рівень джерела, часові межі та кроки перевірки для кожного фрагменту інформації, що потрапляє в ланцюжок прийняття рішень.

2. Градація джерел: побудова дієвої класифікаційної рамки

Перш ніж подавати матеріали ШІ, рекомендується градуювати інформаційні джерела та вимагати від моделі позначати кожен ключовий пункт за градацією в промпті. Мета градації — не формалізм, а з'ясування того, який вміст можна подавати як факт, а який може слугувати лише наведенням або неперевіреним судженням.

  • Первинні джерела включають офіційні вебсайти проєктів, записи випусків на GitHub, оголошення бірж та регуляторів, блокчейн-експлорери та експортовані дані транзакцій. Ці матеріали є відносно надійними, але все ще потребують пильності щодо фішингових сторінок і підроблених оголошень — посилання та домени слід перевіряти вручну.

  • Вторинні джерела включають звіти дослідницьких інститутів, аудиторські документи та сторінки підтвердження резервів; вони допомагають зрозуміти механізми, але вимагають перевірки, чи охоплюють дата публікації та обсяг аудиту поточну структуру.

  • Мейнстрімні медіа інтерпретації політики можна використовувати як довідку, але ключові висновки слід перехресно перевіряти з первинними документами.

  • Соціальні медіа, KOL та контент спільноти придатні лише як точки входу для виявлення проблем і не повинні самостійно обґрунтовувати торгівлю. Анонімні скріншоти та «інсайдерська інформація» за замовчуванням виключаються з торгової логіки.

Промпти можуть вимагати: лише високоякісні джерела можна використовувати для фактичних тверджень; середньо- або низькоякісні джерела повинні бути позначені як «повідомляється» або «неперевірено»; пункти, що не мають джерела або дати, слід послідовно позначати для перевірки. Навіть якщо модель все ще робить помилки, такий формат виходу полегшує ручне фільтрування.

3. Часові мітки та стандарти: криптодані схильні до «старих даних у нових контекстах»

Навчання та пошук моделі відстають від реальних подій, а механізми проєктів часто оновлюються. При запитах вказуйте часові діапазони — наприклад, аналізуйте лише матеріали після певної дати; позначайте потенційно застарілу інформацію як «станом на [дата]». При порівнянні цін або показників вказуйте інтервал свічки, біржу, торгову пару, спот або ф'ючерси тощо. Для ончейн-статистики вказуйте назву мережі, адресу контракту, статистичне вікно та чи включені притоки/відтоки бірж. Те саме питання за різними стандартами може дати протилежні висновки; стандарти мають бути фіксованим полем у промпті, а не додатковою думкою.

4. Наративи виживання та суперечливі докази

Криптообговорення часто демонструють лише прибуткові випадки, використовують лише зразки бичачого ринку або посилаються на бектести з періодів зростання. Наративи ШІ схильні робити історії звучати завершеними, ігноруючи невдалі контрприклади. Контрзаходи включають: вимагати як підтверджуючих, так і протилежних доказів; вказувати розмір вибірки та часові рамки; явно відповідати «неможливо визначити», коли доказів недостатньо, замість того, щоб примушувати висновок. Дослідницько-орієнтований діалог краще підходить для представлення сценаріїв та умов невдачі, ніж для прямого виведення рекомендацій лонг/шорт.

5. Структура промпту: обмеження форми, а не риторичних прикрас

Ефективні промпти зазвичай включають чотири частини:

  • Заява про обсяг — роль дослідницького асистента, без рекомендацій токенів, без гарантованої прибутковості

  • Умови обмеження — без вигаданих посилань, позначати невизначеності, правила градації джерел

  • Формат виходу — аргумент, основа, градація джерела, дата, умови недійсності

  • Кроки перевірки — необхідні ручні перевірки — напр., відкриття URL оголошень або перевірка хешів ончейн-транзакцій

Наприкінці кожної розмови генеруйте контрольний список перевірки, який потрібно заповнити вручну перед переходом до гіпотез або торгових кроків. Довжина промпту не є ключовою; важливо, чи зафіксовано джерело, часові рамки та стандарти.

6. Розподіл праці в даних: числа надаються людьми, модель займається інтерпретацією

Більш надійний розподіл праці: ринкові та ончейн-дані слід експортувати з API, бірж або експлорерів і вставляти для ШІ у вигляді сирих таблиць або з чіткими полями; модель інтерпретує значення, виявляє невідповідності та допомагає структурувати гіпотези — але не генерує критичні значення самостійно. Якщо модель бере участь у розрахунках, вимагайте від неї відображати формули та проміжні кроки, а основні висновки перераховувати вручну. Довгі розмови ризикують зсувом контексту; важливі теми слід починати в нових потоках, перевірені факти архівувати окремо для довідки лише в наступних взаємодіях, щоб зменшити забруднення контексту.

7. Підсумок уроку

Цей урок стосується етапу перед використанням ШІ: звідки беруться матеріали, чи включають вони дати та стандарти, і чи можна використовувати низькоякісні джерела як торгове обґрунтування. Галюцинації та наративи виживання зазвичай є не тим, що модель «говорить нісенітниці», а результатом неперевірених тверджень, застарілих даних або підібраних історій успіху у вхідних даних. Впроваджуючи градацію джерел, часові межі та контрольні списки перевірки у фіксований процес, виходи за замовчуванням стають чернетками, які потребують перевірки перед входженням в обговорення гіпотез або позицій. Наступний урок буде присвячено валідації стратегій: після очищення входів необхідно окремо аналізувати дані, витрати та результати поза вибіркою — криві бектесту самі по собі не валідують стратегію.

Відмова від відповідальності
* Криптоінвестиції пов'язані зі значними ризиками. Дійте обережно. Курс не є інвестиційною консультацією.
* Курс створений автором, який приєднався до Gate Learn. Будь-яка думка, висловлена автором, не є позицією Gate Learn.