Необходимость тестирования данных вне выборки для количественной стратегии

Автор:Маленькие мечты, Создано: 2018-01-26 12:11:58, Обновлено: 2019-07-31 18:03:38

Большие данные в реальном мире. Необходимость тестирования данных вне выборки для количественной стратегии.

img

  • NO:01

    Жизнь человека, от ребенка до взрослого, от взрослого до пожилого, на самом деле является процессом постоянного совершения ошибок, исправления и повторения ошибок, и почти никто не может быть исключен. Может быть, вы совершили много ошибок, которые сейчас кажутся низкоклассными; или, может быть, вы пропустили много возможностей для посадки, таких как: недвижимость, Интернет, цифровые валюты и т. Д....

    И вот услышивший скажет: "Я не должен был"... "Если бы... Я бы"...

    Я долго не мог выразить свое мнение об этом вопросе, и только позже понял. На самом деле, это не было чем-то страшным, потому что каждый выбор, правильный или неправильный, отталкивал нас от заранее заданных результатов в сторону неизвестности, а наше размышление открывало для нас Божью точку зрения, которая находилась вне исторических данных.

  • NO:02

    Я видел множество торговых систем, где успеваемость может достигать более 50% при ретро-тестировании. При таком высоком уровне выигрыша можно получить и более 1 к 1. Однако, без исключения, эти системы, как только они попадают на реальные диски, в основном становятся убыточными. Причины, которые приводят к убыткам, многочисленны, среди которых, во время ретро-тестирования, непреднамеренно, смотреть справа-налево, открыть Божью точку зрения.

    img

    Тем не менее, торговля - это такая запутанная вещь, которая впоследствии становится совершенно очевидной, но если мы не вернемся к началу без осязания Божьей точки зрения, то мы все равно не поймем. Это ставит под сомнение ограничения количественных источников и исторических данных. Таким образом, трудно избежать проблем с вождением автомобиля, если мы исследуем торговую систему с ограниченными историческими данными.

  • NO:03

    Но как в условиях ограниченных данных максимально использовать ограниченные данные для полноценной проверки торговых стратегий? Обычно существуют два метода: прогрессивная проверка и перекрестная проверка.

    Основные принципы прогрессивной проверки: тренировать модель с более длинными историческими данными, а затем проверять модель с относительно короткими последующими данными, а затем постоянно перемещать окно получения данных назад, повторяя шаги обучения и проверки.

    img

    1, данные о обучении: 2000-2001 гг., данные о тестировании: 2002 г.; 2, данные о тренировках: 2001-2002; данные о тестировании: 2003; 3, данные о тренировках: 2002-2003, данные о тестировании: 2004; 4, данные о обучении: 2003-2004, данные о тестировании: 2005; 5, данные о подготовке: 2004-2005 гг., данные о тестировании: 2006 г.;

    ... и так далее...

    Наконец, результаты испытаний (в 2002, 2003, 2004, 2005, 2006 и т.д.) были подвергнуты статистической оценке, чтобы оценить эффективность стратегии.

    На рисунке ниже приведен интуитивно понятный принцип проведения прогрессивной проверки:

    img

    На рисунке выше показаны два способа проверки с помощью переноса.

    Первый: при каждом испытании данные теста короткие, а количество тестов больше. Во-вторых, по каждому тесту, данные теста являются более длинными, а количество тестов меньше.

    В практических применениях можно проводить многократные тесты, изменяя длину тестовых данных, чтобы определить стабильность модели в отношении неравномерных данных.

  • NO:04

    Основные принципы кросс-тестирования: разделить все данные на N частей, каждое время тренироваться с N-1 частью и проверять остальную часть.

    img

    Разделяя период с 2000 по 2003 год на четыре части в зависимости от года. Процесс перекрестной проверки: 1, данные о тренировках: 2001-2003, данные о испытаниях: 2000; 2, Данные о тренировках: 2000-2002, данные о тестировании: 2003; 3, Данные о тренировках: 2000, 2001, 2003, тестовые данные: 2002; 4, Данные о тренировках: 2000, 2002, 2003, тестовые данные: 2001;

    img

    Как показано выше: наибольшее преимущество кросс-тестирования заключается в полном использовании ограниченных данных, и каждый тренировочный данный также является тестовым данным; однако существуют и явные недостатки, когда кросс-тестирование применяется к проверке стратегических моделей:

    1, результаты тестирования модели часто являются ненадежными, когда данные о ценах нестабильны. Например, тренировка с данными 2008 года, тестирование с данными 2005 года. Вполне вероятно, что рыночная обстановка в 2008 году сильно изменилась по сравнению с 2005 годом, поэтому результаты тестирования модели ненадежны.

    2, как и в случае с первым пунктом, в кросс-тестировании, если тренировать модель с новейшими данными, а тестировать с более старыми данными, это само по себе не очень логично.

  • NO:05

    Кроме того, при тестировании количественной стратегии модели возникают проблемы со свертыванием данных как с прогрессивной, так и с перекрестной проверкой.

    img

    При разработке моделей стратегии торговли большинство технических индикаторов основаны на исторических данных определенной длины. Например, если использовать тенденционный индикатор, чтобы рассчитать исторические данные за последние 50 дней, а на следующий торговый день этот индикатор, в свою очередь, рассчитан на данные за 50 дней до этого дня торговли, то данные для расчета этих двух индикаторов совпадают на 49 дней, что приводит к незначительному изменению показателя на каждые два соседних дня.

    img

    Накопление данных может привести к следующим последствиям:

    1, медленное изменение результатов прогнозируемых моделями приводит к медленному изменению позиций, что мы называем задержкой показателей.

    2, Некоторые статистические значения не доступны для проверки результатов модели, что делает результаты некоторых статистических проверок ненадежными из-за последовательности, вызванной повторением данных.

  • NO:06

    Хорошие стратегии торговли должны быть выгодными в будущем. Внепробные испытания, помимо объективной проверки стратегий торговли, более эффективно экономят время клиентов.

    В большинстве случаев использовать оптимальные параметры всего образца напрямую в боевых действиях очень опасно.

    Если все исторические данные до момента проведения оптимизации параметров разделить на внутрипробные и внепробные данные, сначала использовать внутрипробные данные для оптимизации параметров, а затем использовать внепробные данные для внепробных тестов, то можно сортировать эту ошибку, в то же время проверяя, применима ли оптимизированная стратегия для будущих рынков.

  • NO:07

    Как и в случае с сделками, мы никогда не сможем пересечь время, чтобы сделать для себя правильное решение, в котором не было бы ни малейшей ошибки. Если есть рука Бога или способность пересекать будущее, то без проверки, прямой онлайн-транзакция может быть полной.

    Однако, даже имея историю с огромными объемами данных, история оказывается крайне скудной перед лицом бесконечного и непредсказуемого будущего. Таким образом, торговая система, основанная на истории и выдвигаемая сверху вниз, в конечном итоге тонет со временем.

    img

  • NO:08

    Мы (изобретатели количественной торговли) стремимся изменить нынешний цикл количественной торговли, где нет сухого, закрытого обмена, обманщиков, чтобы создать более чистый цикл количественной торговли. В мире никогда не создавалось знаний и теорий, они просто уже существуют и ждут, чтобы мы их обнаружили.

    img

    Разделение - это отношение, а не мудрость!

Гости онлайн Автор: Хукибо


Больше