Когда вы анализируете, движутся ли два актива вместе, вы услышите, как трейдеры используют два термина: коэффициент корреляции и R-квадрат. Они связаны, но рассказывают очень разные истории. Коэффициент корреляции ® варьируется от -1 до 1 и показывает насколько плотно две переменные связаны и в каком направлении. R-квадрат (R²) — это число, возведенное в квадрат, и оно показывает какой процент движения одной переменной можно фактически предсказать по другой.
Думайте так: корреляция 0.8 звучит сильно, но R² этой же связи — всего 0.64 — то есть только 64% движения цены объяснено. Остальные 36%? Случайный, непредсказуемый шум.
Как на самом деле работает корреляция (Механика)
В основе корреляции лежит сведение сложных взаимосвязей к одному числу. Это число находится в диапазоне от -1 до 1. Значения около 1 означают, что переменные растут и падают вместе. Значения около -1 — что они движутся противоположно. Значения, близкие к 0? Надежной линейной связи нет.
Математика за этим такова: Корреляция = Ковариация(X, Y) / (SD(X) × SD(Y))
Эта формула выполняет одну важную задачу: стандартизирует сложные данные, чтобы можно было сравнивать «яблоки с яблоками», независимо от масштаба или единиц измерения. Без стандартизации сравнивать корреляцию акции и Bitcoin с корреляцией с нефтью было бы бессмысленно.
Три основных типа (И когда использовать каждый)
Коэффициент корреляции Пирсона доминирует в финансах и науке о данных. Он захватывает линейные отношения между непрерывными переменными. Но если ваши данные кривые или скачут по ступенькам, Пирсон вас обманет — он покажет слабую корреляцию, хотя связь может быть сильной.
Spearman и Kendall используют ранжирование вместо сырых значений. Они ваши друзья, когда данные не нормально распределены, содержат выбросы или выражают порядковые рейтинги. Маленькие выборки? Spearman справляется с ними лучше, чем Пирсон.
Выбор неправильной меры — ловушка. Высокое значение Пирсона подтверждает только линейное движение. Не заметив скрытую связь, ваш портфель может взорваться именно тогда, когда вы думали, что он застрахован.
Расшифровка чисел: что на самом деле означает 0.6?
Существуют рекомендации, хотя контекст важнее жестких правил:
0.0 до 0.2: практически никакой связи. Бросание монеты показывает больше закономерностей.
0.2 до 0.5: слабая связь. Они иногда движутся вместе, но ненадежно.
0.5 до 0.8: умеренная или сильная. Вы на правильном пути.
0.8 до 1.0: очень сильная. Почти синхронное движение.
Отрицательные значения работают так же — просто наоборот. Корреляция -0.7 сигнализирует о довольно сильном противоположном движении, что полезно для хеджирования.
Но есть ловушка: разные области используют разные пороги. В физике корреляции около ±1 считаются «реальными». В финансах и социальных науках меньшие значения считаются значимыми, потому что реальный мир сложнее. Например, корреляция 0.4 в рыночной психологии может быть важной; в физике элементарных частиц — шум.
Проблема размера выборки (Или: почему ваши выводы могут быть мусором)
Рассчитайте корреляцию по 5 точкам данных и по 500 — и одинаковое число означает совершенно разное.
На малых выборках даже корреляция 0.6 может быть случайностью — случайным совпадением. На больших выборках даже 0.3 может быть статистически значимой и реальной.
Чтобы понять, важна ли ваша корреляция, проверьте p-значение или доверительный интервал. P-значение ниже 0.05 говорит о том, что связь не просто случайность. Но сами p-значения зависят от размера выборки, поэтому слепо им доверять не стоит.
Где корреляция подводит: предостережения
Корреляция ≠ причинность: две переменные могут двигаться вместе, потому что за этим стоит третья скрытая причина. Цены на нефть и акции авиакомпаний часто коррелируют, но ни одна не вызывает другую — оба зависят от стоимости топлива. Не заметив этого, вы построите плохие хеджи.
Пирсон слеп к кривым: идеально сильная S-образная зависимость покажется слабой или почти нулевой по Пирсону. Вам нужны Spearman или графики рассеяния, чтобы увидеть то, что пропускает Пирсон.
Выбросы — разрушители: один экстремальный показатель может сильно исказить корреляцию. Удалите один пункт данных — и вся ваша теория может рухнуть. Всегда визуализируйте, прежде чем доверять числам.
Режимные сдвиги убивают всё: корреляция между акциями и облигациями была отрицательной десятилетиями — мечта диверсификатора. Потом появились периоды, когда оба рухнули вместе. Использовать вчерашнюю корреляцию для завтрашнего портфеля — финансовая халтура.
R-квадрат: показатель предсказательной силы
Здесь на сцену выходит R² — практический рабочий инструмент. Пока корреляция показывает направление и «насколько плотно», R² количественно оценивает предсказательную силу в процентах.
Если вы подогнали две переменные под линейную модель и получили R² = 0.64, это означает, что 64% вариации зависимой переменной объяснено независимой. Остальные 36% — от других факторов, случайности или неправильной модели.
Главный вывод: R² никогда не превышает квадрат корреляции. Корреляция 0.8 — максимум возможный R² — 0.64. Многие трейдеры неправильно понимают это и ожидают идеального предсказания при сильной корреляции — и рискуют потерять деньги.
Использование корреляции для умного построения портфеля
Настоящие инвесторы не просто считают корреляцию и идут дальше. Они используют её стратегически:
Диверсификация: когда акции и облигации показывают низкую или отрицательную корреляцию, их сочетание сглаживает доходность портфеля. Во время падения рынка акций облигации часто растут, смягчая потери.
Парная торговля: количественные трейдеры используют временные сбои в высокой корреляции. Если два исторически связанных актива расходятся, они делают ставку на их возвращение к равновесию.
Экспозиция к факторам: разные факторы риска (value, импульс, размер) показывают разную корреляцию с широкими индексами. Понимание этих связей помогает сбалансировать портфель.
Хеджирование: нужно компенсировать риск цен на нефть? Найдите актив с отрицательной корреляцией с нефтью. Но убедитесь, что эта корреляция стабильна — если она исчезнет в момент рыночной паники (рынка), ваш хедж станет бесполезным.
Вопрос стабильности: когда корреляции вас подводят
Корреляции — не константы, они меняются с рыночными режимами, политикой и технологическими сдвигами. Корреляция, которая держалась пять лет, может исчезнуть за ночь.
Следите за скользящими окнами корреляции (расчет корреляции за движущиеся периоды), чтобы заметить тренды и смену режимов. Если ваша стратегия зависит от стабильных связей, пересчитывайте их регулярно. Игнорировать распад корреляции — значит получить «идеальный хедж», который не защитит вас в кризис.
Ищите выбросы: определите и решите, оставить, убрать или скорректировать экстремальные значения. Один выброс может полностью изменить вывод.
Подбирайте метод под данные: нормально распределенные непрерывные данные? Пирсон подходит. Порядковые рейтинги или ненормальные распределения? Используйте Spearman или Kendall.
Проверяйте статистическую значимость: не принимайте число за важное без проверки p-значения, особенно при малых выборках.
Следите за стабильностью: используйте скользящие окна, чтобы наблюдать за изменениями корреляции. Когда она резко меняется, стратегия требует пересмотра.
Пересчитывайте регулярно: новые данные поступают постоянно. Обновляйте корреляции ежемесячно или квартально, в зависимости от условий рынка и частоты решений.
Итог
Коэффициент корреляции и R² — мощные диагностические инструменты, но не кристальные шарики. Корреляция показывает, насколько плотно движутся вместе две переменные; R² говорит, какую часть движения можно предсказать. Ни то, ни другое не доказывает причинность, оба плохо работают при нелинейных связях и разрушаются при смене рыночных режимов.
Используйте их как отправную точку — сочетайте анализ корреляции с графиками рассеяния, знаниями области и альтернативными статистическими мерами. Проверяйте значимость, следите за стабильностью и будьте скептичны к слишком идеальным связям. Этот скептицизм — то, что отличает трейдеров, понимающих эти метрики, от тех, кто оказывается blindsided, когда реальность не совпадает с цифрами.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Почему стратегия вашего портфеля нуждается в R-квадрате (И почему только корреляции недостаточно)
Быстрый ответ: в чем разница?
Когда вы анализируете, движутся ли два актива вместе, вы услышите, как трейдеры используют два термина: коэффициент корреляции и R-квадрат. Они связаны, но рассказывают очень разные истории. Коэффициент корреляции ® варьируется от -1 до 1 и показывает насколько плотно две переменные связаны и в каком направлении. R-квадрат (R²) — это число, возведенное в квадрат, и оно показывает какой процент движения одной переменной можно фактически предсказать по другой.
Думайте так: корреляция 0.8 звучит сильно, но R² этой же связи — всего 0.64 — то есть только 64% движения цены объяснено. Остальные 36%? Случайный, непредсказуемый шум.
Как на самом деле работает корреляция (Механика)
В основе корреляции лежит сведение сложных взаимосвязей к одному числу. Это число находится в диапазоне от -1 до 1. Значения около 1 означают, что переменные растут и падают вместе. Значения около -1 — что они движутся противоположно. Значения, близкие к 0? Надежной линейной связи нет.
Математика за этим такова: Корреляция = Ковариация(X, Y) / (SD(X) × SD(Y))
Эта формула выполняет одну важную задачу: стандартизирует сложные данные, чтобы можно было сравнивать «яблоки с яблоками», независимо от масштаба или единиц измерения. Без стандартизации сравнивать корреляцию акции и Bitcoin с корреляцией с нефтью было бы бессмысленно.
Три основных типа (И когда использовать каждый)
Коэффициент корреляции Пирсона доминирует в финансах и науке о данных. Он захватывает линейные отношения между непрерывными переменными. Но если ваши данные кривые или скачут по ступенькам, Пирсон вас обманет — он покажет слабую корреляцию, хотя связь может быть сильной.
Spearman и Kendall используют ранжирование вместо сырых значений. Они ваши друзья, когда данные не нормально распределены, содержат выбросы или выражают порядковые рейтинги. Маленькие выборки? Spearman справляется с ними лучше, чем Пирсон.
Выбор неправильной меры — ловушка. Высокое значение Пирсона подтверждает только линейное движение. Не заметив скрытую связь, ваш портфель может взорваться именно тогда, когда вы думали, что он застрахован.
Расшифровка чисел: что на самом деле означает 0.6?
Существуют рекомендации, хотя контекст важнее жестких правил:
Отрицательные значения работают так же — просто наоборот. Корреляция -0.7 сигнализирует о довольно сильном противоположном движении, что полезно для хеджирования.
Но есть ловушка: разные области используют разные пороги. В физике корреляции около ±1 считаются «реальными». В финансах и социальных науках меньшие значения считаются значимыми, потому что реальный мир сложнее. Например, корреляция 0.4 в рыночной психологии может быть важной; в физике элементарных частиц — шум.
Проблема размера выборки (Или: почему ваши выводы могут быть мусором)
Рассчитайте корреляцию по 5 точкам данных и по 500 — и одинаковое число означает совершенно разное.
На малых выборках даже корреляция 0.6 может быть случайностью — случайным совпадением. На больших выборках даже 0.3 может быть статистически значимой и реальной.
Чтобы понять, важна ли ваша корреляция, проверьте p-значение или доверительный интервал. P-значение ниже 0.05 говорит о том, что связь не просто случайность. Но сами p-значения зависят от размера выборки, поэтому слепо им доверять не стоит.
Где корреляция подводит: предостережения
Корреляция ≠ причинность: две переменные могут двигаться вместе, потому что за этим стоит третья скрытая причина. Цены на нефть и акции авиакомпаний часто коррелируют, но ни одна не вызывает другую — оба зависят от стоимости топлива. Не заметив этого, вы построите плохие хеджи.
Пирсон слеп к кривым: идеально сильная S-образная зависимость покажется слабой или почти нулевой по Пирсону. Вам нужны Spearman или графики рассеяния, чтобы увидеть то, что пропускает Пирсон.
Выбросы — разрушители: один экстремальный показатель может сильно исказить корреляцию. Удалите один пункт данных — и вся ваша теория может рухнуть. Всегда визуализируйте, прежде чем доверять числам.
Режимные сдвиги убивают всё: корреляция между акциями и облигациями была отрицательной десятилетиями — мечта диверсификатора. Потом появились периоды, когда оба рухнули вместе. Использовать вчерашнюю корреляцию для завтрашнего портфеля — финансовая халтура.
R-квадрат: показатель предсказательной силы
Здесь на сцену выходит R² — практический рабочий инструмент. Пока корреляция показывает направление и «насколько плотно», R² количественно оценивает предсказательную силу в процентах.
Если вы подогнали две переменные под линейную модель и получили R² = 0.64, это означает, что 64% вариации зависимой переменной объяснено независимой. Остальные 36% — от других факторов, случайности или неправильной модели.
Главный вывод: R² никогда не превышает квадрат корреляции. Корреляция 0.8 — максимум возможный R² — 0.64. Многие трейдеры неправильно понимают это и ожидают идеального предсказания при сильной корреляции — и рискуют потерять деньги.
Использование корреляции для умного построения портфеля
Настоящие инвесторы не просто считают корреляцию и идут дальше. Они используют её стратегически:
Диверсификация: когда акции и облигации показывают низкую или отрицательную корреляцию, их сочетание сглаживает доходность портфеля. Во время падения рынка акций облигации часто растут, смягчая потери.
Парная торговля: количественные трейдеры используют временные сбои в высокой корреляции. Если два исторически связанных актива расходятся, они делают ставку на их возвращение к равновесию.
Экспозиция к факторам: разные факторы риска (value, импульс, размер) показывают разную корреляцию с широкими индексами. Понимание этих связей помогает сбалансировать портфель.
Хеджирование: нужно компенсировать риск цен на нефть? Найдите актив с отрицательной корреляцией с нефтью. Но убедитесь, что эта корреляция стабильна — если она исчезнет в момент рыночной паники (рынка), ваш хедж станет бесполезным.
Вопрос стабильности: когда корреляции вас подводят
Корреляции — не константы, они меняются с рыночными режимами, политикой и технологическими сдвигами. Корреляция, которая держалась пять лет, может исчезнуть за ночь.
Следите за скользящими окнами корреляции (расчет корреляции за движущиеся периоды), чтобы заметить тренды и смену режимов. Если ваша стратегия зависит от стабильных связей, пересчитывайте их регулярно. Игнорировать распад корреляции — значит получить «идеальный хедж», который не защитит вас в кризис.
Практические шаги перед доверием любой корреляции
Визуализируйте сначала: графики рассеяния показывают закономерности, скрытые за числами. Облако случайных точек? Ваша корреляция лжёт.
Ищите выбросы: определите и решите, оставить, убрать или скорректировать экстремальные значения. Один выброс может полностью изменить вывод.
Подбирайте метод под данные: нормально распределенные непрерывные данные? Пирсон подходит. Порядковые рейтинги или ненормальные распределения? Используйте Spearman или Kendall.
Проверяйте статистическую значимость: не принимайте число за важное без проверки p-значения, особенно при малых выборках.
Следите за стабильностью: используйте скользящие окна, чтобы наблюдать за изменениями корреляции. Когда она резко меняется, стратегия требует пересмотра.
Пересчитывайте регулярно: новые данные поступают постоянно. Обновляйте корреляции ежемесячно или квартально, в зависимости от условий рынка и частоты решений.
Итог
Коэффициент корреляции и R² — мощные диагностические инструменты, но не кристальные шарики. Корреляция показывает, насколько плотно движутся вместе две переменные; R² говорит, какую часть движения можно предсказать. Ни то, ни другое не доказывает причинность, оба плохо работают при нелинейных связях и разрушаются при смене рыночных режимов.
Используйте их как отправную точку — сочетайте анализ корреляции с графиками рассеяния, знаниями области и альтернативными статистическими мерами. Проверяйте значимость, следите за стабильностью и будьте скептичны к слишком идеальным связям. Этот скептицизм — то, что отличает трейдеров, понимающих эти метрики, от тех, кто оказывается blindsided, когда реальность не совпадает с цифрами.