相关性如何影响您的投资决策

为什么交易者关心相关性

在构建投资组合时,最大的问题不在于哪些资产会涨——而在于它们的走势一起如何。这就是相关性发挥作用的地方。一个介于 -1 和 1 之间的单一数字告诉你两个资产是同步上涨和下跌,还是相反运动。这个指标已成为投资组合构建和风险管理的核心工具,能够穿透复杂的市场数据,揭示隐藏的模式。

这样理解:如果两个持仓的相关性接近 1(,意味着它们完全同步,你实际上是在加倍你的风险。但如果它们相反运动)相关性接近 -1(,它们就是天然的对冲。这也是为什么理解相关性不是可选的——它是避免市场转向时亏钱的基础。

相关性尺度说明

相关系数的范围始终在 -1 到 1 之间。以下是每个区间的实际含义:

接近 1.0: 资产同步运动。如果一个上涨 5%,另一个通常也会跟着涨。

0.5 到 0.8: 中等正相关。它们一起变动,但具有一定的独立性。用于多元化,但不是完美的。

大约 0: 几乎没有线性关系。一个资产的变动几乎不能告诉你另一个资产的情况。

-0.5 到 -0.8: 中等负相关。它们倾向于相反运动,为投资组合提供不错的保护。

接近 -1.0: 完全逆相关。当一个资产飙升时,另一个通常会崩盘——如果能找到的话,理想的对冲。

交易者常用的经验法则:

  • 0.0 到 0.2 = 微不足道的关系
  • 0.2 到 0.5 = 弱相关
  • 0.5 到 0.8 = 中等到强
  • 0.8 到 1.0 = 非常强

负值的情况相同,只是方向相反。相关性为 -0.7 表示强烈的逆向运动。

皮尔逊(Pearson) vs. 斯皮尔曼(Spearman) vs. 肯德尔(Kendall):用哪个指标

并非所有相关性都是一样的。最常用的是皮尔逊相关系数,它捕捉两个连续变量之间的线性关系。但也有其他方法适用于不同数据类型:

  • 皮尔逊: 标准选择。当数据呈正态分布且关系线性时效果最佳。
  • 斯皮尔曼: 基于秩的方式,捕捉单调关系,不假设正态分布。更适合杂乱的实际数据。
  • 肯德尔: 另一种秩相关方法,比斯皮尔曼在处理小样本和平局值时更稳健。

问题在于?如果你的变量存在曲线或阶梯关系,皮尔逊会漏掉这些关系,报告的相关性可能偏低,误导你。因此,许多量化交易者会同时使用多种指标,以避免得出错误结论。

皮尔逊相关性的数学原理

核心公式很简单:

相关性 = 协方差)X, Y( / )标准差(X( × 标准差)Y()

分子)协方差(衡量两个变量共同变动的程度。分母)标准差的乘积(将变动标准化到 -1 到 1 的范围。这种标准化至关重要——它让你可以跨市场、时间段和资产类别比较相关性,而不被不同规模或波动性所干扰。

) 计算拆解示例

假设你追踪两个资产的回报:

  • 资产X:2%、4%、6%、8%
  • 资产Y:1%、3%、5%、7%

**第一步:**计算每个序列的平均值。X的平均值是5%,Y的平均值是4%。

**第二步:**计算偏差。每个点减去平均值###2-5=-3,4-5=-1,等等(。

**第三步:**将配对偏差相乘并求和,得到协方差的分子。

**第四步:**对每个偏差平方,求和后开平方,得到标准差。

**第五步:**用协方差除以两个标准差的乘积。

在这个例子中,相关系数接近 1,因为Y几乎与X成比例增长。实际上,你会用Excel或Python计算——但理解这个机制能帮助你避免盲目信任数字。

投资中的相关性:实际应用

) 股票与债券

历史上,美国股票和政府债券的相关性较低甚至为负。当经济衰退时,股市崩盘,债券价格反而上涨,投资者转向安全资产。这也是为什么债券一直是传统的对冲工具。但这种关系并非一成不变——它会随着利率、通胀和央行政策的变化而变化。

( 商品生产商

你可能预期油企股价与原油价格紧密相关。实际上,长期相关性通常在)0.4 到 0.6###范围内,且不稳定。为什么?因为油企估值还受到生产成本、地缘政治和整体股市的影响。在某一年看似强烈的相关性,下一年可能就会大幅减弱。

加密资产相关性

在熊市中,许多加密货币同步下跌,相关性飙升至 1。但在牛市中,部分资产的涨势可能彼此独立,相关性甚至会降到 0.3 或负值。这种不稳定性使得基于静态相关性假设的长期对冲策略在关键时刻往往失效。

样本量比你想象的重要

用 100 个数据点计算出的相关性为 0.6,统计上是可靠的。而用只有 10 个样本得出的同样相关性,几乎毫无意义——很可能只是随机噪声。研究者会用 p 值和置信区间来区分真实关系和偶然。

大样本可以让即使是中等的相关性也具有统计显著性。小样本则需要更高的相关性才能被认真对待。如果你在回测基于相关性的策略,务必问:我用了多少历史数据?这个答案会影响一切。

最大的相关性陷阱:把它和因果关系搞混

两个变量可以一起变动,但不代表一个导致另一个。第三个因素可能在驱动两者。这是交易者最常犯的危险错误之一。

例子:冰淇淋销量和溺水死亡数在夏季都高(。但冰淇淋并不会导致溺水——共同的原因是温暖的天气。在市场中,多个资产可能都受利率预期影响而相关,但这并不意味着持有它们能实现多元化。

异常值和分布问题

一个极端数据点就能大幅影响相关系数。如果大部分数据的相关性为 0.3,但存在一个巨大异常值,整体相关性可能跳升到 0.6。务必在相信数字之前,用散点图观察数据。

非正态分布也会破坏皮尔逊的假设。当数据偏斜或尾部肥厚——在加密和便士股中很常见——秩相关(如斯皮尔曼)通常会提供更可靠的答案。

在Excel中计算相关性

单对变量:
使用 =CORREL)范围1, 范围2###。选择你的两个数据范围,Excel会返回皮尔逊系数。

多组变量:
启用分析工具包,依次点击 数据 → 数据分析 → 相关性,然后输入你的整个范围。Excel会生成一个相关矩阵,显示所有两两关系。

技巧:确保范围对齐,考虑标题行,并在信任结果前检查原始数据中的异常值。数据差错会导致误导性相关性。

R 平方:另一面

R 是相关系数,显示强度和方向。

(R-squared) 是相关系数的平方,表示“解释的方差比例”。如果 R = 0.7,则 R² = 0.49,意味着变量的运动中只有 49% 可以由另一变量预测,剩余的 51% 是噪声或其他因素。

在投资中,R 告诉你股票与行业的紧密程度。R² 则告诉你该股票的波动中,有多少是行业驱动的,多少是公司特有的。两者都重要,但回答的问题不同。

相关性衰减:时序问题

相关性不是固定的——它会变化。在正常市场中,两个资产的相关性可能为 0.4。而在危机中,相关性可能一夜之间飙升到 0.85,就像恐慌抛售席卷市场。这正是你以为自己已对冲的时刻。

长期平均相关性可能会误导你。使用滚动窗口相关性(例如,30天、90天),可以观察关系何时发生变化。如果相关性在上升,你的多元化可能正在恶化。

使用相关性前的快速检查清单

  • 先可视化: 制作散点图。线性关系是否合理?
  • 查找异常值: 检查原始数据是否存在极端点。
  • 验证假设: 你的数据类型是否适合你选择的相关性指标?
  • 检验显著性: 样本较小时,即使相关性中等,也可能是噪声。进行显著性检验。
  • 随时间监控: 定期重新计算。如果相关性不稳定,你的策略假设可能会崩溃。

结论

相关系数是评估变量关系的强大捷径。它将复杂的模式浓缩成一个单一、可比的数字。对于投资组合构建、风险管理和发现机会,它是不可或缺的工具。

但它也有盲点。它不能证明一件事导致另一件事。它会漏掉曲线关系。它对异常值和样本量敏感。它会随时间变化,尤其在市场压力时。

把相关性当作起点,而非结论。结合视觉分析、其他指标和统计显著性检验。在投资中,避免一数定终局的交易者,才是能在制度变迁和市场突发中生存下来的人。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)