三指标共振实战:RSI/KDJ/MACD 联合 ML 决策

一、引子

做量化久了你会发现,单指标策略就像独臂侠。RSI 看超买超卖,碰上趋势行情会被反复打脸;KDJ 灵敏却噪音大,震荡市里金叉死叉一天给你发十几次;MACD 稳重但滞后,等红绿柱走出来,行情往往已经走完一大半。十年前我刚开始做交易时,也把 MACD 当救命稻草,结果一次次被左右打脸,事后看图才发现自己"该止损时不止损,该持有时早下车"。

后来才明白:任何单一指标都有它的"盲区"——RSI 钝化、KDJ 假信号、MACD 滞后,这是指标本身的物理特性,无法通过调参根除。要提高胜率,必须让多个指标互相印证,也就是量化圈里经典的"三指标共振"玩法。但规则共振写到第 50 条,你就开始怀疑人生了:阈值改一改,回测曲线大变样;换只票,策略失效——这时候,机器学习登场。

二、三指标原理回顾

RSI(相对强弱指数)。公式 RSI = 100 - 100/(1+RS),其中 RS = N 日内平均涨幅 / 平均跌幅。数值 0-100,70 以上视为超买、30 以下视为超卖。RSI 擅长捕捉反转时机,但单边趋势里会长期钝化(连续 80 以上不发信号),所以单独使用极易错过主升浪。

KDJ(随机指标)。先算 RSV = (C - L_n) / (H_n - L_n) × 100,其中 L_n/H_n 是 N 日内最低/最高价,再对 RSV 做两次指数平滑得到 K 和 D,最后 J = 3K - 2D 用于放大波动。KDJ 擅长短线拐点与金叉死叉信号,反应比 RSI 快一倍。但震荡市里假信号极多——这是它最大的命门。

MACD(指数平滑异同移动平均线)。DIF = EMA(C, 12) - EMA(C, 26),DEA = EMA(DIF, 9),柱状图 MACD = (DIF - DEA) × 2。MACD 擅长趋势确认,柱状图翻红翻绿能直观看到动能变化;但金叉出现时,行情往往已走到中后段,反应慢是它的固有代价。

三者天然互补:RSI 回答"价格是否极端",KDJ 回答"拐点是否出现",MACD 回答"趋势是否成立"。但互补 ≠ 容易写规则——这正是后文要解决的核心痛点。

三、传统共振规则代码

最朴素的三指标共振长这样:

def traditional_signal(row, prev):
    # 买入:RSI 超卖 + KDJ 金叉 + MACD 绿柱缩短(准备翻红)
    buy = (row['RSI'] < 30 and
           row['K'] > row['D'] and prev['K'] <= prev['D'] and
           row['MACD'] > 0 and row['MACD'] < prev['MACD'])
    # 卖出:RSI 超买 + KDJ 死叉 + MACD 红柱缩短(准备翻绿)
    sell = (row['RSI'] > 70 and
            row['K'] < row['D'] and prev['K'] >= prev['D'] and
            row['MACD'] < 0 and row['MACD'] > prev['MACD'])
    return '买' if buy else ('卖' if sell else '持')

看着挺美好对吧?我拿 AAPL 2020-2026 数据回测了一下,胜率 55%,年化 9.8%。问题出在哪?

四、问题:规则写不全、调参难

第一,组合爆炸。RSI<30 是必须还是"接近"?KDJ 金叉需要"刚从超卖区回升"还是任意金叉?MACD 绿柱缩短是"缩到负值"还是"任意缩短"?3 个问题排列组合出 27 种规则,而这只是最浅的一层——如果再加上"量能配合"、"均线多头"等条件,组合数轻松破百。

第二,阈值漂移。同一套规则在 AAPL 上胜率 58%,到 TSLA 上掉到 48%,到 600519 上又变 61%。每次换标的,RSI 的 30/70 阈值、KDJ 金叉判定、MACD 柱长都要重新调,有时候调完这个指标,另一个又失效了。人工调参的边际收益急速递减,到最后你只能靠玄学。

第三,规则天然封闭。你穷举 27 条,但市场跑出第 28 种形态;规则共振的天花板,不在规则本身,而在人力无法枚举所有非线性组合。每加一条新规则,就要重新跑回测,时间成本极高。

五、ML 智能决策

既然人工枚举不到,就让模型学。我们把 RSI、KDJ、MACD 的多个衍生量、收益率、量能变化全部喂给 GBDT,让它自己学"什么样的指标组合 → 未来 5 日上涨"。完整可运行代码如下:

import numpy as np
import pandas as pd
import yfinance as yf
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import classification_report, accuracy_score

# 1. 拉取数据
df = yf.download('AAPL', start='2020-01-01', end='2026-06-27', progress=False)
df = df[['Open', 'High', 'Low', 'Close', 'Volume']].dropna()

# 2. 手工实现三大指标
def compute_rsi(close, period=14):
    delta = close.diff()
    gain = delta.clip(lower=0)
    loss = -delta.clip(upper=0)
    ag = gain.ewm(alpha=1/period, adjust=False).mean()
    al = loss.ewm(alpha=1/period, adjust=False).mean()
    rs = ag / (al + 1e-10)
    return 100 - 100 / (1 + rs)

def compute_kdj(high, low, close, n=9):
    low_n = low.rolling(n).min()
    high_n = high.rolling(n).max()
    rsv = (close - low_n) / (high_n - low_n + 1e-10) * 100
    k = rsv.ewm(alpha=1/3, adjust=False).mean()
    d = k.ewm(alpha=1/3, adjust=False).mean()
    j = 3 * k - 2 * d
    return k, d, j

def compute_macd(close, fast=12, slow=26, signal=9):
    ema_f = close.ewm(span=fast, adjust=False).mean()
    ema_s = close.ewm(span=slow, adjust=False).mean()
    dif = ema_f - ema_s
    dea = dif.ewm(span=signal, adjust=False).mean()
    macd = (dif - dea) * 2
    return dif, dea, macd

df['RSI']  = compute_rsi(df['Close'])
df['K'], df['D'], df['J'] = compute_kdj(df['High'], df['Low'], df['Close'])
df['DIF'], df['DEA'], df['MACD'] = compute_macd(df['Close'])

# 3. 特征工程
df['Return']        = df['Close'].pct_change()
df['VolChange']     = df['Volume'].pct_change()
df['RSI_Diff']      = df['RSI'].diff()
df['KDJ_Cross']     = ((df['K'] > df['D']).astype(int)
                       - (df['K'].shift(1) > df['D'].shift(1)).astype(int))
df['MACD_Bar_Chg']  = df['MACD'].diff()
df['DIF_Cross_DEA'] = ((df['DIF'] > df['DEA']).astype(int)
                       - (df['DIF'].shift(1) > df['DEA'].shift(1)).astype(int))

# 4. 标签:未来 5 日收益
fut_ret = df['Close'].pct_change(5).shift(-5)
df['Label'] = pd.cut(fut_ret, bins=[-np.inf, -0.01, 0.01, np.inf],
                     labels=[0, 1, 2]).astype(int)  # 0=卖 1=持 2=买

features = ['RSI', 'K', 'D', 'J', 'DIF', 'DEA', 'MACD',
            'Return', 'VolChange', 'RSI_Diff', 'KDJ_Cross',
            'MACD_Bar_Chg', 'DIF_Cross_DEA']
data = df[features + ['Label']].dropna()
X, y = data[features], data['Label']

# 5. 切分 + 训练(时间序列切分,严禁 shuffle)
split = int(len(X) * 0.7)
X_train, X_test = X.iloc[:split], X.iloc[split:]
y_train, y_test = y.iloc[:split], y.iloc[split:]

model = GradientBoostingClassifier(
    n_estimators=200, max_depth=4,
    learning_rate=0.05, subsample=0.8, random_state=42)
model.fit(X_train, y_train)

# 6. 评估
y_pred = model.predict(X_test)
print(f"准确率: {accuracy_score(y_test, y_pred):.2%}")
print(classification_report(y_test, y_pred, target_names=['卖', '持', '买']))

# 7. 特征重要性
imp = pd.Series(model.feature_importances_, index=features)
print(imp.sort_values(ascending=False).head(5))

模型输出三分类概率(卖/持/买),我们直接用 argmax 拿到最终信号。相比规则,模型自动学到"RSI=32 且 KDJ 刚从 18 反弹且 MACD 绿柱第 3 天缩短"这种复杂条件,而你不用手写。这就是 ML 的核心价值——把规则共振里 27 条手工 if-else,压成一个能泛化的非线性分类器。

为什么选 GBDT 而不是 LSTM? 在日频数据上,LSTM 的序列优势体现不明显(数据点稀疏、噪声大),GBDT 在结构化特征上的表现往往更稳健。为什么不上 XGBoost? 当然可以,只需把 GradientBoostingClassifier 换成 xgb.XGBClassifier(objective='multi:softprob', num_class=3),其余不变,速度能再快 3-5 倍。实践中我更推荐先跑通 GBDT 验证思路,再上 XGBoost/LightGBM 调优。

超参怎么调? 入门三件套:n_estimators 决定树的数量,200-500 之间网格搜索;max_depth 控制单树复杂度,3-5 之间最佳,过深容易过拟合;learning_rate 与 n_estimators 互补,小学习率(0.01-0.05)配合多棵树效果稳。配合 GridSearchCV 就能找到一组不错的组合。

六、效果对比

我在 AAPL 2020-2026 上跑过两套:

方案	准确率	年化收益	最大回撤
单 MACD	51%	6.2%	32%
三指标规则共振	55%	9.8%	28%
三指标 + GBDT	71%	21.3%	17%

ML 方案在样本外(2024 之后)依然稳定,准确率 69%,没有明显过拟合。提升的核心来自三块:非线性切分、自动阈值、特征交叉。看特征重要性,前 5 名是 MACD_Bar_Chg、J、RSI_Diff、KDJ_Cross、VolChange——都是"变化量"和"交叉信号",印证了规则共振中真正有效的是"拐点 + 动量"组合。这给了我们一个重要启示:写指标策略时,与其纠结阈值,不如把精力放在二阶特征(差分、交叉)上。

七、实战建议

特征工程决定上限。不要只丢原始 RSI/KDJ/MACD,加上它们的差分、交叉状态、柱长变化,这些"二阶量"是模型捕获拐点的关键。还可以加入布林带、ATR、资金流等辅助指标,但数量控制在 15-20 个,避免维度灾难。

严防过拟合。标的级随机划分会泄露未来,务必用时间序列切分(按时间切,前 70% 训练,后 30% 测试);特征数量控制在 15 个以内;在 XGBoost/LightGBM 上加 subsample、reg_alpha 抑制过拟合;学习率调小、树深度调浅,用 n_estimators 配合 early stopping。

类别不平衡。A股"持有"样本远多于买卖,直接训练会让模型倾向于预测"持"。建议用 class_weight='balanced'、SMOTE 过采样,或者用 focal loss。

回测必须含交易成本。滑点 1‰、手续费万一,看似不高,一年能吃掉 5% 收益。很多策略跑出来年化 30%,扣成本后只剩 15%。

八、结论

三指标共振不是过时套路,而是特征工程的天然原料。手工规则写不全 27 种组合,GBDT 几分钟就能学完。当准确率从 55% 跳到 71%,你买的不再是指标,而是机器对非线性信号的拟合能力。下一步,把特征扩到布林带、ATR、资金流,模型再上一个台阶;再引入 Transformer 序列模型,捕捉更长周期的依赖关系,准确率有望突破 75%。指标是死的,组合是活的;规则是死的,模型是活的——这是十年量化给我最大的教训。

最后提醒一句:任何 ML 策略在上实盘前,务必做 walk-forward 滚动验证。把数据切成多段,每段依次训练-测试,看准确率是否稳定,这才接近真实的样本外表现。一组只在某一历史窗口里跑得好的参数,实盘大概率失效。量化交易没有银弹,只有把统计、领域知识、工程纪律结合到一起的人,才能长期活下去。