基础概念
Alpha101 是什么
WorldQuant 于 2015 年公开的 101 个量价因子:公式结构、数据依赖、信号周期特征,以及在因子拥挤环境下的定位。
2015 年,WorldQuant 的研究员 Zura Kakushadze 公开了一篇论文《101 Formulaic Alphas》,把 101 个真实用于交易的量价因子原原本本写了出来。这就是 Alpha101。
公式结构
每个因子都是一个纯公式,仅以价量数据为输入,输出一个可用于截面排序的评分。例如 Alpha#101:
alpha101 = (close - open) / ((high - low) + 0.001)当日实体涨跌幅占振幅的比例,衡量日内多空力量的净方向。更典型的复合形态如 Alpha#001:
alpha001 = rank(ts_argmax(signedpower(((returns < 0) ? stddev(returns, 20) : close), 2), 5)) - 0.5公式拆解:先按条件选取「收益为负时的波动率 / 否则取收盘价」,平方后取过去 5 天最大值出现的位置,最后做截面 rank。所有组件均为标准算子的嵌套。
共同形态
读完 101 个因子,会发现它们高度同构:
- 输入只有价量:
open / high / low / close / volume / vwap / returns / cap / adv{d},外加行业分类IndClass。不依赖财报、新闻、另类数据。 - 几乎都以
rank收尾:因子值本身的绝对大小没意义,截面上的相对排名才是信号——这决定了整套系统是「截面」问题而非「时序」问题。 - 短周期:回看窗口大多在几天到二十几天,信号半衰期约 0.6–6.4 天。这意味着它天然偏高频,和周频(5 日)调仓存在张力。
数据依赖
| 字段 | 含义 | 在本系统的来源 |
|---|---|---|
open/high/low/close/volume | 日频 OHLCV | Alpaca,落 kline_data |
returns | 日收盘到收盘收益 | 预处理 DWD |
vwap | 日成交量加权均价 | 预处理 DWD |
cap | 市值 | 预处理 DWD |
adv{d} | 过去 d 天平均成交金额 | 算子层计算(注意是金额不是股数,见 adv 的语义背叛) |
IndClass | 行业 / 板块分类 | fetch_classification.py,供 indneutralize |
公开因子的当前价值
一个 2015 年公开、广为人知的因子集,是否仍具备超额收益?
客观判断:单因子 Alpha 随拥挤度上升而持续衰减,且存在踩踏风险。Alpha101 在本系统中的价值不在于某个因子的绝对收益,而在于它提供了一套数量充足、彼此正交、可批量评估的因子原料。系统的核心竞争力在于持续生产、测试与淘汰因子的工程化能力。详见反思与路线图。
深度解读 Alpha101
逐个拆解 101 个因子的构造逻辑、信号特征与实战表现,配合代码实现与回测验证。
延伸
- 核心概念辨析:截面 rank、IC、中性化都在这里。
- 手册:3. 因子与信号 DWS——101 个因子在代码里怎么实现。