参考资料
数据字典
data/finance_data.db 单库内所有表与关键字段的速查,按数仓分层(ODS / DWD / DWS / ADS)组织。
全系统数据落在单库 data/finance_data.db,按数仓分层组织。这一页是各表的速查;字段以代码中的实际定义为准。
ODS · 原始层
kline_data
原始 OHLCV,由 ingestion/data_loader.py 写入。
| 字段 | 含义 |
|---|---|
symbol | 标的代码 |
timestamp | 交易日(必须有序,否则时序因子报废) |
open / high / low / close | 价格 |
volume | 成交量(股数) |
source / interval / market | 数据源 / 周期 / 市场,用于多源隔离 |
sync_status
拉取水位线表,防止无限拉取死循环。
| 字段 | 含义 |
|---|---|
symbol / source / interval / market | 联合主键 |
last_checked_date | 上次检查到的日期 |
consecutive_empty_days | 连续无数据天数 |
status | active / 停用 |
DWD · 明细层
processed_kline_data
预处理产出的干净面板。
| 字段 | 含义 |
|---|---|
returns | 日收盘到收盘收益 |
vwap | 成交量加权均价 |
cap | 市值 |
| (含 OHLCV 经去极值 / 缺失值治理后的列) |
DWS · 汇总层
alpha_results
因子计算产出的 Alpha101 因子值。
| 字段 | 含义 |
|---|---|
symbol / timestamp | 标的 / 日期 |
alpha_xxx | 各因子值(经 NaN / Inf 校验) |
ADS · 应用层
由执行层写入。
| 表 | 内容 |
|---|---|
target_positions | 目标持仓(信号产出) |
execution_log | 成交记录(按真实权益幂等落库) |
daily_nav | 每日净值,支持重启恢复 |
一致性约束
跨层一致性由 data_quality.py 的 DQC 在每日流水线第 3 步审计:检查时间缺口、跨层对齐、字段合法性——数据进入因子计算前的质量门禁。