successive training sets are supersets of those that come before them.
superset
与普通的交叉验证方法(如 KFold、ShuffleSplit 等)相比,TimeSeriesSplit 的各个训练集是逐折累积的,即后面的训练集包含前面训练集中的所有数据(并越来越大)。
TimeSeriesSplit:用于时间序列数据,训练集随着折数增加而 不断扩张(expanding window)。也就是说:
第一折训练集仅包含最早的一批数据;
第二折训练集包含第一折的所有数据再+新增的一部分;
第三折训练集则包含前两折所有数据再+新增一部分;