2 Matching Annotations
  1. Jul 2025
    1. successive training sets are supersets of those that come before them.

      superset

      与普通的交叉验证方法(如 KFold、ShuffleSplit 等)相比,TimeSeriesSplit 的各个训练集是逐折累积的,即后面的训练集包含前面训练集中的所有数据(并越来越大)。

      TimeSeriesSplit:用于时间序列数据,训练集随着折数增加而 不断扩张(expanding window)。也就是说:

      第一折训练集仅包含最早的一批数据;

      第二折训练集包含第一折的所有数据再+新增的一部分;

      第三折训练集则包含前两折所有数据再+新增一部分;

  2. Jul 2023
    1. features (X)

      این Feature در واقع همون صفت ها یا مقادیری که ما باهاشون میخوایم آموزش را یاد بدهیم. مثلا در همین مسئله شبکه ما این که IP و port و اینا چی باشه را بهش میگن Feature. در الگوریتم های نظارت شده این مقایدیری که حاصل کار است را میگن Label. مسئلن در مسئله خودمون این که نتیجه این ترافیک چیه را بهش میگن Label.