2022小美赛C题

主要讲解团队对2022小美赛C题的讲解,包含讲解与代码,赛题data。全部为python代码,基本不会提供代码注释及逻辑。

该题主要为时间序列分类,团队尝试的方法如下:

  1. 决策树、随机森林、极限森林分类(DecisionTreeClassifier、 RandomForestClassifier、 ExtraTreesClassifier)在文章中将简写为DTC、RFC、ETC
  2. 带有时间序列的决策树分类(MultivariateClassifier、 TimeSeriesForest)在文章中TimeSeriesForestClassifier将简写为TSFC
  3. LSTM 团队采用 DeepConvLSTM在文章中将简写为DCLSTM
  4. NSGA2剪枝优化

讲解顺序:python库→数据预处理:3\sigma与滤波→数据处理与导入(不含前一步的处理)→决策树等分类→TSFC→DCLSTM→GA决策树剪枝优化。总体结论:极限森林在赛题数据分类效果最好。

文章思路:数据处理→决策树分类→DCLSTM→算法对比→NSGA2对极限森林过拟合优化。

代码有前后关联性,后面代码没有的函数请到前面找。代码非常庞大,请耐心观看。

1.python库

python库

2. 3\sigma and filter

Preprocess

3. 数据处理

其中:num为选择哪些传感器,n_class为选择哪些活动进行分类

Data process

4. 决策树等分类

说明:代码包含k-fold cross-validation,其中注释代码可用作别的用途,具体你要画什么图就用什么代码。

Classifier

5. TFSC

TFSC

6. DCLSTM

DCLSTM

7. NSGA-ii剪枝优化

NSGA2

发表评论

您的电子邮箱地址不会被公开。

浙ICP备2021019730-1    浙公网安备 33010902002953号
Copyright © 2022 PanCake