728x90
https://jonsyou.tistory.com/23
- Group K-Fold
Group K-Fold는 동일한 그룹이 훈련 및 검증 데이터 셋에 동시에 포함되지 않도록 하는 방법.
a visualization of the group K-fold cross-validation behavior
from sklearn.model_selection import GroupKFold
X = [0.1, 0.2, 2.2, 2.4, 2.3, 4.55, 5.8, 8.8, 9, 10]
y = ["a", "b", "b", "b", "c", "c", "c", "d", "d", "d"]
groups = [1, 1, 1, 2, 2, 2, 3, 3, 3, 3]
gkf = GroupKFold(n_splits=3)
for train, test in gkf.split(X, y, groups=groups):
print("%s %s" % (train, test))
>
[0 1 2 3 4 5] [6 7 8 9]
[0 1 2 6 7 8 9] [3 4 5]
[3 4 5 6 7 8 9] [0 1 2]
728x90
'정리' 카테고리의 다른 글
Bayse's rule(베이즈 정리) (0) | 2023.04.13 |
---|---|
[colab+spark] colab에서 spark 쓰는법 (0) | 2021.12.01 |
[pandas] Datetime index (0) | 2021.09.01 |
[210827_라이브 강의] 2. 데이터 전처리-상관관계 분석, 3. 예측모델 구현 (1) | 2021.08.27 |
[210827] 의사결정나무(decision Tree) (0) | 2021.08.27 |