데이터 한 그릇

분류연습)Credit Card Fraud Data 분석 본문

머신러닝/캐글 예제 연습

분류연습)Credit Card Fraud Data 분석

장사이언스 2021. 4. 15. 02:18
  1. 로지스틱 회귀 모형과 LightGBM 을 통해서 분류
  2. 임계값 조정과 GridSearchCV로 파라미터 최적화는 시키지 않았음
  3. 중요한 피처를 정규분포화 시킴(numpy log1p, StandaraScaler 사용)
  4. Class(타겟 피처)와 상관관계 높은 피처를 선정하여 이상치 제거 후 모델링 진행
  5. 데이터가 편향되어 있기 때문에 imblearn 패키지를 이용하여 SMOTE으로 오버 샘플링 진행

 

 

 

참고 : 파이썬 머신러닝 완벽 가이드

 

 

 

Credit Card Analysis.ipynb
0.05MB

Comments