메뉴 건너뛰기

목록
2023.03.27 15:09

코드검증용

profile
조회 수 17 댓글 0 예스잼 0 노잼 0

No Attached Image

import pandas as pd

import seaborn as sns

import numpy as np

import matplotlib.pyplot as plt 

 

train = pd.read_csv('train.csv')

test = pd.read_csv('test.csv')

 

train.columns

test.columns

 

plt.figure(figsize = (12,12))

sns.heatmap(data = train.corr(), annot =True)

 

train.isnull().sum()

 

# intensity 제거 

train = train.drop(['intensity'], axis =1)

 

def feature_change(train):

    # type

    train['type'] = train['type'].map({'white': 0, 'red' : 1})

    #sweetness

    train['sweetness'] = train['sweetness'].map({'dry': 0, 'off-dry' : 1, 'medium-sweet' : 2})

    return train

train = feature_change(train)

 

 

test = test.drop(['intensity'], axis = 1)

def feature_change(test):

    # type

    test['type'] = test['type'].map({'white': 0, 'red' : 1})

    #sweetness

    test['sweetness'] = test['sweetness'].map({'dry': 0, 'off-dry' : 1, 'medium-sweet' : 2})

    return test

test = feature_change(test)

 

# 이상치만 잘 다듬는다면... 

# 이 대회가 새로운 모델을 만들라는건 아니잖아? 

# 보는 눈(해석)이 중요하다 

train = train[train['density'] < 1.00128]

train = train[train['chlorides']< 0.3]

 

train.info()

train.shape

 

train = train.drop(['index'], axis = 1)

test = test.drop(['index'], axis = 1)

train_x = train.drop(columns=['quality'])

train_y = train['quality']

 

 

from sklearn.model_selection import train_test_split

train_x, val_x, train_y, val_y  = train_test_split(train_x, train_y, test_size=0.2, random_state=42)

 

print(train_x.shape)

print(val_x.shape)

print(train_y.shape)

print(val_y.shape)

 

from sklearn.ensemble import RandomForestClassifier

from sklearn.metrics import confusion_matrix

from sklearn.metrics import classification_report

 

model = RandomForestClassifier(n_estimators=375, max_depth=14, random_state=42)

model.fit(train.drop(columns='quality'),train['quality'])

 

y_pred = model.predict(val_x)

print(confusion_matrix(val_y, y_pred))

print(classification_report(val_y, y_pred))

 

submission = pd.read_csv('sample_submission.csv')

y_pred = model.predict(test)

submission['quality'] = y_pred

 

submission.to_csv('submission_labtop5.csv', index=False)

점검 필요

 

 


List of Articles
번호 제목 글쓴이 날짜 조회 수 추천
공지 수용소닷컴 이용약관 file asuka 2020.05.16 1312 1
1012 결국 교수상이 AI를 언급해버리고 말았음 2 file 삼육두유 2023.04.05 66 0
1011 개인용 1 나는무적이다코인은신이고 2023.04.05 16 0
1010 회귀분석만 하면 뭐함? 1 삼김식감 2023.04.03 26 0
1009 MSE 에 루트 씌우면 RSME 라는데 삼김식감 2023.04.02 14 0
1008 대충 써봄 6 file 삼김식감 2023.04.01 29 0
1007 시발 file 삼김식감 2023.03.27 38 0
1006 대회에 대해 생각해봤음 삼김식감 2023.03.27 28 0
» 코드검증용 삼김식감 2023.03.27 17 0
1004 데이터 분석 잘하는 수붕이 있냐 file 삼김식감 2023.03.27 11 0
1003 .dat 파일형식 만드는 방법좀 삼김식감 2023.03.27 24 0
1002 다듬은 내용 3 file 삼김식감 2023.03.25 22 0
1001 트레이닝세트하고 테스트셋 설명좀 11 file 삼김식감 2023.03.25 24 0
1000 씨발 삼김식감 2023.03.24 12 0
999 내일까지 ... 해본다 삼김식감 2023.03.24 5 0
998 안드로이드 프로그래밍 절반정도는 말에미쳤다 2023.03.19 29 0
997 기계학습 다시 공부하니까 말에미쳤다 2023.03.19 27 0
996 안드로이드 과제해결 ... 1 말에미쳤다 2023.03.17 24 0
995 정수를 2진수로 변환하여 출력하는 프로그램을 작성해보자 (자바) 1 말에미쳤다 2023.03.17 37 1
994 jdk 처음으로 받아봤음 4 말에미쳤다 2023.03.09 37 0
993 삭제된 게시글입니다. midori 2023.03.06 28 0
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 56 Next
/ 56