메뉴 건너뛰기

목록
2023.03.27 15:09

코드검증용

profile
조회 수 17 댓글 0 예스잼 0 노잼 0

No Attached Image

import pandas as pd

import seaborn as sns

import numpy as np

import matplotlib.pyplot as plt 

 

train = pd.read_csv('train.csv')

test = pd.read_csv('test.csv')

 

train.columns

test.columns

 

plt.figure(figsize = (12,12))

sns.heatmap(data = train.corr(), annot =True)

 

train.isnull().sum()

 

# intensity 제거 

train = train.drop(['intensity'], axis =1)

 

def feature_change(train):

    # type

    train['type'] = train['type'].map({'white': 0, 'red' : 1})

    #sweetness

    train['sweetness'] = train['sweetness'].map({'dry': 0, 'off-dry' : 1, 'medium-sweet' : 2})

    return train

train = feature_change(train)

 

 

test = test.drop(['intensity'], axis = 1)

def feature_change(test):

    # type

    test['type'] = test['type'].map({'white': 0, 'red' : 1})

    #sweetness

    test['sweetness'] = test['sweetness'].map({'dry': 0, 'off-dry' : 1, 'medium-sweet' : 2})

    return test

test = feature_change(test)

 

# 이상치만 잘 다듬는다면... 

# 이 대회가 새로운 모델을 만들라는건 아니잖아? 

# 보는 눈(해석)이 중요하다 

train = train[train['density'] < 1.00128]

train = train[train['chlorides']< 0.3]

 

train.info()

train.shape

 

train = train.drop(['index'], axis = 1)

test = test.drop(['index'], axis = 1)

train_x = train.drop(columns=['quality'])

train_y = train['quality']

 

 

from sklearn.model_selection import train_test_split

train_x, val_x, train_y, val_y  = train_test_split(train_x, train_y, test_size=0.2, random_state=42)

 

print(train_x.shape)

print(val_x.shape)

print(train_y.shape)

print(val_y.shape)

 

from sklearn.ensemble import RandomForestClassifier

from sklearn.metrics import confusion_matrix

from sklearn.metrics import classification_report

 

model = RandomForestClassifier(n_estimators=375, max_depth=14, random_state=42)

model.fit(train.drop(columns='quality'),train['quality'])

 

y_pred = model.predict(val_x)

print(confusion_matrix(val_y, y_pred))

print(classification_report(val_y, y_pred))

 

submission = pd.read_csv('sample_submission.csv')

y_pred = model.predict(test)

submission['quality'] = y_pred

 

submission.to_csv('submission_labtop5.csv', index=False)

점검 필요

 

 


List of Articles
번호 제목 글쓴이 날짜 조회 수 추천
공지 수용소닷컴 이용약관 file asuka 2020.05.16 1339 1
1033 키 마우스 매핑 프로그램 만들었음 10 file '`' 2022.08.30 206 6
1032 클래스밖변수 따로 선언안하면 못쓰는줄알았는데 4 file 바보 2021.10.13 92 0
1031 클래스랑 메서드가 따로놀수가있는거임? 4 아트 2021.05.01 75 0
1030 크롬 리모트 데스크탑 신기하네 file 미니미니자궁맨 2021.09.17 56 0
1029 크로스 플랫폼이 말이 좋아 크로스인듯 1 MDR 2020.09.26 61 0
1028 쿨러깔아줘도 인터넷이끊기네 미니미니자궁맨 2021.09.09 34 0
1027 쿠르스칼 알고리즘 1 그리드 2022.11.15 18 0
1026 쿠다랑 엔비디아 다 날리고 새로 까는 중 2 삼육두유 2024.03.01 56 0
1025 콤퓨타 수정판 ㅍㅌㅊ? 19 file 문향 2020.05.20 132 0
1024 콤퓨타 ㅍㅌㅊ? 11 file 문향 2020.05.19 191 -1
1023 콜 바이 레퍼런스 왜 씀? 4 그리드 2022.12.31 40 0
1022 코린이 pyqt5 로 오토마우스 만들어봣어요 9 file 연습장 2021.11.15 72 0
1021 코린이 PyQt5 공부하고있어요 7 file 바보 2021.10.09 84 0
1020 코랩 써보고 있는데 질문 좀 5 삼육두유 2022.03.08 54 0
1019 코딩하기 좋은 노트북 추천좀 8 그리드 2022.05.30 50 0
1018 코딩하기 존나귀찮다 진짜 마루쉐 2021.01.11 82 0
1017 코딩은 혹시 외우는 것도 필요하냐 6 file 삼육두유 2022.03.14 77 0
1016 코딩 테스트 공부방법 추천 2 3 그리드 2022.12.18 40 0
1015 코딩 안한지 존나 오래됨 다람쥐 2020.07.26 84 0
1014 코딩 도움좀 6 비어있는머리통 2020.11.24 79 0
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 56 Next
/ 56