코드검증용 - 기술동

import pandas as pd

import seaborn as sns

import numpy as np

import matplotlib.pyplot as plt

train = pd.read_csv('train.csv')

test = pd.read_csv('test.csv')

train.columns

test.columns

plt.figure(figsize = (12,12))

sns.heatmap(data = train.corr(), annot =True)

train.isnull().sum()

# intensity 제거

train = train.drop(['intensity'], axis =1)

def feature_change(train):

# type

train['type'] = train['type'].map({'white': 0, 'red' : 1})

#sweetness

train['sweetness'] = train['sweetness'].map({'dry': 0, 'off-dry' : 1, 'medium-sweet' : 2})

return train

train = feature_change(train)

test = test.drop(['intensity'], axis = 1)

def feature_change(test):

# type

test['type'] = test['type'].map({'white': 0, 'red' : 1})

#sweetness

test['sweetness'] = test['sweetness'].map({'dry': 0, 'off-dry' : 1, 'medium-sweet' : 2})

return test

test = feature_change(test)

# 이상치만 잘 다듬는다면...

# 이 대회가 새로운 모델을 만들라는건 아니잖아?

# 보는 눈(해석)이 중요하다

train = train[train['density'] < 1.00128]

train = train[train['chlorides']< 0.3]

train.info()

train.shape

train = train.drop(['index'], axis = 1)

test = test.drop(['index'], axis = 1)

train_x = train.drop(columns=['quality'])

train_y = train['quality']

from sklearn.model_selection import train_test_split

train_x, val_x, train_y, val_y = train_test_split(train_x, train_y, test_size=0.2, random_state=42)

print(train_x.shape)

print(val_x.shape)

print(train_y.shape)

print(val_y.shape)

from sklearn.ensemble import RandomForestClassifier

from sklearn.metrics import confusion_matrix

from sklearn.metrics import classification_report

model = RandomForestClassifier(n_estimators=375, max_depth=14, random_state=42)

model.fit(train.drop(columns='quality'),train['quality'])

y_pred = model.predict(val_x)

print(confusion_matrix(val_y, y_pred))

print(classification_report(val_y, y_pred))

submission = pd.read_csv('sample_submission.csv')

y_pred = model.predict(test)

submission['quality'] = y_pred

submission.to_csv('submission_labtop5.csv', index=False)

점검 필요

List of Articles
번호	제목	글쓴이	날짜	조회 수	추천
공지	수용소닷컴 이용약관	asuka	2020.05.16	1340	1
116	트레이닝세트하고 테스트셋 설명좀 11	삼김식감	2023.03.25	24	0
115	다듬은 내용 3	삼김식감	2023.03.25	22	0
114	.dat 파일형식 만드는 방법좀	삼김식감	2023.03.27	24	0
113	데이터 분석 잘하는 수붕이 있냐	삼김식감	2023.03.27	11	0
»	코드검증용	삼김식감	2023.03.27	17	0
111	대회에 대해 생각해봤음	삼김식감	2023.03.27	28	0
110	시발	삼김식감	2023.03.27	38	0
109	대충 써봄 6	삼김식감	2023.04.01	29	0
108	MSE 에 루트 씌우면 RSME 라는데	삼김식감	2023.04.02	14	0
107	회귀분석만 하면 뭐함? 1	삼김식감	2023.04.03	26	0
106	개인용 1	나는무적이다코인은신이고	2023.04.05	16	0
105	결국 교수상이 AI를 언급해버리고 말았음 2	삼육두유	2023.04.05	66	0
104	블록체인 공부 시작하겠음...	삼김식감	2023.04.07	21	0
103	23-03 삼성 코테풀이 1	삼김식감	2023.04.10	56	0
102	오늘 학교 과제내준거	삼김식감	2023.04.11	33	0
101	matlab 으로 매크로를 만들 수 있을까 2	삼육두유	2023.04.15	55	0
100	농림수산성이 업무에 챗GPT 투입 2	柊かがみ	2023.04.18	40	0
99	삭제된 게시글입니다.	쓰레기	2023.04.19	17	0
98	삭제된 게시글입니다.	저능아	2023.04.19	12	0
97	C++에서의 구조체와 클래스 사용...	나무터칭수필맨	2023.04.20	31	0

글쓴이

공지

수용소닷컴 이용약관 file