본문 바로가기

머신러닝

(4)
05.머신러닝 머신러닝 알고리즘의 속도와 정확도를 높이는 범 이 이론들을 사이킷 런과 판다스 라이브러리에 적용하는 법 1.데이터 전처리 : 데이터를 그대로 사용하지 않고, 가공해서 모델을 학습시키는데 좀 더 좋은 형식으로 만들어 주는 것 Feature Scaling 머신러닝 모델에 사용할 입력 변수들의 크기를 조정해서 일정 범위 내에 떨어지도록 바꾸는 것 --> 경사 하강법을 좀 더 빨리할 수 있게 도와 준다! -(min-max) normalization 최솟값 최댓값을 이용해서 데이터의 크기를 0과 1 사이로 바꿔준다 경사하강법 (복습) 선형회귀: 데이터가 가장 잘 맞는 선 또는 가설 함수 손실함수: 가설함수를 평가하기 위한 함수, 손실이 크면 가설 함수가 안 좋다는 뜻이고 손실이 작으면 가설 함수가 좋다는 뜻이다...
03. 머신러닝 머신러닝: 기계학습을 통해 발전하는 것 일반프로그램과 머신러닝 프로그램의 차이 -일반프로그램은 그 작동만 수행하는 반면 머신러닝 프로그래밍은 작동하면 작동할 수록 학습을 통해 더 잘하게 됨 ex) 스팸메일분류 프로그램이 스스로 규칙을 찾아 냄 어떻게 가능한가? -데이터 머신러닝: 기계가 학습한다는 건, 프로그램이 특정 작업(T)을 하는 데 있어서 경험(E)을 통해 작업의 성능 (P)을 향상시키는 것 -톰 미첼(Tom Mitchell) 머신러닝이 핫해진 이유 1. 사용할 수 있는 데이터가 많아졌다. 경험: 데이터 옛날에는 데이터가 충분하지 않았고 아날로그로 저장했고 굳이 저장도 안했음. 2. 컴퓨터 성능이 좋아졌다! 빠르게 연산할 수 있는 컴퓨터가 필요함 3.활용성이 증명되었다! 머신러닝-빅데이터-딥러닝-..
02. 머신러닝 1. Dataframe 인덱싱1 인덱싱: 데이터를 선택하는 것 데이터를 편하게 다루기 위해서 인덱싱을 자유자재로 다룰 수 있어야 함 iphone_df.loc['iphone8','메모리'] -->2GB iphone_df.loc['iphone8','가격'] -->에러 (가격이라는 칼럼이 없기 때문) iphone_df.loc['iphoneX',:] -->모든데이터 출력 iphone_df.loc['iphoneX'] --> " type(iphone_df.loc['iphoneX']) --> series iphone_df[:,'출시일'] --- iphone_df['출시일'] ---- 2. DataFrame 인덱싱2 여러줄을 한꺼번에 받아오기 iphone_df.loc['iphoneX'] iphone_df.loc[['i..
01.머신러닝