카테고리 없음
[JupyterNotebook]데이터 전처리
meister9701
2024. 10. 30. 11:34
데이터를 받을 때 항상 숫자열에 숫자만 있고 결측값이 없이 깔끔하지는 않다.
그래서 데이터 분석을 하기전에 전처리를 진행해주어야한다.
데이터 전처리 과정들을 간략하게 알아볼 것이다.
데이터를 일단 간단하게 생성하여 데이터 프레임으로 만들었다.
이름이 지정되지 않은 Unnamed를 품목/년도로 새로 지정하여 모든 열이 제대로 된 이름을 가지도록 변경해주었다.
결측치인 -를 0으로 변환하여 결측값이 없도록 변경하였다.
숫자에 들어간 ,를 제거하여 숫자열에서 숫자만 남도록 변경하여 수식을 사용할 때 문제가 없도록 변경하였다.
인덱스가 비어있는데 이것을 품목/년도를 인덱스로 사용하도록 변경하여 데이터 전처리 과정을 끝냈다.