Python 18

[JupyterNotebook]데이터 전처리

데이터를 받을 때 항상 숫자열에 숫자만 있고 결측값이 없이 깔끔하지는 않다.그래서 데이터 분석을 하기전에 전처리를 진행해주어야한다.데이터 전처리 과정들을 간략하게 알아볼 것이다.데이터를 일단 간단하게 생성하여 데이터 프레임으로 만들었다.이름이 지정되지 않은 Unnamed를 품목/년도로 새로 지정하여 모든 열이 제대로 된 이름을 가지도록 변경해주었다.결측치인 -를 0으로 변환하여 결측값이 없도록 변경하였다.숫자에 들어간 ,를 제거하여 숫자열에서 숫자만 남도록 변경하여 수식을 사용할 때 문제가 없도록 변경하였다.인덱스가 비어있는데 이것을 품목/년도를 인덱스로 사용하도록 변경하여 데이터 전처리 과정을 끝냈다.

카테고리 없음 2024.10.30

[JupyterNotebook]데이터 병합

어제 데이터 병합을 하는 방법인 concat을 잠깐 보았다.데이터 병합에 대해 좀 더 자세히 알아보자.기본적으로 concat은 행단위병합이다.열이 동일한 두 데이터 프레임을 간단하게 합칠 때 사용한다.행의 개수가 똑같고 다른 데이터 프레임과 서로 연관이 있을경우 axis를 이용해서 열단위로도 병합이 가능하다.이 때 열의 순서를 새로 지정할 수 있다.서로 열과 행이 다르고 한가지 열에서 데이터가 동일할 경우에는 위의 방법으로 병합을 하기가 힘들다.그래서 merge를 사용한 Join을 하게된다.기본적인 Join은 Inner Join이며 조인키를 기준으로 첫번째 데이터프레임에 두번째 데이터프레임을 병합한다.Left Join과 Right Join은 조인키가 없어도 병합이 가능하며, 각 데이터에서 없는 값은 빈칸..

Python 2024.10.29

[JupyterNotebook]Unpivot

Unpivot은 Pivot의 반대작업이다.수집해서 분석용 데이터로 만들었던 것을 다시 원래의 데이터 형태로 변환해 다른 분석데이터를 만들거나 새로운 데이터를 추가할 때 주로 사용하는 방법이다.데이터 프레임을 간단하게 만들어 봤다.stack을 이용하면 시리즈데이터로 다시 변환한다는 것을 알 수 있다.JupyterNotebook에서 Unpivot은 stack과 reset_index를 이용하여 할 수있다.다시 원래의 데이터로 돌아가고 열이름은 기본적으로 level과 숫자로 조합되기 때문에 열이름을 새로 부여해주어야한다.새로운 데이터를 만들어서 concat함수를 이용해서 병합하였다.데이터 병합에 관련된 것은 내일 더 자세히 알아볼 것이다. 지금은 concat이 병합을 해준다는 사실만 알고있자.새로운 데이터를 추..

Python 2024.10.28

[Python기초]사용자가 값 입력

Input을 이용해 사용자가 값을 직접 입력하게 할 수 있다.Input을 이용하여 실행하면 프롬프트창에서 입력을 할 수있다.그곳에 입력하면 그 값이 변수에 들어가게 만들었다. 숫자를 입력할 시에도 문자열로 기억되는것을 까먹지 말자.이것으로 간단한 사칙연산을 만들 수 있다.입력받은 값은 문자열이기때문에, 사칙연산이나 숫자로 무언가를 해야한다면 우선 int로 변환해야한다는 것을 잊지말자.

Python 2024.09.28

[Python기초]함수

Python에서 함수는 중요하다. 여러번 똑같은 작업을 반복할 것이라면 함수를 정의하여 간단한 방식으로 여러번의 사용이 가능하기 때문이다.def를 이용해 함수를 정의하고 def후에 함수 이름을 정한뒤 ()안에 요소를 넣을 수 있다.()안에 값이 바로 들어갈 수도 있고, 변수를 넣을 수도 있다.특히 손님에게 건네는 인사같은 경우에는 항상 같기 때문에 인자없이 리턴값을 넣어서 항상 그 값만 나오게 할 수도 있다.반대로 return없이 바로 명령어를 넣어서 return 없이 만들 수도 있다.함수는 여러개의 인자가 사용가능하며 몇개가 들어갈지 가늠이 안될 때에는 *args를 이용해 임의의 개수를 넣게 할 수도있으며, if를 이용해 인자값에 따라 함수의 내용을 변화시킬 수도 있다.

Python 2024.09.27

[Python기초]for문

for문은 while처럼 반복문을 형성해준다.같은 반복문이지만 for과 while은 다른것이 있는데, for문은 특정횟수를 반복해주고 while문은 특정조건을 만족할 때까지 반복해준다는 것이다.if를 for문을 넣어 특정 조건에 맞는다면 특정한 값을 반환하도록 맞출 수 있다.range를 이용하여 순서대로 올라가는 숫자를 넣을 수도 있다.range는 len과 조합하여 리스트 내의 숫자만큼 반복하도록 할 수 있으며, for문을 중복사용하여 값을 변화시키는걸 여러개 할 수도 있다.list comprehension을 이용하여 한문장으로 표현도 가능하다 여기서 if문까지 추가로 넣어서 조건을 맞출 수도 있다.

Python 2024.09.26

[Python기초]While문

While문은 반복문으로 속해있는 문장들을 반복해주는 문장이다while문은 특정조건을 만족한다면 반복을 멈추고 결과값을 받게할 수 있다.input을 이용하여 사용자가 특정값을 입력할 수도 있으며, if문의 문구를 이용해 이후 특정 값을 바꾸고 그 값이 0이되면 break를 이용해 특정조건에서 while문이 끝나게 할 수 있다.만일 무한루프에 빠지게되면 Ctrl+C를 사용해 강제로 종료할 수 있다.이를 통해 if문을 이용해 while내부의 값을 변동시켜 break가 있는 if문구까지 도달해 while문을 종료시킬 수 있다.

Python 2024.09.25

[Python기초]if문

If 문을 이용해 특정 조건에서 값을 반환할 수도 있다.수식을 사용해서 참 거짓을 나타낼 수도 있고, 참 거짓을 미리 대입할 수도 있다.특이사항으로는 같다는건 ==를 사용해야하고 !=를 이용하면 같지 않다면을 반환받을 수도 있다.elif, else등을 사용해 if 조건이 아닐때 elif로 다른 조건을 넣거나, if 및 elif 조건에 맞지않는 값을 else로 받을 수 있다in을 이용해 List, Tuple, String등 다양한 data에서 내부에 존재하는 지 확인할 수 있으며, not in을 사용하면 없을 때 값을 반환해준다.

Python 2024.09.24