Tiny Star

✨Framework+Library/🐼PANDAS 3

[🐼Pandas] csv/xlsx/SQL 데이터 다루기

판다스(Pandas)에서는 다양한 형태의 데이터를 데이터프레임 또는 시리즈 객체로 생성하고 불러와서 데이터를 가공할 수 있다고 지난 포스팅에 적어놓았다. 직접 코드에 생성하지 않아도 csv, xlsx, SQL 등으로 데이터를 불러와서 가공을 할 수도 있다. 데이터 불러오기 1) CSV(Comma-Separated Values) 먼저 csv 파일형식은 몇 가지 필드를 쉼표로 구분한 텍스트 데이터 및 텍스트 파일인데, 이 csv파일 데이터를 불러오는 방법이다. import pandas as pd # CSV 파일 불러오기 df = pd.read_csv('data.csv') 2) Excel / xlsx 많이 사용하는 스프레드시트 프로그램에서 생성한 데이터를 저장하는 파일 형식으로 csv와 차이는 read_뒤에 ..

[🐼Pandas] Data 객체 데이터 다루기

판다스(Pandas)에 대해 소개할 때 단순히 Data 객체가 어떻게 생성되는지 예시코드만 던졌었다. 여기서는 객체의 행 또는 열을 선택하거나 추가/삭제/변경 등의 기능을 좀 더 상세히 적어놓으려 한다. DataFrame 객체 행과 열로 이루어진 2차원 데이터를 다루기 위한 것으로 열은 각각의 변수, 행은 관측치를 나타낸다. [생성하기] 데이터를 생성할 때는 list, dict(딕셔너리), EXCEL 등 다양하게 생성을 할 수 있다. 1. list를 사용해서 Data Frame 객체 생성하기 import pandas as pd #pandas 대신 pd 라는 별칭 사용의 의미 data = [['A', 1]], ['B',2], ['C',3]] df = pd.DataFrame(data, columns ['co..

[🐼Pandas] 데이터 분석을 위한 라이브러리 : Pandas / 라이브러리 소개 / 설치방법

자바만 열심히 파던 내가 어쩌다보니 파이썬을 사용해 데이터 파싱/분석을 해야할 일이 생겨서 천천히 공부 중인 판다스. 나처럼 갑자기 구명조끼 하나없이 냅다 데이터의 바다에 던져 질 사람들을 위해 판다스가 뭔지부터 정리해본다. 판다스(Pandas)? 파이썬에서 데이터 조작이나 분석을 위한 라이러리 중 하나로, 특히 표 형태의 데이터를 다루는데 유용한 라이브러리이며, 데이터를 구조화하고 처리하는데 사용된다. 판다스(Pandas)는 데이터 과학 및 머신러닝 분야에서 널리 사용되고 있고 데이터의 전처리부터 분석이나 모델링, 데이터 조작, 정제, 분석, 시각화 등이 가능하도록 다양한 기능을 제공한다. 판다스(Pandas)는 데이터프레임(DataFrame)과 시리즈(Serise)라는 두 가지의 주요 자료구조를 제공..