프로그래밍/Python

df.rename(columns={'Before':'After'})
크롤링을 진행하거나 시간이 많이 걸리는 작업을 할때 현재 진행상태가 얼마나 됐는지 궁금할 것이다. 이때 상태바를 이용해서 진행상태를 파악할 수 있다. 코드는 간단하다 from tqdm import tqdm_notebook for i in tqdm_notebook(df.index) : 코드 이렇게 tqdm_notebook import해주고 for문에서 사용을 하면 끝이다!!
외부 파일 읽어오기 이름이 비슷한 같은 형식의 파일 여러개 있을때 한번에 읽어오는 방법 관련 패키지 : glob 파일 경로 및 이름을 모아서 리스트에 저장 문자 사용 가능 ex. 주유소*.xlsx (주유소로 시작하는 모든 xlsx 파일) from glob import glob # 지정된 디렉터리내의 특정 문자열을 포함하는 파일들의 파일명을 리스트로 반환 f = glob('./crawl_data/지역_위치별*.xls') f : 이렇게 저장된 데이터들을 한번에 불러올 수 있다.
이 게시글은 데이터사이언스엔지니어링_전문가 과정을 수강하며 복습을 위해 정리한 글입니다. 판다스 설명(pandas) - series, DataFrame등의 자료구조를 활용한 데이터분석 기능을 제공해주는 라이브러리 - 라이브러리 구성 - 여러종류의 클래스와 다양한 함수로 구성 - 시리즈와 데이터 프레임의 자료 구조 제공 - 시리즈(1차원 배열) 데이터프레임(2차원 행열구조) 판다스의 목적 - 서로 다른 유형의 데이터를 공통된 포맷으로 정리하는 것 - 행과 열로 이루어진 2차원 데이터프레임을 처리 할 수 있는 함수제공 목적 - 실무 사용 형태 : 데이터 프레임 Series pandas의 기본 객체 중 하나 numpy의 ndarray를 기반으로 인덱싱을 기능을 추가하여 1차원 배열을 나타냄 index를 지정하..
seojeon9
'프로그래밍/Python' 카테고리의 글 목록 (3 Page)