본문 바로가기

데이터분석/데이터분석5

[pandas] 인덱스 재정렬, 결측치 변환 df.reset_index(drop=True) : 새롭게 인덱스 정렬하기 df['columns'] = df['columns'].replace(np.nan, ' ') : 결측치를 ' '로 변환(마음대로 설정가능) 2020. 9. 14.
[alice] 파이썬 크롤링 alice 파이썬 크롤링 1. 크롤링의 기초 크롤링: 웹 페이지에서 필요한 데이터를 추출해내는 작업 크롤링 프로그램: 크롤러 ※ 필요한것 웹 페이지의 html을 얻기 위해 -> requests 라이브러리 가져온 html을 분석하기 위해 -> BeautifulSoup 라이브러리 [Beautiful Soup] html, json, xml등 파일의 구문을 분석하는 모듈 웹 페이지를 표현하는 html을 분석하기 위해 사용 find : 처음 등장하는 태그 찾기 find_all : 모든 태그 찾기 find('p').get_text() : 태그가 가지고 있는 텍스트 얻기 [requests 라이브러리] python에서 http 요청을 보낼 수 있는 모듈 get, post 요청 ※ F12 -> 개발자 도구 마우스 우클릭.. 2020. 9. 4.
[alice] 월드컵 데이터 분석(이수) 월드컵 데이터 분석 & 실력확인 테스트 df.astype(int) : data를 int형으로 바꿈 plt.tight_layout() : index값 이름 겹치지 않게함 [시험] 이때까지 했던 실습이 조금 변형되서 나왔다. 끝 ㅎㅎ '파이썬으로 시작하는 데이터분석 완강!' 더보기 2020. 7. 21.
[alice] Matplotlib Matplotlib Matplotlib : 데이터를 시각화하는 라이브러리 alice에서 하는 시각화방식과 수업에서 하는 방식이 살짝 달라서 헷갈렸던 부분이다. [수업내용] 바로 plt를 사용해서 그래프를 그린다. [alice 내용으로 바꾼 것] subplot()을 생성해서 그래프를 그린다. 이를 수업내용처럼 바꿔서 해보는데 잘되지않아 강사님에게 여쭤봤다. 그랬더니 fig, ax = plt.subplots()는 plt객체 ax를 만드는 코드라고 하셨다. 수업진도에 맞추어서 수업에서는 뺸 내용이라고 하셨다. plt.xlabel -> ax.set_xlabel plt.ylabel -> ax.set_ylabel plt.title -> ax.set_title plt.show()는 둘다 똑같았다. ※ pd연계 인덱싱.. 2020. 7. 19.
[alice] numpy, pandas 파이썬으로 시작하는 데이터 분석 alice 온라인 -> '파이썬으로 시작하는 데이터 분석' 여기에다가 기록하도록 하겠다. ※ 루프는 느리다. [NumPy] array = 단일타입 (array처럼 여러개 안댐) np.linspace(0,1,5) -> 0~1을 5구간으로 나눔 np.ndim : 몇차원? np.concatenate([x,y]) : x array + y array (이어붙이기) axis=0 아래방향으로, axis = 1 옆방향으로 np.split('np', [x], axis=0) : np의 x번째를 axis=0을 기준으로 2개의 array로 나누기 기본연산 o broadcasting : shape이 다른 array끼리 연산 // 이거 인공사부분에서 다뤄서 세세히 안쓰겠다. 집계함수 : sum().. 2020. 7. 17.
반응형