웹 크롤러란

image.png

크롤링을 위한 선행 학습

자동화 데이터 수집 절차

image.png

크롤링(Crawling) 방식

정적 수집 동적 수집
사용패키지 requests / urllib seleninm
수 커버리지 정적 웹 페이지 정적 / 동적 웹 페이지
수집 속도 빠름( 별도 페이지 조작 필요 X) 상대적으로 느림
파싱 패키지
수집 순서