웹페이지 정보를 분석하는 일반적인 순서
파이썬에서 특정 웹페이지 정보를 가져와서 분석하는 작업은 다음 두가지 단계로 이뤄진다.
순서 | 하는 일 | 모듈 |
---|---|---|
1 | 웹페이지 정보를 가져온다. | import requests |
2 | 해당 웹페이지를 분석한다. | from bs4 import BeautifulSoup |
웹페이지 정보를 가져오는 모듈 - requests
우선 1번부터 살펴보자.
import requests
naver = requests.get("https://www.naver.com")
위와같이하면 naver
객체에 네이버 웹페이지 정보가 모두 담긴다.
내용확인은 naver.text
를 출력해보면 된다.
만약 다른 웹페이지 내용을 가져오고 싶다면 requests.get
에 네이버 주소를 해당 주소로 변경하면 된다.
naver 내용 확인
requests 모듈에대해 좀 더 알고 싶다면
requests
모듈은 http의 요청 메서드들을 대부분 지원하는데, 웹페이지를 가져오는데는 다음 두가지만 기억하면 된다.
- GET 메서드를 사용한다.
requests.get
의 리턴값이 200이면 정상, 400 이상의 숫자가 나오면 비정상이다.
자 이제 naver 객체를 분석해서 원하는 정보를 추출해야하는데, 이는 위에 2번에 언급한 bs4 모듈을 사용하게 된다. 이에 대한 내용은 다음에...
'초딩도 할 수 있는 파이썬 자동화' 카테고리의 다른 글
[초딩도 할 수 있는 파이썬] 티스토리 자동 로그인하기 (0) | 2022.09.29 |
---|---|
[초딩도 할 수 있는 파이썬] 강추 무료 학습 사이트 TOP 3 (2) | 2022.09.25 |
[초딩도 할 수 있는 파이썬] 네이버 많이 본 TV연예 뉴스 가져오기 (0) | 2022.09.23 |
[초딩도 할 수 있는 파이썬] 네이버 금융에서 코스피 지수 가져오기 (0) | 2022.09.23 |
파이썬을 활용한 자동화 팁 정리 (0) | 2022.09.20 |