초딩도 할 수 있는 파이썬 자동화

[초딩도 할 수 있는 파이썬] 네이버 웹페이지 가져오기

나도한다코딩 2022. 9. 20. 22:58

웹페이지 정보를 분석하는 일반적인 순서

파이썬에서 특정 웹페이지 정보를 가져와서 분석하는 작업은 다음 두가지 단계로 이뤄진다.

 

순서 하는 일 모듈
1 웹페이지 정보를 가져온다. import requests
2 해당 웹페이지를 분석한다. from bs4 import BeautifulSoup

 

웹페이지 정보를 가져오는 모듈 - requests

우선 1번부터 살펴보자.

 

import requests
naver = requests.get("https://www.naver.com")

 

위와같이하면 naver 객체에 네이버 웹페이지 정보가 모두 담긴다.
내용확인은 naver.text를 출력해보면 된다.
만약 다른 웹페이지 내용을 가져오고 싶다면 requests.get에 네이버 주소를 해당 주소로 변경하면 된다.

 

naver 내용 확인

 


 

requests 모듈에대해 좀 더 알고 싶다면

requests 모듈은 http의 요청 메서드들을 대부분 지원하는데, 웹페이지를 가져오는데는 다음 두가지만 기억하면 된다.


  1. GET 메서드를 사용한다.
  2. requests.get의 리턴값이 200이면 정상, 400 이상의 숫자가 나오면 비정상이다.

200이 리턴되었으므로 정상 동작임을 알 수 있다.

 

자 이제 naver 객체를 분석해서 원하는 정보를 추출해야하는데, 이는 위에 2번에 언급한 bs4 모듈을 사용하게 된다. 이에 대한 내용은 다음에...