본문 바로가기

카테고리 없음

-3주차 크롤링 기초-

코로나에걸리고 여러가지 이유로 강의를 한동안 듣지 못했다.

 

정신차리고 밀린 강의를 들어야한다..ㅠㅠ

 

 

크롤링이란? 데이터를 수집하고 분류하는 것

 

headers = 브라우저에 엔터를 치는 것 처럼 가능하게 해준다.

 

 

text내용을 가져오고 싶을 땐

 

print(title.text)

 

속성을 가져오고 싶을 땐 꺽쇠[] 사용

print(title['href'])

 

for tr in trs:
    a_tag = tr.select('td.title > div > a')
     print(a_tag.text)

영화목록의 text를 가져오기위해 실행시키면 오류가 난다 (None 값이 포함되어 있기 때문에)