파이썬(Python) 경기일보 최신 기사 파싱하기
파이썬 크롤링(Python Crawling)2018. 12. 8. 21:56
728x90
반응형
소스코드는 다음과 같습니다.
import urllib.request from bs4 import BeautifulSoup def main(): url = "http://www.kyeonggi.com/news/articleList.html?sc_section_code=S1N2&view_type=sm" soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser") list_title = [] list_content = []
# 기사 제목 파싱 for news_title in soup.find_all("div", class_="list-titles"): list_title.append(news_title.get_text())
# 기사 요약 파싱 for news_content in soup.find_all("p", class_="list-summary"): list_content.append(news_content.get_text()) print(list_title) print(list_content) if __name__ == "__main__": main()
728x90
반응형
'파이썬 크롤링(Python Crawling)' 카테고리의 다른 글
파이썬(Python) 네이버 영화 리뷰 파싱하기 (0) | 2018.12.08 |
---|---|
파이썬(Python) 클리앙 게시판 파싱하기 (1) | 2018.12.08 |
파이썬(Python) 네이버 인기 검색어 파싱하기 (0) | 2018.12.08 |
셀레니움(Selenium)을 활용해 네이버 자동 로그인 및 메일 정보 가져오기 (2) | 2018.08.20 |
웹 크롤러(Web Crawler)로 자동 로그인 및 주요 정보 추출하기 (0) | 2018.08.20 |