파이썬(Python) 경기일보 최신 기사 파싱하기

파이썬 크롤링(Python Crawling)2018. 12. 8. 21:56

뷰어
댓글로
이전글
다음글

728x90

소스코드는 다음과 같습니다.

import urllib.request
from bs4 import BeautifulSoup

def main():
    url = "http://www.kyeonggi.com/news/articleList.html?sc_section_code=S1N2&view_type=sm"
    soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser")

    list_title = []
    list_content = []

    # 기사 제목 파싱
    for news_title in soup.find_all("div", class_="list-titles"):
        list_title.append(news_title.get_text())

    # 기사 요약 파싱
    for news_content in soup.find_all("p", class_="list-summary"):
        list_content.append(news_content.get_text())

    print(list_title)
    print(list_content)


if __name__ == "__main__":
    main()

728x90

저작자표시 비영리 변경금지

'파이썬 크롤링(Python Crawling)' 카테고리의 다른 글

파이썬(Python) 네이버 영화 리뷰 파싱하기 (0)	2018.12.08
파이썬(Python) 클리앙 게시판 파싱하기 (1)	2018.12.08
파이썬(Python) 네이버 인기 검색어 파싱하기 (0)	2018.12.08
셀레니움(Selenium)을 활용해 네이버 자동 로그인 및 메일 정보 가져오기 (2)	2018.08.20
웹 크롤러(Web Crawler)로 자동 로그인 및 주요 정보 추출하기 (0)	2018.08.20

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

« 2025/03 »

일

월

화

수

목

금

토

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

안경잡이개발자

파이썬(Python) 경기일보 최신 기사 파싱하기

'파이썬 크롤링(Python Crawling)' 카테고리의 다른 글

최근에 올라온 글

최근에 달린 댓글

공지사항

글 보관함

최근에 받은 트랙백

링크

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역