본문 바로가기

기타/파이썬6

2. 판례 목록 수집 - 판례를 크롤링해보자 1. Intro 이전 포스팅에서 국가법령정보 Open API 사용법에 대해 간단히 알아보았다. 이제 제대로 판례 데이터를 수집해보고자 한다. 판례 데이터 수집은 2단계로 이루어진다. 판례 목록 데이터 수집 판례 본문 데이터 수집 굳이 판례 목록 데이터를 수집해주는 이유는, 판례 본문 데이터 조회때 필요하기 때문이다. 판례 본문을 조회할 때, 판례 일련번호 정보를 통해 조회하는데, 판례 일련번호 정보는 판례 목록 데이터에 존재한다. 이번 포스트에서는 판례 목록을 수집해 csv로 저장하도록 하겠다. 2. 수집 순서는 간단하다. url을 통해 XML 데이터를 받아온다 판례 관련 정보들만 추출한다 추출한 데이터들을 각 항목별로 정리한다 DataFrame으로 만들어 csv 파일로 저장한다 import pandas.. 2021. 2. 28.
1. 국가법률정보 API 사용법 - 판례를 크롤링해보자 1. Intro 법제처에서는 국가법령정보 시스템을 통해 법령/판례 등 법률정보에 누구나 쉽게 접근할 수 있도록 하고 있다. 또한 Open API를 제공해, 편리하게 서비스를 이용할 수 있도록 하고 있다. 셀레니움으로 크롤링하려면 일주일 넘게 걸린다. 그냥 며칠 신청 시간이 걸리더라도, API를 사용하는 것이 정신건강에 이롭다. 2. 사용신청 국가법령정보 공동활용 홈페이지 회원가입을 한 후 로그인한다. 국가법령정보 공동활용 open.law.go.kr 로그인 후 OPEN API 사용 신청을 해야 한다. 목록 상단의 신청 버튼을 클릭한다. 그럼 다음과 같이 화면이 바뀌게 된다. 신청자 정보, 시스템 정보, 국가법령정보 활용에 관해 자세히 쓸 필요는 없다. 나는 단순 개인 연구용으로 기재했는데, 사용 신청 승인.. 2021. 2. 27.