본문 바로가기

기타11

[잡담] 파이썬의 타입 힌트와 typing, mypy를 알아보자! 0. Intro 파이썬은 동적 타이핑 언어이다. 다시 말해, 하나의 변수가 타입에 구애받지 않는 데이터를 표시할 수 있다는 것이다. 그래서 동적 타이핑은 쉽고 간결한 코드를 만들 수 있다. 하지만 동적 타이핑 방식의 경우, 변수에 전달되는 값이 개발자가 원하는 것으로 전달되는지를 감시할 수 없다는 단점이 있다. 예컨대 특정 함수를 호출할 때, 특정 매개변수에는 Int가 전달되고, 다른 매개변수에는 str이 전달되어야 한다고 가정하자. 이것이 잘 되었는지, 잘못 되었는지는 실제 실행시키기 전까지는 파악하기 힘들다. 따라서 타입이 맞지 않아 발생하는 런타임 에러를 미연에 파악할 수 있도록 정적 타이핑 방식이 이용되는 것이다. 물론 코드가 불가피하게 길어진다거나 하는 단점이 존재하지만, 전달되는 값의 타입을 .. 2021. 3. 21.
3. 판례 전문 txt파일로 저장하기 - 판례를 크롤링해보자 1. Intro 이전 포스트에서 판례 목록 전체를 불러와 csv파일로 저장했다. 이 데이터를 기반으로 이제 판례 전문 데이터를 불러와 txt파일로 저장하고자 한다. import pandas as pd import xml.etree.ElementTree as ET from urllib.request import urlopen from tqdm import trange import re import os 우선 필요한 라이브러리를 Import 하고 시작하도록 하겠다 2. 구현 이전 포스트에서 만들어냈던 csv파일에는 ['판례일련번호', '사건명', '사건번호', '선고일자', '법원명', '사건종류명', '사건종류코드', '판결유형', '선고', '판례상세링크'] 정보가 들어있다. 이중 판례 상세링크를 통해 .. 2021. 3. 1.
2. 판례 목록 수집 - 판례를 크롤링해보자 1. Intro 이전 포스팅에서 국가법령정보 Open API 사용법에 대해 간단히 알아보았다. 이제 제대로 판례 데이터를 수집해보고자 한다. 판례 데이터 수집은 2단계로 이루어진다. 판례 목록 데이터 수집 판례 본문 데이터 수집 굳이 판례 목록 데이터를 수집해주는 이유는, 판례 본문 데이터 조회때 필요하기 때문이다. 판례 본문을 조회할 때, 판례 일련번호 정보를 통해 조회하는데, 판례 일련번호 정보는 판례 목록 데이터에 존재한다. 이번 포스트에서는 판례 목록을 수집해 csv로 저장하도록 하겠다. 2. 수집 순서는 간단하다. url을 통해 XML 데이터를 받아온다 판례 관련 정보들만 추출한다 추출한 데이터들을 각 항목별로 정리한다 DataFrame으로 만들어 csv 파일로 저장한다 import pandas.. 2021. 2. 28.
1. 국가법률정보 API 사용법 - 판례를 크롤링해보자 1. Intro 법제처에서는 국가법령정보 시스템을 통해 법령/판례 등 법률정보에 누구나 쉽게 접근할 수 있도록 하고 있다. 또한 Open API를 제공해, 편리하게 서비스를 이용할 수 있도록 하고 있다. 셀레니움으로 크롤링하려면 일주일 넘게 걸린다. 그냥 며칠 신청 시간이 걸리더라도, API를 사용하는 것이 정신건강에 이롭다. 2. 사용신청 국가법령정보 공동활용 홈페이지 회원가입을 한 후 로그인한다. 국가법령정보 공동활용 open.law.go.kr 로그인 후 OPEN API 사용 신청을 해야 한다. 목록 상단의 신청 버튼을 클릭한다. 그럼 다음과 같이 화면이 바뀌게 된다. 신청자 정보, 시스템 정보, 국가법령정보 활용에 관해 자세히 쓸 필요는 없다. 나는 단순 개인 연구용으로 기재했는데, 사용 신청 승인.. 2021. 2. 27.