본문 바로가기

전체 글47

3. word2vec 속도 개선 보호되어 있는 글 입니다. 2021. 3. 19.
2. word2vec 보호되어 있는 글 입니다. 2021. 3. 17.
1. 기본 자료구조와 배열 보호되어 있는 글 입니다. 2021. 3. 14.
1. 자연어와 단어의 분산 표현 보호되어 있는 글 입니다. 2021. 3. 9.
5. 컨볼루션 신경망 - 텐서플로로 배우는 딥러닝 보호되어 있는 글 입니다. 2021. 3. 3.
4. AutoEncoder - 텐서플로로 배우는 딥러닝 보호되어 있는 글 입니다. 2021. 3. 2.
3. 판례 전문 txt파일로 저장하기 - 판례를 크롤링해보자 1. Intro 이전 포스트에서 판례 목록 전체를 불러와 csv파일로 저장했다. 이 데이터를 기반으로 이제 판례 전문 데이터를 불러와 txt파일로 저장하고자 한다. import pandas as pd import xml.etree.ElementTree as ET from urllib.request import urlopen from tqdm import trange import re import os 우선 필요한 라이브러리를 Import 하고 시작하도록 하겠다 2. 구현 이전 포스트에서 만들어냈던 csv파일에는 ['판례일련번호', '사건명', '사건번호', '선고일자', '법원명', '사건종류명', '사건종류코드', '판결유형', '선고', '판례상세링크'] 정보가 들어있다. 이중 판례 상세링크를 통해 .. 2021. 3. 1.
2. 판례 목록 수집 - 판례를 크롤링해보자 1. Intro 이전 포스팅에서 국가법령정보 Open API 사용법에 대해 간단히 알아보았다. 이제 제대로 판례 데이터를 수집해보고자 한다. 판례 데이터 수집은 2단계로 이루어진다. 판례 목록 데이터 수집 판례 본문 데이터 수집 굳이 판례 목록 데이터를 수집해주는 이유는, 판례 본문 데이터 조회때 필요하기 때문이다. 판례 본문을 조회할 때, 판례 일련번호 정보를 통해 조회하는데, 판례 일련번호 정보는 판례 목록 데이터에 존재한다. 이번 포스트에서는 판례 목록을 수집해 csv로 저장하도록 하겠다. 2. 수집 순서는 간단하다. url을 통해 XML 데이터를 받아온다 판례 관련 정보들만 추출한다 추출한 데이터들을 각 항목별로 정리한다 DataFrame으로 만들어 csv 파일로 저장한다 import pandas.. 2021. 2. 28.