본문 바로가기

기타/파이썬6

m1 맥에 konlpy를 설치해보자! m1 맥 유저로 살아간다는 건 피곤한 일이다.. 하지만 200만원 주고 노트북을 샀으니, 열심히 살아가야지.. 이번에는 m1 맥에 konlpy를 설치해보도록 하자. 아래 블로그 글을 참고해서 설치했다. M1 Mac에서의 JVM/JDK 문제 - konlpy Ask questionsM1 Mac에서의 JVM/JDK 문제 M1 칩이 탑재된 맥에서 java 환경변수가 설정되어 있지 않거나, JDK가 설치되어 있고 환경변수가 설정되어 있더라도 JDK에 따라 konlpy를 사용할 때 다음과 같은 오류 www.gitmemory.com 우선 jdk를 설치해줘야 한다. 요즘 m1전용 jdk가 많이들 나왔다지만, 그 중에서도 Zulu Open JDK의 arm64용 15버전만 konlpy가 제대로 돌아간다고 한다.. 하핳.... 2021. 4. 28.
정규표현식을 알아보자!! 1. Intro 정규 표현식(Regular Expressions)은 복잡한 문자열을 처리할 때 사용하는 기법으로, 파이썬만의 고유 문법이 아니라 문자열을 처리하는 모든 곳에서 사용한다. 정규 표현식을 배우는 것은 파이썬을 배우는 것과는 또 다른 영역의 과제이다. 그러면 왜 정규표현식을 사용해야 하는 걸까? 예시로 주민등록번호를 포함하고 있는 텍스트가 있다. 이 텍스트에 포함된 모든 주민등록번호의 뒷자리를 * 문자로 변경해 보자. 우선 정규식을 전혀 모르면 다음과 같은 순서로 프로그램을 작성해야 할 것이다. 전체 텍스트를 공백 문자로 나눈다(split). 나뉜 단어가 주민등록번호 형식인지 조사한다. 단어가 주민등록번호 형식이라면 뒷자리를 *로 변환한다. 나뉜 단어를 다시 조립한다. 이를 구현하면 다음과 같.. 2021. 4. 27.
[잡담] 파이썬의 타입 힌트와 typing, mypy를 알아보자! 0. Intro 파이썬은 동적 타이핑 언어이다. 다시 말해, 하나의 변수가 타입에 구애받지 않는 데이터를 표시할 수 있다는 것이다. 그래서 동적 타이핑은 쉽고 간결한 코드를 만들 수 있다. 하지만 동적 타이핑 방식의 경우, 변수에 전달되는 값이 개발자가 원하는 것으로 전달되는지를 감시할 수 없다는 단점이 있다. 예컨대 특정 함수를 호출할 때, 특정 매개변수에는 Int가 전달되고, 다른 매개변수에는 str이 전달되어야 한다고 가정하자. 이것이 잘 되었는지, 잘못 되었는지는 실제 실행시키기 전까지는 파악하기 힘들다. 따라서 타입이 맞지 않아 발생하는 런타임 에러를 미연에 파악할 수 있도록 정적 타이핑 방식이 이용되는 것이다. 물론 코드가 불가피하게 길어진다거나 하는 단점이 존재하지만, 전달되는 값의 타입을 .. 2021. 3. 21.
3. 판례 전문 txt파일로 저장하기 - 판례를 크롤링해보자 1. Intro 이전 포스트에서 판례 목록 전체를 불러와 csv파일로 저장했다. 이 데이터를 기반으로 이제 판례 전문 데이터를 불러와 txt파일로 저장하고자 한다. import pandas as pd import xml.etree.ElementTree as ET from urllib.request import urlopen from tqdm import trange import re import os 우선 필요한 라이브러리를 Import 하고 시작하도록 하겠다 2. 구현 이전 포스트에서 만들어냈던 csv파일에는 ['판례일련번호', '사건명', '사건번호', '선고일자', '법원명', '사건종류명', '사건종류코드', '판결유형', '선고', '판례상세링크'] 정보가 들어있다. 이중 판례 상세링크를 통해 .. 2021. 3. 1.