개발 공부/기타

Python Sumy 사용법 및 후기(파이썬 요약 라이브러리)

susong 2023. 4. 4. 17:32
728x90

사용방법

1. 일단 Sumy를 사용하기 위해서는 JDK가 필요하다 먼저 JDK를 설치하도록 하자

sudo apt install openjdk-17-jdk

java -version # 잘 설치되었는지 확인하자

2. 필요한 라이브러리를 설치하자

#반드시 python과 pip은 설치되어있어야한다
pip3 install sumy # pip3 혹은 pip
pip3 install konlpy # konlpy는 한국어를 사용하기 위한 형태소분석기이다.

3. 예제 코드 작성

from sumy.summarizers.lex_rank import LexRankSummarizer
from sumy.nlp.tokenizers import Tokenizer
from sumy.parsers.plaintext import PlaintextParser
from konlpy.tag import Kkma

with open("test.txt", "r", encoding="utf-8") as f:
    document = f.read()

tokenizer = Tokenizer(language='ko')
parser = PlaintextParser.from_string(document, tokenizer)
summarizer = LexRankSummarizer()
summary = summarizer(parser.document, sentences_count=3)

for sentence in summary:
    print(sentence)
    
# 결과물 (입력은 https://simsimhamstudy.tistory.com/51 내용을 넣었다)
ubuntu:~/BlogBoost$ python3 test.py 
섬뜩한 Github Action 오류 창 어느 날 언제와 같이 로컬에서 개발을 한 후, Develop에서 확인을 하고 그 다음에 릴리즈 브랜치로 내 프론트 코드를 옮겼는데 위와 같은 오류가 나타나 버렸다.. Develop도 아니고 Release에서 오류 라니.. 식은땀이 나고 온 몸이 저려 온다.
디테일을 확인하니 아래와 같은 내용을 확인할 수 있었다.
결과 문제 해결! 아래 사진과 같이 문제없이 작동하는 것을 볼 수 있다!

평가 : 쓸만하지는 않다.. 일단 요약은 해줌

동일한 Input 값을 ChatGPT에 넣으면?

Github에서 더 이상 18.04 버전을 제공하지 않아 에러가 발생했습니다.
문제 해결을 위해 Github Action build를 변경해야 합니다.
.yml 파일에서 runs-on 부분을 'ubuntu-latest'로 수정하여 문제를 해결할 수 있습니다.

# SUMY로 돌린 결과 상당한 차이가 있는 것을 볼 수 있다..
섬뜩한 Github Action 오류 창 어느 날 언제와 같이 로컬에서 개발을 한 후, Develop에서 확인을 하고 그 다음에 릴리즈 브랜치로 내 프론트 코드를 옮겼는데 위와 같은 오류가 나타나 버렸다.. Develop도 아니고 Release에서 오류 라니.. 식은땀이 나고 온 몸이 저려 온다.
디테일을 확인하니 아래와 같은 내용을 확인할 수 있었다.
결과 문제 해결! 아래 사진과 같이 문제없이 작동하는 것을 볼 수 있다!

결론 : GPT 쓰자(무엇을 요약했는지 확인하고 싶다면 링크 클릭)

728x90