Tika로 첨부파일의 Text를 뽑는 작업을 하기 위해 maven에 등록하여 사용하려는 중에 이와 같은 에러가 발생하였다. 일단 아래는 maven에 등록한 Tika 라이브러리 org.apache.tika tika-core 1.26 org.apache.tika tika-parsers 1.26 그리고 Doc 파일을 Tika로 테스트 해봤을 때 발생한 에러이다. 경고: org.xerial's sqlite-jdbc is not loaded. Please provide the jar on your classpath to parse sqlite files. See tika-parsers/pom.xml for the correct version. Exception in thread "main" java.lang.No..
소스 원문 첨부파일 내용 하는있는으로을를 위와 같은 조사들을 제거하는 형태소 분석기의 심플 버전을 개발 중이었는데, 첨부파일로 읽어 들이니 잘 작동이 되지 않았다.자바에서는 전혀 문제가 없는 것인데 파이썬에서는 내가 생각하지 못하는 무언가가 있는건지 확인 중 개행 문자가 들어간 것으로 판단하여 아래와 같이 조치하였다. # 조사 데이터 매핑f = codecs.open("josa.dic", "r", "utf-8")while True: line = f.readline() line = line.replace("\n", "") if(len(line) > 0): JOSA_DIC.append(line) if not line: break 그러나, len(line)을 해본 결과 조사의 length가 아래와 같이 출력이 ..