[Excel] UTF-8 CSV 파일 깨지지 않고 가져오기

    엑셀에서는 UTF-8로 된 파일을 그냥 읽을 경우 캐릭터셋(Character Set, Charset)이 맞지 않아 인코딩에 잘못되어 깨져서 나오게 된다.

     

    원본 데이터

    id,title
    1,한글로된 제목
    2,테스트

    위와 같이 한글로 되어 있고 UTF-8로 저장이 되어 있는 CSV를 엑셀로 읽어보려 시도를 하면 아래와 같이 깨져서 출력이 된다.

     

    그림 1. 깨져서 나오는 원본

     

    그림 1처럼 깨져서 나올 경우 방법이 크게 2가지가 있는데 하나는 데이터를 UTF-8에서 다른 인코딩으로 변환하여 저장 후 불러오는 것이며 (데이터 손실 가능) 다른 하나는 불러올 때 캐릭터셋을 변경하여 읽는 방법이 있다.

     

    캐릭터셋 지정 불러오기

    그림 2. 데이터탭, 텍스트

     

    그림 2와 같이 데이터 탭 -> 텍스트 선택

     

    그림3. 파일 선택

     

    원하는 파일을 선택한 후, 가져오기 클릭

     

    그림 4. 캐릭터셋 설정

     

    그림 4. 처럼 65001 : 유니코드(UTF-8)을 선택한 후, 다음을 클릭한다.

     

    그림 5. 구분 기호

     

    그림 5처럼 파일의 구분 기호를 맞게 선택한 후, 다음을 선택한다.

     

    그림 6. 열 데이터 서식

     

    열 데이터 서식이 특별히 있을 경우 선택을 하고 없을 경우 일반 선택 후 마침을 클릭한다.

     

    그림 7. 데이터 가져오기

     

    엑셀 파일에서 어디에 출력을 할 것인가인데 새 워크시트를 선택 후 확인을 누른다.

     

    그림 8. 캐릭터셋이 정상적으로 보이는 모습

     

    그림 8과 같이 UTF8의 캐릭터셋이 깨지지 않고 정상적으로 출력된 모습을 확인할 수 있다.

    반응형

    댓글

    Designed by JB FACTORY