[Python] 파이썬 문자열 분리(나누기), Split 함수

    문자열 리스트를 문자열로 합치는 함수가 Join 함수라면, 반대로 문자열 데이터를 문자열 리스트로 분리(나누기)하는 내장 함수는 split 함수이다. 

     

    사용방법

    문자열.split(구분자)

    여기서 join과 차이점을 확인해야 될 것이 join함수의 경우 데이터가 함수안에 들어가고, 앞에 구분자가 있었는데 join과 순서가 정반대라는 점을 인지하도록 한다.

     

    사용예시

    Split 함수는 상당히 많이 사용될 수 있다. 예를 들어 CSV 데이터를 split하여 리스트 형태로 분리할 수 있는데 텐서플로우, 케라스, 파이토치 혹은 머신러닝을 공부하는 사람이면 거의 무조건 한번 정도는 프로그램에 꼭 사용한다.

     

    자연어처리쪽에서도 많이 사용된다. 우선 형태소 분석을 하려면 데이터를 구분해야 하는데 공백 기준으로 tokenizing을 할 수 있기 때문이다. 

     

    >>> split_str = "동해물과 백두산이 마르고 닳도록".split(" ")
    # type을 해보면 리스트로 변형된 것을 확인할 수 있다
    >>> type(split_str)
    <class 'list'>
    >>> print(split_str)
    ['동해물과', '백두산이', '마르고', '닳도록']

    위 예시는 문장 데이터를 split으로 분리하여 토크나이징을 한것과 유사하다. 

     

     

    연관포스팅

    2020/12/28 - [Language/Python] - [Python] 파이썬 리스트 문자열 합치기 Join 함수

    반응형

    댓글

    Designed by JB FACTORY