-
[Python] \xef\xbb\xbf 제거언어/파이썬 & 장고 2016. 11. 3. 14:10
윈도우에서 내린 csv파일을 파이썬에서 읽어들일 때 맨 첫 번째 줄에 \xef\xbb\xbf 이 붙어 있는 것을 확인할 수 있습니다. 이것은 UTF8-BOM이라는 것을 나타내는 문자열입니다.
파이썬에서는 다음과 같이 해당 문자열을 출력하지 않고 파일을 읽어들일 수 있습니다.
import codecs with codecs.open("file.txt", "r", encoding="utf-8-sig") as f: for line in f: # ...
만약 파이썬 버전이 2.7 이상이라면 codecs보단 io를 사용하는 것을 권장합니다. (빠르고 더 정확함)
import io with codecs.open("file.txt", "r", encoding="utf-8-sig") as f: for line in f: # ...