파이썬으로 크롤링한 텍스트가 인터프리터에 따라서 깨지기도, 안 깨지기도 하는 이유..?
파이참에서 beautiful soup4를 이용하여 외부 웹 페이지를 크롤링하는 소스를 실행할 때
기존의 인터프리터를 사용하여 실행하면
크롤링한 텍스트가 정상적으로 한글로 출력되는데,
플라스크 때문에 따로 만든, 가상환경으로 새로 만든 인터프리터에서 실행하면 크롤링한 한글 텍스트가
ß°í±â¼Ò½º¿Í±¼ºñÆ¢±è/¶
이런 식으로 깨져서 나와요.
그렇다고 이 인터프리터에서 한글이 아예 안 되는 건 아니고, 크롤링할 때만 한글이 깨져서 나옵니다.
이유가 뭔가요? 혹시 관련 패키지가 설치 안 되어 있어서일까요?
아래 사진은 크롤링한 텍스트가 정상적으로 보이는, 기존 인터프리터의 패키지들입니다.
그리고 아래 사진은, 가상환경에서 만든? 인터프리터인데 크롤링한 한글 텍스트가 깨져 보입니다. (영어도 깨지는지는 확인 안 해봤어요.)
대신 크롤링한 게 아니라 소스에서 print('한글') 이렇게 쓰면 정상적으로 나옵니다.
어떻게 하면 두 번째 인터프리터로도 크롤링한 텍스트들이 한글이 제대로 나올까요?
+) 두 번째 인터프리터로는 항상 안 되는 게 아니라, 되는 시간대가 있고 안 되는 시간대가 있는 것 같습니다.. 분명히 어제 밤에는 두 번째 인터프리터로는 크롤링할 때 한글이 깨져서 나왔는데 오늘은 두 번째 인터프리터로도 한글이 제대로 나왔거든요. 근데 밤인 지금 다시 해 보니 두 번째 인터프리터로는 또 한글이 깨지네요.. 크롤링된 한글만 깨지고, print로 직접 쓴 한글은 제대로 나오구요.
왜 시간대에 따라 될 때가 있고 안 될 때가 있는 걸까요? 첫 번째 인터프리터로는 항상 안 깨집니다.
초보 님 415
2022년 2월 13일 9:48 오후