티스토리 뷰

CSV가 뭐지?

CSV(Comma-Separated Values)는 2차원 테이블 형식의 숫자 또는 문자를 저장하기 위한 텍스트 포맷을 의미한다. 대개 데이터베이스의 데이터를 파일시스템으로 저장할 때의 파일 형식으로 많이 사용한다. CSV라는 이름의 유래에서 보듯이 구분자는 일반적으로 콤마(Comma)기호를 사용하는데 꼭 콤마 기호를 사용할 필요는 없다. 어떤 문자라도 구분자로 사용할 수 있다.

액셀(Excel)에서 CSV 파일을 불러오면 문제가 발생한다

앞서 설명했듯이 CSV 파일은 2차원 테이블 형식의 숫자 또는 문자를 저장하기 때문에 Excel(액셀)과 100% 호환된다. 하지만 바로 액셀에서 불러오면 원하지 않는 형식으로 데이터가 로드된다. 구체적인 예를 설명하면 15자리를 초과하는 숫자 또는 숫자만으로 구성된 텍스트 등이 제멋대로 잘려친채 숫자로 파씽되어 버리거나 텍스트가 제멋대로 날짜 형식으로 변환된다. 액셀이 너무 똑똑한 탓인데 사용자로서는 반갑지 않은 인공지능이라고 해야할까? 처음 접하면 꽤나 당황하게 되는 문제이다.

액셀(Excel)에서 CSV 파일을 정상적으로 불러오기

해결 방법이 없는 것은 아니다. 살짝 불편하긴 하지만 아래 절차대로 CSV 파일을 불러오면 액셀의 자의적인 판단 없이 원본 그대로의 값을 불러올 수 있다.

  • Microsoft Excel을 실행한다.(2010, 2013 기준)
  • 상단 메뉴에서 데이터를 클릭한 후 텍스트 아이콘을 클릭한다.
  • 열고자 하는 .CSV 파일을 더블클릭한다.
  • 텍스트 마법사 창이 나타나는데 기본 값은 구분 기호로 분리됨이 선택되어 있다. 다음을 클릭하여 다음 화면으로 진행한다.
  • 데이터의 구분 기호를 선택하는 창이 나타난다. 기본 값은 이 체크되어 있다. 열고자 하는 .CSV 파일의 구분기호를 확인하여 정확하게 체크해야 한다. 보통 쉼표를 가장 많이 사용한다. 데이터 미리 보기 창을 통해 데이터가 정확히 분리되었는지 확인 후 다음을 클릭한다.
  • 마지막으로 열에 대한 데이터 서식을 지정하는 화면이 나타난다. 열 데이터 서식은 기본 값으로 일반이 선택되어 있는데 이 경우 15자리를 초과하는 숫자 또는 숫자만으로 구성된 텍스트 등이 제멋대로 숫자로 파씽되어 원하는 않는 결과를 출력할 수 있다. 이런 문제를 예방하려면 열 데이터 서식을 텍스트로 변경해야 한다. 먼저 아래 데이터 미리 보기 창에서 모든 열을 선택한다.(첫 열을 클릭한 후 SHIFT 키를 누른 상태에서 마지막 열을 선택하면 전체 열이 선택된다.) 다음으로 텍스트를 선택하면 모든 열이 원본 값 그대로의 텍스트 서식으로 변경된다. 열 지정이 완료되었으면 마침을 클릭한다.
  • 데이터가 들어갈 워크시트를 선택한 후 확인을 클릭하면 .CSV 파일이 정상적으로 읽어진 것을 확인할 수 있다.

참고 글


댓글
댓글쓰기 폼