DalHyang

데이터 분석이나 업무를 하다 보면 대용량 CSV 파일을 다뤄야 할 때가 많습니다.
하지만 엑셀(Excel)에서 이 파일을 열려고 하면 로딩이 오래 걸리거나, 심지어 파일이 깨져서 열리는 문제가 발생하기도 합니다.

 

이럴 때 해결 방법이 없을까요?

 

다행히도 CSV 파일을 빠르게 분리하거나 가볍게 변환할 수 있는 무료 프로그램 및 온라인 도구들이 많이 있습니다.

 

오늘은 대용량 CSV 파일을 엑셀에서 문제없이 다룰 수 있도록 분리하는 방법을 자세히 알아봅시다.

 

 

확장자 CSV

 

 

CSV 파일이 엑셀에서 깨지는 이유는?

CSV(Comma-Separated Values) 파일은 데이터를 쉼표(,)로 구분하여 저장하는 단순한 텍스트 형식의 파일입니다. 하지만 대용량 CSV 파일을 엑셀에서 열 때 다음과 같은 문제가 발생할 수 있습니다.(안열림, 글씨깨짐

  1. 엑셀의 행 개수 제한
    • 엑셀 2016 이상의 최신 버전에서도 1,048,576개의 행16,384개의 열만 지원합니다.
    • 이 한계를 초과하는 데이터가 들어있는 CSV 파일은 일부만 보이거나 열리지 않습니다.
  2. 파일 용량 제한
    • 엑셀에서 직접 열 수 있는 파일 크기에는 제한이 있습니다.
    • 보통 50MB 이상의 CSV 파일을 열면 속도가 느려지거나 멈춰버리는 경우가 많습니다.
  3. 문자 인코딩 문제
    • CSV 파일의 기본 인코딩이 UTF-8이 아닌 경우, 엑셀에서 열 때 글자가 깨질 수 있습니다.

이제 이러한 문제를 해결하기 위한 무료 프로그램 및 온라인 도구를 소개하겠습니다!

 

 

 

 

 

1. 무료 프로그램으로 CSV 파일 분리하기

① CSV Splitter – 간단한 CSV 파일 분리 도구

CSV Splitter은 무료로 사용할 수 있는 CSV 파일 분할 프로그램입니다.

 

아래 다운로드~~

 

 

split.zip
0.62MB

 

 

사용법

  1. CSV Splitter를 다운로드하고 실행합니다.
  2. "Input File"에서 분할할 CSV 파일을 선택합니다.
  3. "Rows Per File"에서 한 파일당 몇 개의 행을 저장할지 입력합니다. (예: 500,000행씩 나누기)
  4. "Start Splitting"을 클릭하면 자동으로 여러 개의 CSV 파일로 나뉩니다.

장점: 간단한 인터페이스, 빠른 속도
단점: 추가적인 데이터 필터링 기능 없음

 

 

 

 

② Python Pandas – 프로그래밍으로 CSV 분할하기

만약 코딩을 조금 할 줄 안다면, Python의 Pandas 라이브러리를 활용하는 것이 가장 효율적인 방법 중 하나입니다.

사용법 (Python 코드 예시)

 

import pandas as pd  

# CSV 파일 불러오기  
df = pd.read_csv("large_file.csv", chunksize=500000)  

# 50만 행씩 나누어 저장  
for i, chunk in enumerate(df):  
    chunk.to_csv(f"split_file_{i}.csv", index=False)  

 

장점: 자동화 가능, 다양한 데이터 전처리 가능
단점: Python 설치 및 기본 코딩 지식 필요

 

 

2. 온라인 무료 사이트로 CSV 파일 분리하기

별도로 프로그램을 설치하지 않고도, 웹사이트에서 무료로 대용량 CSV 파일을 나눌 수 있는 서비스가 있습니다.

① Split CSV (https://www.splitcsv.com/)

Split CSV는 CSV 파일을 원하는 크기만큼 자동으로 나누어 주는 웹사이트입니다.

사용법

  1. 사이트에 접속 후 CSV 파일 업로드
  2. "Rows per File"에 원하는 행 개수를 입력 (예: 500,000)
  3. "Split" 버튼 클릭 후 파일 다운로드

장점: 빠른 속도, 파일 다운로드 기능 제공
단점: 개인정보 포함된 데이터 업로드 시 주의 필요