...

[7가지 쉬운 팁] PDF 파일에서 표를 추출하는 방법

...

PDF는 내용을 조작하기 어렵기 때문에 온라인으로 파일을 공유하는 데 널리 사용되는 문서 형식입니다. 그러나 PDF 문서에서 테이블을 추출해야 하는 경우가 있는데, 이는 해당 문서에 중요한 비즈니스 데이터가 있는 경우입니다. 일반적으로 수동으로 수행하기로 결정한 경우 이는 길고 지루한 프로세스입니다.

운 좋게도 많은 PDF 테이블 추출기가 PDF 파일에서 테이블을 쉽게 제거하는 데 도움이 될 수 있습니다. 이 작업을 처음 수행하는 경우 최상의 결과를 제공하는 도구에 대해 혼란스러울 수 있습니다. 이 기사에서는 다양한 온라인 및 오프라인 PDF 추출 도구와 이를 사용하여 빠른 PDF 테이블 추출을 수행할 수 있는 방법을 공유합니다.

PDF에서 테이블 추출

 

부품 1. PDF 오프라인에서 테이블을 추출하는 방법

여러 PDF 파일에서 테이블을 추출하는 편리한 방법 중 하나는 오프라인 PDF 추출 소프트웨어 응용 프로그램을 사용하는 것입니다. 온라인 도구와 달리 오프라인 추출기에는 여러 PDF 문서에서 이미지를 추출하는 옵션과 같은 많은 기능이 있습니다. 일부 응용 프로그램에는 서식을 그대로 유지하면서 PDF에서 표를 쉽게 감지하고 제거할 수 있는 OCR 기능이 포함되어 있습니다.

오프라인 도구는 고품질 출력을 보장하면서 여러 PDF 문서에서 테이블을 추출하려는 모든 사람에게 이상적입니다. 또 다른 주요 이점은 대부분의 도구가 다양한 운영 체제와 호환된다는 것입니다.

방법 1. PDF 편집기 사용

PDF 편집기는 사용자에게 문서에서 텍스트와 표를 빠르게 추출할 수 있는 기능을 제공합니다. 이는 PDF 파일과 스캔한 이미지를 쉽게 인식하고 편집 가능한 파일로 변환하는 PDF Editor OCR(광학 문자 인식) 기능 덕분에 가능합니다. 변환 도구를 사용하여 PDF에서 Excel로 테이블을 추출할 수도 있습니다.

이 도구를 사용하여 PDF에서 표를 추출하면 Mac 및 Windows 포함한 다양한 운영 체제와 호환된다는 장점이 있습니다. 또한 PDF에서 파일을 빠르고 쉽게 제거할 수 있는 사용하기 쉬운 인터페이스도 있습니다.

알아야 할 PDF 편집기의 주요 기능은 다음과 같습니다.

  • 초보자도 쉽게 사용할 수 있는 사용자 친화적인 인터페이스의 이점을 누리세요.
  • Windows 및 iOS 와 같은 주류 플랫폼과의 호환성을 즐기십시오.
  • 비대화형 PDF를 편집 가능한 형식으로 빠르게 변환하는 OCR 기능을 사용하여 문서를 쉽게 추출하세요.
  • 다양한 유형의 양식에 대해 사전 제작된 다양한 템플릿의 이점을 활용하세요.

PDF 편집기를 사용하여 PDF에서 테이블 추출을 시작할 준비가 되셨습니까? 따라야 할 단계는 다음과 같습니다.

01 컴퓨터에 PDF Editor를 다운로드, 설치 및 실행합니다. 기본 인터페이스에서 PDF 열기를 클릭하여 원하는 파일을 업로드하세요. 메뉴 표시줄에서 양식 도구를 누르고 테이블 인식을 클릭합니다. 이는 빠른 데이터 처리를 위해 양식 필드를 인식하는 데 도움이 됩니다.

Coolmuster를 사용하여 PDF에서 테이블 추출

02 양식 도구로 돌아가서 데이터 추출 옵션을 선택합니다. 화면에 팝업창이 나타납니다. 이전에 선택한 필드에서 테이블을 추출하려면 PDF의 양식 필드에서 데이터 추출을 클릭하세요.

PDF에서 Excel로 테이블 추출

알고 싶을 수도 있습니다 : 여러 JPG를 PDF로 변환: 간편한 변환을 위한 가이드

방법 2. Python Camelot 명령 사용

Camelot은 PDF에서 테이블을 빠르게 추출할 수 있는 Python 라이브러리입니다. PDF 프로그램에서 Python 추출 테이블은 스캔된 이미지가 아닌 텍스트 기반 PDF 문서가 있는 경우에만 작동한다는 점을 알아야 합니다.

다음은 Python 프로그램을 사용하여 테이블을 추출하는 동안 따라야 하는 단계입니다.

1단계. 컴퓨터에 Python을 설치한 후 CMD 명령 창을 열고 다음을 입력하여 라이브러리를 설치합니다.

pip 설치 camelot-py[cv]

2단계. 새 Python 파일을 만들고 코드를 입력합니다.

카멜롯 수입

tables = camelot.read_pdf('[ PDF 파일 ]', 풍미='stream')

tables.export('extracted_tables.csv', f='csv')

3단계. Python 파일을 실행하면 PDF 테이블이 extract_tables.csv 파일로 추출됩니다.

더 읽어보기: Mac 에서 쉽게 PDF에서 이미지를 추출하는 방법 [7가지 방법 포함]

방법 3. Adobe Acrobat DC 사용

Adobe Acrobat은 사용자가 PDF 파일에 대해 다양한 작업을 수행할 수 있는 최고의 PDF 편집 및 읽기 도구 중 하나입니다. 이 도구를 사용하면 PDF 문서를 암호화하고 서명하고 편집 할 수도 있습니다. 이 도구는 PDF에서 표를 추출하려는 경우에도 유용합니다. 한번도 사용해본 적이 없다면 다음 단계를 따르세요.

1단계. 컴퓨터에 Adobe Acrobat DC를 다운로드, 설치 및 실행합니다. 메뉴 모음에서 도구 옵션으로 이동하고 만들기 및 편집 섹션의 PDF 내보내기 아래에서 열기를 선택합니다.

Adobe Acrobat을 사용한 PDF 추출 테이블

2단계. 파일 선택 옵션을 탭하고 PDF 파일을 선택합니다. 스프레드시트를 선택하고 Microsoft Excel 통합 문서 옵션을 전환합니다. 내보내기 를 클릭합니다.

PDF를 스프레드시트로 내보내기

3단계. 대상 폴더 선택을 클릭하여 문서를 저장할 위치를 선택하세요. 새 파일의 이름을 바꾸고 저장 을 클릭합니다. Adobe Acrobat은 기본적으로 문서를 Excel 파일로 내보냅니다.

당신은 알고 싶을 수도 있습니다 : 쉽게 이미지를 PDF로 변환하는 방법: 공개된 7가지 방법

2부. 온라인 PDF에서 표를 추출하는 방법

처음부터 PDF 테이블을 만드는 시간을 절약하려면 온라인 PDF 변환기를 사용해 보는 것이 좋습니다. 이러한 강력한 도구를 사용하면 PDF 파일에서 표 형식 데이터를 빠르게 추출하고 Docx, HTML, CSV를 포함한 다양한 형식으로 내보낼 수 있습니다. 이러한 도구를 사용하면 사용하기 쉬운 인터페이스 덕분에 몇 번의 클릭만으로 PDF 문서에서 표를 편리하게 추출할 수 있습니다.

다음은 사용을 고려해야 할 몇 가지 온라인 PDF 테이블 추출기입니다.

도구 1. i2PDF

i2PDF PDF를 사용하면 PDF 문서의 테이블을 DOCX, CSV, XML과 같은 다양한 형식으로 빠르게 추출할 수 있습니다. 이 도구에는 문서의 표를 직사각형으로 표시하여 효율적으로 인식하는 표 자동 감지 기능도 있습니다. 이 도구는 이미지 기반 PDF가 아닌 텍스트에서 표를 추출하는 데에만 사용할 수 있다는 점을 기억하세요.

이 PDF 테이블 추출기를 사용하여 PDF 문서에서 테이블을 제거하는 방법은 다음과 같습니다.

1단계. i2PDF 메인 페이지로 이동하고 파일 선택을 클릭하여 테이블에서 추출하려는 파일을 업로드합니다. 또는 PDF 파일을 사용자 인터페이스에 놓으면 자동으로 업로드됩니다.

i2pdf를 사용하여 PDF에서 테이블 추출

2단계. 옵션을 클릭하여 원하는 파일 형식을 선택하여 테이블을 저장하세요. PDF에서 테이블 추출을 탭하면 파일이 자동으로 다운로드됩니다.

도구 2. Convertio

Convertio에는 PDF 파일에서 테이블을 빠르고 쉽게 추출할 수 있는 사용하기 쉬운 인터페이스가 있습니다. 사용자가 파일을 다양한 형식으로 변환할 수 있는 다른 도구와 달리 Converio를 사용할 때만 문서를 CSV로 변환할 수 있습니다. 컴퓨터 저장소, Dropbox 또는 Google Drive 에서 파일을 업로드하기만 하면 소프트웨어가 전체 프로세스를 완료하므로 변환 프로세스가 쉽습니다.

Convertio를 사용하여 PDF에서 테이블을 추출할 때 따라야 하는 단계를 확인하세요.

1단계. Convertio 메인 인터페이스에서 파일 선택을 클릭하여 이미지가 포함된 PDF 문서를 업로드합니다. Dropbox 나 Google Drive를 통해서도 이 작업을 수행할 수 있습니다.

Convertio를 사용하여 PDF에서 테이블 추출

2단계. 업로드한 후 변환을 클릭하면 문서가 자동으로 CSV 파일로 변환됩니다.

도구 3. PDF 테이블

PDF 테이블은 PDF 파일을 CSV 및 Excel 형식으로 빠르게 변환합니다. 이 플랫폼은 직관적이고 사용하기 쉬운 인터페이스를 갖추고 있으므로 단 몇 번의 클릭만으로 파일을 변환할 수 있습니다. 온라인 기반 도구로서 다양한 운영 체제에서 완벽하게 작동합니다. 또한 서식이 그대로 유지되므로 문서 출력 품질이 높습니다.

PDF 테이블을 사용하여 PDF 문서에서 테이블을 추출하는 단계는 다음과 같습니다.

1단계. PDF 테이블 메인 페이지에서 PDF 변환을 클릭합니다. 표가 있는 PDF를 찾아 응용 프로그램으로 엽니다.

PDF에서 표를 추출하여 PDF 표로 Excel로 만들기

2단계. 변환이 완료되면 Excel로 다운로드를 클릭하여 문서를 다운로드하세요. Excel로 다운로드 옆에 있는 화살표를 클릭하면 문서 형식을 변경할 수 있습니다.

다음이 필요할 수도 있습니다. PDF를 JPG로 변환하는 방법: 초보자를 위한 단계별 튜토리얼

도구 4. 나노넷

Nanonets는 PDF 파일에서 테이블을 추출하는 빠르고 효율적인 방법을 찾고 있는 경우 유용한 도구입니다. 여러분이 해야 할 일은 도구에 문서를 업로드하는 것뿐입니다. 그러면 문서에서 모든 표와 텍스트를 추출할 수 있습니다. 또한 파일을 빠르고 쉽게 업로드하고 변환할 수 있는 사용하기 쉬운 인터페이스도 있습니다.

Nanonet을 사용하여 PDF에서 테이블을 추출하는 단계는 다음과 같습니다.

1단계. 도구의 기본 인터페이스에서 PDF 파일을 끌어서 놓아 업로드하거나 PDF 또는 이미지 업로드 옵션을 클릭합니다.

nanonets로 Excel을 사용하려면 PDF에서 테이블을 추출하세요.

2단계. 텍스트와 표를 추출할지 아니면 표만 추출할지 선택하세요. 변환 프로세스를 시작하려면 CSV로 변환을 클릭하세요. 파일이 자동으로 변환되어 다운로드됩니다.

결론

PDF 문서에서만 텍스트와 표를 추출하려는 경우, 이 가이드에 강조된 PDF 추출 표 도구 중 하나를 사용하는 것을 고려해야 합니다. 원하는 옵션에 따라 서식을 그대로 유지하면서 PDF 문서에서 표를 쉽게 추출할 수 있습니다.

정기적으로 인터넷에 연결되어 있다면 PDF 파일에서 표를 추출하는 데 아무런 문제가 없습니다. 정기적으로 PDF로 작업하는 경우 이동 중에도 작업할 수 있는 유연성을 제공하는 오프라인 도구가 완벽한 선택이 될 수 있습니다.

관련 기사:

[효율적인 PDF 팁] PDF 문서에 대한 URL 링크를 무료로 만드는 방법

미리보기 대안: 컴퓨터에서 PDF를 TIFF/GIF/BMP로 빠르게 변환

PNG를 PDF로 변환하는 방법: 완벽한 결과를 얻기 위한 가이드

고품질로 PDF를 PNG로 변환하는 방법은 무엇입니까? 8가지 전문가 팁과 요령

    Office 솔루션     [7가지 쉬운 팁] PDF 파일에서 표를 추출하는 방법
이용약관 개인 정보 보호 라이선스 약관 제거방침 Copyright © 2024 Coolmuster. All Rights Reserved.
feedback피드백