Ubuntu에서 PDF 조작 도구 - Poppler
가끔은 PDF에 페이지를 추가해야 할 때가 있습니다...
또는 PDF에서 이미지와 텍스트를 추출하고 싶은 다른 날에는 PDF에서 이미지와 텍스트 추출을 참조하세요…
위 이미지는 Flux 1 모델에 의해 생성된 AI 이미지로, “스패너는 이동 문서를 쫓는 데 매우 바쁘다"는 표현을 어떻게 보여주는지 보여줍니다.
Poppler에 대해
Poppler는 Linux 시스템, 특히 Ubuntu에서 사용되는 무료이고 오픈소스의 PDF 렌더링 라이브러리입니다. PDF 파일을 조작하고 변환하는 데 사용되는 명령줄 도구를 제공합니다. 아래는 Ubuntu에서 Poppler 도구에 대한 요약과 사용 방법입니다:
Ubuntu에서의 Poppler는 무엇인가?
- Poppler는 xpdf-3.0 코드베이스를 기반으로 한 PDF 렌더링 라이브러리입니다.
- PDF에서 텍스트와 이미지를 추출하거나, PDF를 병합/분할하거나, 다른 형식으로 변환하는 여러 명령줄 도구를 포함합니다.
- GNOME 및 KDE 데스크탑 환경에서 일반적으로 사용됩니다.
설치
Ubuntu에서 Poppler 도구를 설치하려면 다음 명령을 실행하세요:
sudo apt-get install poppler-utils
Poppler는 Xpdf PDF 뷰어를 기반으로 한 PDF 렌더링 라이브러리입니다.
이 패키지는 PDF 문서의 정보를 얻거나, 다른 형식으로 변환하거나, 조작하는 데 사용되는 명령줄 도구(팝플러 기반)를 포함합니다:
- pdfdetach – 내장 파일(첨부 파일)을 나열하거나 추출
- pdffonts – 폰트 분석기
- pdfimages – 이미지 추출기
- pdfinfo – 문서 정보
- pdfseparate – 페이지 추출 도구
- pdfsig – 디지털 서명 검증
- pdftocairo – Cairo를 사용한 PDF를 PNG/JPEG/PDF/PS/EPS/SVG로 변환
- pdftohtml – PDF를 HTML로 변환
- pdftoppm – PDF를 PPM/PNG/JPEG 이미지로 변환
- pdftops – PDF를 PostScript(PS)로 변환
- pdftotext – 텍스트 추출
- pdfunite – 문서 병합 도구
주요 Poppler 도구 및 사용법
-
pdfinfo
– PDF 메타데이터(제목, 저자, 페이지 수 등) 얻기pdfinfo file.pdf
-
pdftotext
– PDF에서 텍스트 추출pdftotext file.pdf [output.txt]
-
pdfimages
– PDF에서 이미지 추출pdfimages file.pdf output_prefix
-
pdftoppm
/pdftocairo
– PDF 페이지를 이미지(PNG, JPEG 등)로 변환pdftoppm -png file.pdf output_prefix
-
pdfseparate
– PDF를 개별 페이지로 분할pdfseparate file.pdf output_%d.pdf
-
pdfunite
– 여러 PDF를 하나로 병합pdfunite file1.pdf file2.pdf merged.pdf
-
pdftohtml
– PDF를 HTML로 변환pdftohtml file.pdf [output.html]
-
pdffonts
– PDF에서 사용된 폰트 목록pdffonts file.pdf
추가 정보
- 대부분의 명령어는
-h
또는--help
옵션을 통해 상세한 옵션을 확인할 수 있습니다. - 많은 Linux 시스템에 Poppler가 사전 설치되어 있지만, 누락된 경우
poppler-utils
를apt
를 통해 설치할 수 있습니다.
Ubuntu Launchpad 패키지 정보
https://launchpad.net/ubuntu/+source/poppler
gir1.2-poppler-0.18: poppler-glib을 위한 GObject 인트로스펙션 데이터
libpoppler-cpp-dev: PDF 렌더링 라이브러리 -- 개발 파일 (CPP 인터페이스)
libpoppler-cpp1: PDF 렌더링 라이브러리 (CPP 공유 라이브러리)
libpoppler-cpp1-dbgsym: ubuntu plucky에서 libpoppler-cpp1-dbgsym에 대한 요약 정보 없음
libpoppler-dev: PDF 렌더링 라이브러리 -- 개발 파일
libpoppler-glib-dev: PDF 렌더링 라이브러리 -- 개발 파일 (GLib 인터페이스)
libpoppler-glib-doc: GLib 인터페이스를 위한 PDF 렌더링 라이브러리 문서
libpoppler-glib8t64: GLib 기반 공유 라이브러리인 PDF 렌더링 라이브러리
libpoppler-glib8t64-dbgsym: libpoppler-glib8t64의 디버그 심볼
libpoppler-private-dev: PDF 렌더링 라이브러리 -- 프라이빗 개발 파일
libpoppler-qt5-1t64: Qt 5 기반 공유 라이브러리인 PDF 렌더링 라이브러리
libpoppler-qt5-1t64-dbgsym: libpoppler-qt5-1t64의 디버그 심볼
libpoppler-qt5-dev: Qt 5 인터페이스를 위한 PDF 렌더링 라이브러리 -- 개발 파일
libpoppler-qt6-3t64: Qt 6 기반 공유 라이브러리인 PDF 렌더링 라이브러리
libpoppler-qt6-3t64-dbgsym: libpoppler-qt6-3t64의 디버그 심볼
libpoppler-qt6-dev: Qt 6 인터페이스를 위한 PDF 렌더링 라이브러리 -- 개발 파일
libpoppler140: PDF 렌더링 라이브러리
libpoppler140-dbgsym: libpoppler140의 디버그 심볼
poppler-utils: Poppler 기반의 PDF 유틸리티
poppler-utils-dbgsym: poppler-utils의 디버그 심볼