PDF naar CSV converteren : 4 methoden die echt werken

PDF-bestanden vergrendelen gegevens in een vaste indeling — geweldig om te lezen, verschrikkelijk voor analyse. Of u nu bankafschriften in een spreadsheet wilt importeren, facturen in bulk wilt verwerken of tabelgegevens in een script wilt invoeden, u hebt CSV nodig. Deze gids behandelt vier beproefde methoden: een online converter, Python met pdfplumber, Microsoft Excel en Google Sheets.

PDF naar CSV converteren

Upload uw PDF en download CSV onmiddellijk

PDF CSV

Tik om je bestand te kiezen

of

Supports M4A, WAV, FLAC, OGG, AAC, WMA, AIFF, OPUS • Max 100 MB

Gecodeerde upload via HTTPS. Bestanden worden automatisch verwijderd binnen 2 uur.

Tabellen vs. platte tekst: waarom het belangrijk is

Controleer voordat u een methode kiest wat voor gegevens uw PDF bevat. De aanpak hangt volledig af van de PDF-structuur:

PDF-type Wat het bevat Beste methode
Native tabellen Op tekst gebaseerde PDF met zichtbare tabelranden en rasterlijnen Elke methode — CleverUtils is het snelst
Tabellen zonder randen Kolommen uitgelijnd met afstand, geen zichtbaar raster Python (pdfplumber) voor precisie
Gescande PDF Afbeelding van een afgedrukte pagina (geen selecteerbare tekst) CleverUtils met OCR ingeschakeld
Gemengde inhoud Tabellen + alinea's + koppelingen op dezelfde pagina Python voor selectieve extractie

Snelle test: open uw PDF en probeer tekst met uw muis te selecteren. Als u afzonderlijke woorden kunt markeren, is het een native (tekstgebaseerde) PDF. Als de hele pagina als één blok wordt geselecteerd, is het een gescande afbeelding — u hebt OCR nodig.

Methode 1: Online converteren met CleverUtils

Makkelijk Geen software • Werkt op elk apparaat • OCR-ondersteuning

De snelste optie voor de meeste gebruikers. CleverUtils verwerkt native PDF's, tabellen zonder randen en zelfs gescande documenten met OCR. Geen installatie, geen account vereist.

  1. Ga naar cleverutils.com/nl/pdf-to-csv
  2. Upload uw PDF — sleep en zet neer, of klik op « PDF-bestand kiezen ». Max. 100 MB.
  3. Voor gescande PDF's: selecteer uw OCR-taal in de vervolgkeuzelijst voordat u converteert.
  4. Klik op « Naar CSV converteren » — conversie duurt enkele seconden voor de meeste bestanden.
  5. Download de CSV — open deze in Excel, Google Sheets of importeer in uw database.

CleverUtils verwerkt alle pagina's van uw PDF en combineert geëxtraheerde gegevens in één CSV-bestand. Bestanden worden gecodeerd tijdens overdracht en automatisch verwijderd binnen 2 uur.

Methode 2: Python met pdfplumber

Geavanceerd Volledige controle • Batchverwerking • Verwerkt tabellen zonder randen

pdfplumber is de beste Python-bibliotheek voor het extraheren van tabellen uit PDF's. Het begrijpt tabellen met en zonder randen, geeft u coördinaten voor elk teken en laat u extractieparameters fijnafstellen.

pdfplumber installeren

Terminal
pip install pdfplumber

Basis tabelextractie

Dit script extraheert alle tabellen van elke pagina van een PDF en schrijft ze naar een CSV-bestand:

Python
import pdfplumber
import csv

with pdfplumber.open("invoice.pdf") as pdf:
    all_rows = []
    for page in pdf.pages:
        table = page.extract_table()
        if table:
            all_rows.extend(table)

with open("output.csv", "w", newline="") as f:
    writer = csv.writer(f)
    writer.writerows(all_rows)

print(f"Extracted {len(all_rows)} rows to output.csv")

Omgaan met tabellen zonder randen

Wanneer tabellen geen zichtbare randen hebben, kan pdfplumber kolommen nog steeds detecteren met tekenposities. Gebruik extract_table() met aangepaste instellingen:

Python
# Voor PDF's zonder zichtbare tabelranden
table_settings = {
    "vertical_strategy": "text",
    "horizontal_strategy": "text",
    "snap_y_tolerance": 5,
    "intersection_x_tolerance": 15,
}

with pdfplumber.open("report.pdf") as pdf:
    page = pdf.pages[0]
    table = page.extract_table(table_settings)
    for row in table:
        print(row)

Meerdere PDF's batchgewijs converteren

Python
import pdfplumber
import csv
from pathlib import Path

for pdf_file in Path("./invoices").glob("*.pdf"):
    csv_path = pdf_file.with_suffix(".csv")
    with pdfplumber.open(pdf_file) as pdf:
        rows = []
        for page in pdf.pages:
            table = page.extract_table()
            if table:
                rows.extend(table)
        with open(csv_path, "w", newline="") as f:
            csv.writer(f).writerows(rows)
    print(f"{pdf_file.name} -> {csv_path.name} ({len(rows)} rows)")

Methode 3: Microsoft Excel (Gegevens ophalen)

Medium Alleen desktop • Microsoft 365 (Excel voor 365) • Handmatige stappen

Microsoft 365 (Excel voor 365) kan PDF-bestanden rechtstreeks importeren met behulp van de Power Query / Gegevens ophalen-functie. Deze optie is niet beschikbaar in zelfstandige Excel 2016 of 2019 — het vereist een actief Microsoft 365-abonnement. Het werkt goed voor eenvoudige, goed gestructureerde tabellen.

  1. Open Excel en maak een nieuwe lege werkmap aan.
  2. Ga naar Gegevens → Gegevens ophalen → Uit bestand → Uit PDF.
  3. Selecteer uw PDF uit de bestandsbrowser.
  4. Kies de tabel(len) die u wilt importeren in het paneel Navigatie. Excel toont een voorbeeld van elke gedetecteerde tabel.
  5. Klik op « Laden » om de gegevens in uw werkblad te importeren.
  6. Opslaan als CSV: Bestand → Opslaan onder → kies « CSV (met komma's gescheiden) (*.csv) » als indeling.

Beperking: de PDF-import in Excel werkt het best met eenvoudige, afgebakende tabellen. Het heeft moeite met multi-kolom-indelingen, samengevoegde cellen en tabellen zonder randen. Gebruik voor complexe PDF's in plaats daarvan CleverUtils of Python.

Methode 4: Google Sheets

Makkelijk Gratis • Op browser gebaseerd • Google-account vereist

Google Sheets importeert PDF's niet rechtstreeks, maar u kunt de ingebouwde OCR van Google Drive gebruiken om eerst de tekst uit te nemen en deze vervolgens in Sheets te plakken.

  1. Upload de PDF naar Google Drive.
  2. Klik met de rechtermuisknop op de PDF → Openen met → Google Docs. Google zal OCR op het bestand toepassen en het converteren naar een bewerkbaar document.
  3. Selecteer de tabelgegevens in het Google Doc en kopieer (Ctrl+C / Cmd+C).
  4. Open een nieuw Google Sheet en plak (Ctrl+V / Cmd+V). De gegevens vullen de cellen in.
  5. Ruim de gegevens op — pas kolombreedte aan, verwijder extra rijen, corrigeer OCR-fouten.
  6. Downloaden als CSV: Bestand → Downloaden → Door komma's gescheiden waarden (.csv).

Tip: Google's OCR werkt verrassend goed voor gescande PDF's. Maar de tabelstructuur kan de kopieer-plak-stap mogelijk niet intact overleven. Voor betere resultaten met tabelgegevens, gebruik de directe PDF-naar-CSV-converter van CleverUtils.

Vergelijking van methoden

Functie CleverUtils Python Excel Google Sheets
Moeilijkheid Makkelijk Geavanceerd Medium Makkelijk
Installatie Geen (browser) Python + pip Microsoft 365 Geen (browser)
Afgebakende tabellen Uitstekend Uitstekend Goed Redelijk
Tabellen zonder randen Goed Uitstekend Slecht Slecht
Gescande PDF's (OCR) Ingebouwd Met pytesseract Niet ondersteund Via Google Drive
Batchverwerking Eén bestand tegelijk Onbeperkt Eén bestand tegelijk Eén bestand tegelijk
Beste voor Snelle eenmalige conversies Automatisering & complexe PDF's Excel-gebruikers met eenvoudige tabellen Snelle extractie met OCR

Tips voor schone CSV-uitvoer

  • Controleer de koppelingrij. Sommige PDF's hebben headers met meerdere regels die in aparte CSV-rijen worden opgesplitst. Controleer na conversie of uw kolomkoppelingen op één rij staan.
  • Wees voorzichtig met samengevoegde cellen. PDF-tabellen voegen cellen vaak samen voor groepskoppen. Deze worden meestal lege cellen in CSV. Vul ze handmatig in of met een script na extractie.
  • Zorg voor speciale tekens. Komma's, aanhalingstekens en regelbreaks in celwaarden kunnen CSV-parsing verbreken. Goede converters (CleverUtils, pdfplumber) verwerken escaping automatisch. Als de uwe niet, verpak waarden in dubbele aanhalingstekens.
  • Codering is van belang. Gebruik UTF-8-codering bij het opslaan van CSV om geaccentueerde tekens, valutasymbolen en non-Latijnse tekst te behouden. In Python: open("out.csv", "w", encoding="utf-8-sig") (de -sig voegt een BOM toe die Excel helpt UTF-8 te detecteren).
  • Tabellen op meerdere pagina's. Wanneer een tabel meerdere PDF-pagina's omvat, extraheren sommige gereedschappen elke pagina als een aparte tabel. Sla in Python de koptekstgrij op volgende pagina's over om duplicaten te voorkomen.

Veelvoorkomende problemen en oplossingen

Probleem Oorzaak Oplossing
Lege CSV-uitvoer Gescande PDF (afbeelding-gebaseerd) Schakel OCR in CleverUtils in of gebruik pytesseract
Alle gegevens in één kolom Excel opende CSV met verkeerd scheidingsteken Gebruik Gegevens → Tekst naar kolommen → Gescheiden → Komma
Kolommen niet uitgelijnd Tabel zonder randen met ongelijke afstand Gebruik pdfplumber met vertical_strategy: "text"
Verminkt tekens Onjuiste codering (meestal Latin-1 vs UTF-8) Open in teksteditor, opslaan als UTF-8
Dubbele koppelingen Tabel met meerdere pagina's met herhaalde koppelingen In Python, sla rij 0 over op pagina's na de eerste

Klaar om te converteren?

Extraheer uw PDF-tabellen naar CSV-indeling

PDF CSV

Tik om je bestand te kiezen

of

Supports M4A, WAV, FLAC, OGG, AAC, WMA, AIFF, OPUS • Max 100 MB

Veelgestelde vragen

Ja. Online converters zoals CleverUtils verwerken alle pagina's en extraheren elke tabel in één CSV. Met Python kunt u met pdfplumber over elke pagina herhalen en tabellen afzonderlijk extraheren, wat u volledige controle geeft over welke tabellen u wilt opnemen en hoe u deze wilt samenvoegen.

Gescande PDF's bevatten afbeeldingen, geen tekst. U hebt eerst OCR (Optische tekenherkenning) nodig. CleverUtils heeft ingebouwde OCR — selecteer eenvoudig uw taal voordat u converteert. Met Python gebruikt u pytesseract of pdf2image + Tesseract om tekst te extraheren en analyseert u handmatig de tabelstructuur of met tabula-py.

Kolomverplaatsing gebeurt meestal wanneer de PDF spaties in plaats van werkelijke tabelranden gebruikt om gegevens te scheiden. Probeer een ander extractiegereedschap — pdfplumber verwerkt tabellen zonder randen beter dan de meeste. U kunt ook expliciete kolombegrenzingen in pdfplumber definiëren met behulp van de parameter explicit_vertical_lines.

Ja. CleverUtils biedt gratis PDF-naar-CSV-conversie zonder registratie, zonder watermerken en zonder e-mail vereist. Bestanden worden versleuteld via 256-bits SSL en automatisch verwijderd binnen 2 uur. De maximale bestandsgrootte is 100 MB.

Terug naar PDF-naar-CSV-converter

Functie aanvragen

0 / 2000