Tools
Merge PDF Split PDF Compress PDF Alle PDF-tools →
Oplossingen
For Business For Education For Developers
Bedrijf
Over ons Blog Press Contact
Product
Prijzen Functies FAQ Security
HomeToolsPDF naar tekst

PDF naar tekst

Extraheer de tekst uit een PDF naar een .txt-bestand. 100% in je browser — er wordt niets geüpload.

Selecteer een PDF

of sleep hier een PDF naartoe

100% in-browser No upload No signup

PDF naar tekst converteren

Drie stappen. Alles draait lokaal.

1

Kies een PDF

Sleep of selecteer een PDF. Hij wordt lokaal gelezen, zonder upload.

2

Kies het scheidingsteken

Hoe je de pagina-einden in het resultaat markeert. Standaard: leesbare markeringen.

3

Download het .txt-bestand

Plat UTF-8-tekstbestand dat in elke editor opent.

Wat is «PDF naar tekst»?

Een PDF naar tekst converteren betekent een PDF-document terugbrengen tot zijn ruwe woorden: geen lettertypen, geen afbeeldingen, geen lay-out. Het resultaat is een .txt-bestand in UTF-8 dat opent in elke editor, op elk besturingssysteem, in elk decennium. Het is het formaat bij uitstek wanneer je met grep door een document moet zoeken, het in een chatbot wilt plakken, het aan een script wilt voeren of gewoon wilt archiveren wat de PDF zei in het kleinst mogelijke bestand.

De tekst in een normale PDF wordt opgeslagen als een reeks gepositioneerde tekens. Deze tool leest die tekens opnieuw uit, groepeert ze in regels op basis van de Y-coördinaat, sorteert de regels van boven naar beneden, sorteert de elementen van links naar rechts binnen elke regel en schrijft het resultaat als één UTF-8-tekenreeks, pagina na pagina.

Hoe PDF naar tekst werkt in je browser

Wanneer je een PDF erin sleept, leest je browser hem in het geheugen. We geven de bytes door aan PDF.js, de opensource-PDF-engine van Mozilla. Voor elke pagina roepen we getTextContent() aan, die elk tekstelement met zijn positie teruggeeft. We groeperen de elementen in regels, sorteren ze in leesvolgorde en plakken ze aan elkaar tot één tekenreeks. Er is geen OCR-stap: de tekst die al als tekst in de PDF staat, wordt rechtstreeks geëxtraheerd. Als de PDF een gescande afbeelding is, is de tekstlaag leeg en komt er niets uit (gebruik in dat geval eerst OCR).

Het resultaat wordt naar een Blob geschreven en als download aangeboden. Er wordt niets geüpload. De volledige pijplijn — verwerken, extraheren, inpakken — draait in je browsertabblad. Je kunt hem offline draaien en hij werkt nog steeds.

Veelvoorkomende toepassingen

  • Doorzoekbaar archief van een PDF-map. Extraheer de tekst uit elke PDF, sla het .txt ernaast op en nu vindt grep alles binnen seconden.
  • Een PDF in ChatGPT/Claude/Gemini plakken. De meeste LLM-webinterfaces accepteren platte tekst veel beter dan PDF's: plak het .txt en stel je vraag.
  • Twee versies van een document vergelijken. Extraheer beide PDF's, draai diff en zie precies wat er is veranderd.
  • Voorbewerking voor NLP / scripts. Sentimentanalyse, entiteitsextractie, samenvatten — allemaal nemen ze tekst, geen PDF.
  • Toegankelijkheid. Converteer naar tekst en plak het in een editor die schermlezers ondersteunt.

Privacy en beveiliging

Contracten, loonstroken, medische dossiers, interne rapporten — juist het soort documenten waar mensen het liefst tekst uit halen, zijn precies de documenten die ze het minst op de server van een vreemde willen hebben. De meeste online PDF-naar-tekst-tools uploaden het bestand, extraheren de tekst op hun server en leveren een .txt. imisspdf doet hetzelfde werk met PDF.js dat in je tabblad draait. Er is geen upload, geen account, geen daglimiet. Bekijk onze privacyreview van iLovePDF om te zien hoe het standaard uploadmodel er echt uitziet.

Veelgestelde vragen

Gescande PDF's zijn afbeeldingen van pagina's, geen tekst. Er is geen tekstlaag om te extraheren — de woorden die je ziet, zijn slechts pixels. Haal de PDF eerst door onze OCR-tool; die legt een tekstlaag over de afbeelding, waarna pdf-to-text de woorden kan extraheren. Als de PDF is gemaakt door papier te fotograferen of te scannen, is OCR altijd de ontbrekende stap.

Nee. De uitvoer is platte UTF-8-tekst — geen vet, cursief, lettergroottes of kleuren. Regels uit de bron-PDF blijven behouden, maar lay-outs met meerdere kolommen worden afgevlakt tot de leesvolgorde, één kolom tegelijk. Heb je opmaakbehoud nodig, gebruik dan PDF naar Word, dat koppen en inline-stijlen behoudt.

Zo goed mogelijk. Tabellen worden ongeveer tab-gescheiden regels op basis van de oorspronkelijke kolomposities in de PDF — meestal leesbaar, maar niet perfect uitgelijnd. Artikelen met meerdere kolommen worden één kolom tegelijk geëxtraheerd, van boven naar beneden. Voor nauwkeurige tabelextractie gebruik je PDF naar Excel.

Nee. PDF.js verwerkt het bestand in je browsertabblad, extraheert de tekst met getTextContent() en schrijft het resultaat naar een Blob die naar je computer wordt gedownload. Er gaat niets over het netwerk. Je kunt dit controleren door de tool offline te draaien — die werkt dan nog steeds.

Niet rechtstreeks. Versleutelde PDF's kunnen niet worden verwerkt zonder het wachtwoord. Haal het bestand eerst door onze tool PDF ontgrendelen (geef het wachtwoord op) en breng de ontgrendelde PDF daarna hierheen. We weigeren versleutelde PDF's uitdrukkelijk met een vriendelijke melding in plaats van stilletjes een leeg bestand terug te geven.

Tips voor het beste resultaat

  • Komt het bestand van een scanner of camera, draai dan eerst OCR. Gescande PDF's hebben geen tekstlaag om te extraheren.
  • Kies «Paginamarkeringen» om door mensen te laten lezen. Het standaardscheidingsteken maakt het makkelijk te zien waar een pagina eindigt en de volgende begint.
  • Gebruik het paginaeinde-teken voor oude printers/tools in ASCII. Stuur je het .txt door naar iets ouds, dan is het \f-teken het traditionele pagina-einde.
  • PDF's met meerdere kolommen hebben een schone bron nodig. Lopen twee kolommen door elkaar, dan codeert de onderliggende PDF de tekst waarschijnlijk buiten volgorde — probeer hem in Acrobat te openen en opnieuw op te slaan.
  • Ontgrendel versleutelde PDF's eerst. We weigeren stilletjes lege tekst terug te geven — PDF ontgrendelen en kom terug.

Gerelateerde PDF-tools

 Nederlands
Get unlimited PDF tools + AI features
Start free trial →