Kuinka purkaa taulukoita PDF-dokumenteista
Tämä artikkeli näyttää, kuinka voit purkaa taulukoita PDF-dokumenteista(extract tables from PDF documents) . Sinulla saattaa olla useita PDF -tiedostoja, jotka sisältävät useita taulukoita, joita haluat käyttää erikseen. Näiden taulukoiden kopioiminen(Copying) ja liittäminen ei ole hyvä vaihtoehto, koska se ei välttämättä anna odotettua tulosta, joten tarvitset joitain muita yksinkertaisia vaihtoehtoja, jotka voivat poimia taulukoita PDF - tiedostosta ja tallentaa ne erillisiksi tiedostoiksi.
Useimmat näistä PDF-taulukoiden purkutyökaluista(PDF table extractor tools) eivät auta, jos PDF - taulukko skannataan. Tässä tapauksessa sinun tulee ensin tehdä PDF-tiedosto haettavaksi(make the PDF searchable) ja kokeilla sitten näitä vaihtoehtoja.
Pura taulukoita PDF-dokumenteista
Tähän viestiin olemme lisänneet 2 ilmaista verkkopalvelua ja 3 ilmaista ohjelmistoa taulukoiden poimimiseksi PDF - tiedostosta:
- PDF XLS-muotoon
- PDFtoExcel.com
- Tabula
- ByteScout PDF -monityökalu
- Sejda PDF-työpöytä.
1] PDF XLS:ksi
PDF to XLS on yksi parhaista vaihtoehdoista taulukoiden poimimiseen PDF -tiedostosta . Siinä on kaksi kätevää ominaisuutta. Voit hakea taulukoita 20 PDF - dokumentista yhdessä. Myös PDF - taulukon purku on automaattinen. Se luo tulosteen XLSX - tiedostona. Jos PDF -tiedostossa on useita taulukoita, jokainen taulukko tallennetaan erikseen eri XLSX -tulostustiedoston arkeille .
Avaa tämän palvelun kotisivu(Open the homepage) . Sen jälkeen vedä n pudota PDF - tiedostoja tai käytä LATAA TIEDOSTOT(UPLOAD FILES) -painiketta. Jokainen ladattu PDF muunnetaan automaattisesti XLSX-muotoon. Kun tulostustiedostot ovat valmiit, voit ladata ne yksitellen tai ZIP -tiedoston, joka sisältää kaikki tulostiedostot.
2] PDFtoExcel.com
PDFtoExcel.com- palvelu voi poimia taulukoita yhdestä PDF -tiedostosta kerralla, mutta se tukee useita alustoja PDF -tiedoston lataamiseen . Se tukee OneDrive- , työpöytä-(desktop) , Google Drive- ja Dropbox -alustoja PDF -tiedoston lataamiseen . Myös muunnosprosessi on automaattinen.
Palvelun kotisivu on täällä(here) . Valitse sieltä latausvaihtoehto lisätäksesi PDF . Sen jälkeen se lataa ja muuntaa PDF - tiedoston automaattisesti Excel ( XLSX ) -tiedostoksi. Kun tuloste on valmis, saat latauslinkin PDF - taulukoita sisältävän tulostiedoston tallentamiseksi.
Huomautus:(Note: ) Vaikka tämä palvelu mainitsee, että se voi poimia taulukoita myös skannatuista PDF - tiedostoista, se ei toiminut minulle. Voit silti kokeilla sitä skannatun PDF -tiedoston kanssa .
3] Tabula
Tabula on tehokas ohjelmisto, joka tunnistaa automaattisesti PDF -tiedostossa olevat taulukot ja voit sitten tallentaa ne TSV- , JSON- tai CSV - tiedostoina. Voit valita vaihtoehdon tallentaa erilliset CSV -tiedostot jokaiselle PDF - taulukolle tai tallentaa kaikki taulukot yhteen CSV - tiedostoon.
Lataa tämä avoimen lähdekoodin(open-source) PDF-taulukkopoimija napsauttamalla tätä(click here) . Se vaatii myös Javaa(requires Java) toimiakseen ja käyttääkseen sitä onnistuneesti.
Pura lataamasi ZIP - tiedosto ja suorita tabula.exe- tiedosto. Se avaa sivun oletusselaimessasi. Jos sivua ei avata, lisää selaimeen http://localhost:8080 ja paina Enter .
Nyt näet sen käyttöliittymän, jossa voit lisätä PDF -tiedoston (PDF)Selaa(Browse) -vaihtoehdon avulla . Paina sen jälkeen Tuo-(Import) painiketta. Kun PDF on lisätty, näet PDF -sivut sen käyttöliittymässä.
Käytä Automaattinen taulukot(Autodetect Tables) -painiketta, niin se korostaa automaattisesti kaikki kyseisessä PDF -tiedostossa olevat taulukot . Voit myös korostaa taulukon manuaalisesti valitsemalla tietyn taulukon. Halutessasi voit myös poistaa valitsemasi taulukot(remove selected tables) .
Tämä auttaa sinua tallentamaan vain haluamasi taulukot. Kun PDF -taulukot ovat korostettuina, napsauta Esikatsele ja vie purettuja tietoja(Preview & Export Extracted Data) -painiketta.
Valitse lopuksi tulostusmuoto yläosan pudotusvalikosta ja paina Vie(Export) - painiketta. Tämä tallentaa PDF -taulukot valitsemassasi tulostusmuodossa.
4] ByteScout PDF -monityökalu
Kuten nimestä voi päätellä, tämän ohjelmiston mukana tulee useita työkaluja. Siinä on työkaluja, kuten PDF:n muuntaminen monisivuiseksi TIFF-tiedostoksi(convert PDF to multipage TIFF) , PDF- dokumentin kiertäminen(rotate PDF document) , PDF-hakukyvyttömyyden tekeminen(make PDF unsearchable) , PDF:n optimointi(optimize PDF) , kuvan lisääminen PDF-tiedostoon(add an image to PDF) ja paljon muuta. Siellä on myös PDF(PDF) -taulukon ilmaisinominaisuus, joka on melko mahtava. Tämän työkalun etuna on, että voit poimia taulukoita myös skannatuista PDF-tiedostoista(extract tables from scanned PDF) . Voit tunnistaa taulukoita useilta sivuilta ja purkaa ne CSV- , XLS- , XML- , TXT- tai JSON -muotoisina tiedostoina. Ennen purkamista sen avulla voit myös asettaa sivualueen(page range)poimimaan taulukot vain määritetyiltä sivuilta.
Voit napata tämän ohjelmiston täältä(here) . Se on ilmainen vain ei-kaupalliseen käyttöön(free for non-commercial use) . Asennuksen jälkeen suorita tämä ohjelmisto ja lisää PDF -tiedosto (PDF)Open Document -vaihtoehdolla . Napsauta sen jälkeen Tunnista taulukot(Detect tables) -työkalua, kuten yllä olevassa kuvassa on korostettu. Tämä työkalu löytyy Data Extraction -luokasta.
Se avaa laatikon, jossa voit asettaa ehtoja taulukoiden havaitsemiseksi. Voit esimerkiksi asettaa vähimmäismäärän sarakkeita, rivejä, vähimmäisrivinvaihtoja taulukoiden välillä, asettaa taulukon tunnistustilaksi reunuksellisen tai reunattoman taulukon jne. Käytä vaihtoehtoja tai säilytä oletusasetukset.
Paina sen jälkeen Tunnista seuraava taulukko(Detect next table) -painiketta kyseisessä ruudussa. Se tunnistaa ja valitsee taulukon nykyiseltä sivulta. Tällä tavalla voit siirtyä toiselle sivulle ja havaita lisää taulukoita.
Kun olet valmis, käytä Jatka purkamiseen(Proceed to extraction) -painiketta ja valitse tulostusmuoto. Lopuksi voit käyttää vaihtoehtoja tallentaaksesi taulukot nykyiseltä sivulta tai määrittääksesi sivualueen ja tallentaaksesi tulosteen.
Työkalu antaa tyydyttävän tuloksen. Mutta joskus se saattaa havaita muuta sisältöä PDF -tiedostosta , eikä se välttämättä pysty poimimaan taulukoita useilta sivuilta. Siinä tapauksessa sinun tulee käyttää sitä taulukoiden hakemiseen ja tallentamiseen yksitellen.
5] Sejda PDF Desktop
Sejda PDF Desktop on myös monikäyttöinen ohjelmisto. Se voi optimoida tai pakata PDF(compress PDF) -tiedoston , lisätä vesileiman PDF-tiedostoon, poistaa rajoituksia PDF-tiedostosta(remove restrictions from PDF) , muokata PDF - dokumenttia jne. Sen ilmaisella suunnitelmalla on kuitenkin rajoituksia. Ilmaissuunnitelmassa voidaan tehdä vain 3 tehtävää päivässä. Myös PDF - kokorajoitus on 50 Mt(50 MB) tai 10 sivua(10 pages) .
Voit käyttää sen PDF–Excel-(PDF to Excel) muunnostyökalua PDF - taulukoiden purkamiseen. Se tunnistaa automaattisesti PDF - sivujen taulukot ja antaa sinun tallentaa ne XLSX- tai CSV -muodossa .
Sen latauslinkki on täällä(here) . Käytä asennuksen jälkeen PDF to Excel -työkalua sen pääliittymästä. Kun olet valinnut työkalun, käytä Valitse PDF-tiedostot(Choose PDF files) -painiketta. Ilmaiseen suunnitelmaan voidaan lisätä vain yksi PDF .
Kun PDF on lisätty, se tarjoaa Muunna PDF CSV-(Convert PDF to CSV) ja Muunna PDF Exceliksi(Convert PDF to Excel) -painikkeet. Käytä painiketta ja voit sitten tallentaa tulosteen haluamaasi paikkaan tietokoneellasi.
Sen PDF- taulukon tunnistustyökalu on hyvä. Sinun ei tarvitse tunnistaa taulukoita manuaalisesti. Silti joskus se saattaa sisältää muuta tekstisisältöä PDF -taulukkona ja tallentaa sen tulosteeseen. Mutta kokonaistulokset ovat hyviä.
Siinä kaikki.
Nämä ovat hyviä työkaluja taulukoiden poimimiseen PDF -tiedostosta . Tabula- ohjelmisto on muita työkaluja tehokkaampi. Voit silti kokeilla kaikkia työkaluja ja tarkistaa, mikä auttaa.
Samanlainen lukee:(Similar reads:)
- Pura liitteet PDF-tiedostosta(Extract attachments from PDF)
- Poimi korostettu teksti PDF-tiedostosta(Extract highlighted text from PDF) .
Related posts
Asiakirjan muuntaja: Muunna DOC-, PDF-, DOCX-, RTF-, TXT-, HTML-tiedostoja
Mikä on PPS-tiedosto? Kuinka muuntaa PPS PDF:ksi Windows 11/10:ssä?
PDF-teksti katoaa, kun tiedostoa muokataan tai tallennetaan Windows 11/10:ssä
Parhaat ilmaiset pilvipohjaiset PDF-editorin online-työkalut
Ilmainen PDF Editor Online -työkalu PDF-tiedostojen muokkaamiseen - PDF Joo
PDF-sivujen rajaaminen Windows 11:ssä verkkotyökalun tai ilmaisen ohjelmiston avulla
Paras ilmainen PDF-muokkausohjelmisto Windows 10:lle
Paras ilmainen PDF Stamp Creator -ohjelmisto Windows 10:lle
Salaa PDF-tiedosto käyttämällä PDF-sivulukkoa Windows PC:lle
Verkkosivujen tallentaminen PDF-muodossa Chromessa tai Firefoxissa
Lataa Adobe Reader -sovellus Windows 10:lle Microsoft Storesta
Asiakirjojen muuntaminen PDF-muotoon Google-dokumenttien avulla selaimella
Pakkaa PDF-ohjelmisto: Pakkaa PDF-tiedostoja PDF Reducer -verkkotyökalujen avulla
PDF-metatietojen purkaminen ja tallentaminen Windows 11/10:ssä
Ilmainen PDF-kompressori PDF-tiedoston koon pienentämiseksi Windows 10:ssä
Lisää, poista tai muokkaa hyperlinkkejä PDF-tiedostoissa PDF-linkkieditorilla
Kuinka suojata ja suojata pdf-dokumentteja salasanalla LibreOfficen avulla
Muunna Word-, PowerPoint- ja Excel-asiakirjat PDF-muotoon Google-dokumenttien avulla
PDF-dokumentin muuntaminen monisivuiseksi TIFF-kuvaksi Windowsissa
Ota kaksisivuinen katselutila käyttöön PDF:lle Google Chrome PDF Viewerissa