Kuinka purkaa taulukoita PDF-dokumenteista

Tämä artikkeli näyttää, kuinka voit purkaa taulukoita PDF-dokumenteista(extract tables from PDF documents) . Sinulla saattaa olla useita PDF -tiedostoja, jotka sisältävät useita taulukoita, joita haluat käyttää erikseen. Näiden taulukoiden kopioiminen(Copying) ja liittäminen ei ole hyvä vaihtoehto, koska se ei välttämättä anna odotettua tulosta, joten tarvitset joitain muita yksinkertaisia ​​vaihtoehtoja, jotka voivat poimia taulukoita PDF - tiedostosta ja tallentaa ne erillisiksi tiedostoiksi.

Useimmat näistä PDF-taulukoiden purkutyökaluista(PDF table extractor tools) eivät auta, jos PDF - taulukko skannataan. Tässä tapauksessa sinun tulee ensin tehdä PDF-tiedosto haettavaksi(make the PDF searchable)  ja kokeilla sitten näitä vaihtoehtoja.

Pura taulukoita PDF-dokumenteista

Tähän viestiin olemme lisänneet 2 ilmaista verkkopalvelua ja 3 ilmaista ohjelmistoa taulukoiden poimimiseksi PDF - tiedostosta:

  1. PDF XLS-muotoon
  2. PDFtoExcel.com
  3. Tabula
  4. ByteScout PDF -monityökalu
  5. Sejda PDF-työpöytä.

1] PDF XLS:ksi

PDF to XLS -palvelu

PDF to XLS on yksi parhaista vaihtoehdoista taulukoiden poimimiseen PDF -tiedostosta . Siinä on kaksi kätevää ominaisuutta. Voit hakea taulukoita 20 PDF - dokumentista yhdessä. Myös PDF - taulukon purku on automaattinen. Se luo tulosteen XLSX - tiedostona. Jos PDF -tiedostossa on useita taulukoita, jokainen taulukko tallennetaan erikseen eri XLSX -tulostustiedoston arkeille .

Avaa tämän palvelun kotisivu(Open the homepage) . Sen jälkeen vedä n pudota PDF - tiedostoja tai käytä LATAA TIEDOSTOT(UPLOAD FILES) -painiketta. Jokainen ladattu PDF muunnetaan automaattisesti XLSX-muotoon. Kun tulostustiedostot ovat valmiit, voit ladata ne yksitellen tai ZIP -tiedoston, joka sisältää kaikki tulostiedostot.

2] PDFtoExcel.com

Pura taulukoita PDF-dokumenteista

PDFtoExcel.com- palvelu voi poimia taulukoita yhdestä PDF -tiedostosta kerralla, mutta se tukee useita alustoja PDF -tiedoston lataamiseen . Se tukee OneDrive- , työpöytä-(desktop) , Google Drive- ja Dropbox -alustoja PDF -tiedoston lataamiseen . Myös muunnosprosessi on automaattinen.

Palvelun kotisivu on täällä(here) . Valitse sieltä latausvaihtoehto lisätäksesi PDF . Sen jälkeen se lataa ja muuntaa PDF - tiedoston automaattisesti Excel ( XLSX ) -tiedostoksi. Kun tuloste on valmis, saat latauslinkin PDF - taulukoita sisältävän tulostiedoston tallentamiseksi.

Huomautus:(Note: ) Vaikka tämä palvelu mainitsee, että se voi poimia taulukoita myös skannatuista PDF - tiedostoista, se ei toiminut minulle. Voit silti kokeilla sitä skannatun PDF -tiedoston kanssa .

3] Tabula

Tabula PDF-poimintaohjelmisto

Tabula on tehokas ohjelmisto, joka tunnistaa automaattisesti PDF -tiedostossa olevat taulukot ja voit sitten tallentaa ne TSV- , JSON- tai CSV - tiedostoina. Voit valita vaihtoehdon tallentaa erilliset CSV -tiedostot jokaiselle PDF - taulukolle tai tallentaa kaikki taulukot yhteen CSV - tiedostoon.

Lataa tämä avoimen lähdekoodin(open-source) PDF-taulukkopoimija napsauttamalla tätä(click here) . Se vaatii myös Javaa(requires Java) toimiakseen ja käyttääkseen sitä onnistuneesti.

Pura lataamasi ZIP - tiedosto ja suorita tabula.exe- tiedosto. Se avaa sivun oletusselaimessasi. Jos sivua ei avata, lisää selaimeen http://localhost:8080 ja paina Enter .

Nyt näet sen käyttöliittymän, jossa voit lisätä PDF -tiedoston (PDF)Selaa(Browse) -vaihtoehdon avulla . Paina sen jälkeen Tuo-(Import) painiketta. Kun PDF on lisätty, näet PDF -sivut sen käyttöliittymässä.

Käytä Automaattinen taulukot(Autodetect Tables) -painiketta, niin se korostaa automaattisesti kaikki kyseisessä PDF -tiedostossa olevat taulukot . Voit myös korostaa taulukon manuaalisesti valitsemalla tietyn taulukon. Halutessasi voit myös poistaa valitsemasi taulukot(remove selected tables) .

Tämä auttaa sinua tallentamaan vain haluamasi taulukot. Kun PDF -taulukot ovat korostettuina, napsauta Esikatsele ja vie purettuja tietoja(Preview & Export Extracted Data) -painiketta.

Valitse lopuksi tulostusmuoto yläosan pudotusvalikosta ja paina Vie(Export) - painiketta. Tämä tallentaa PDF -taulukot valitsemassasi tulostusmuodossa.

4] ByteScout PDF -monityökalu

ByteScout PDF Multitool - lisää pdf ja tunnista taulukot

Kuten nimestä voi päätellä, tämän ohjelmiston mukana tulee useita työkaluja. Siinä on työkaluja, kuten PDF:n muuntaminen monisivuiseksi TIFF-tiedostoksi(convert PDF to multipage TIFF) , PDF- dokumentin kiertäminen(rotate PDF document) , PDF-hakukyvyttömyyden tekeminen(make PDF unsearchable) , PDF:n optimointi(optimize PDF) , kuvan lisääminen PDF-tiedostoon(add an image to PDF) ja paljon muuta. Siellä on myös PDF(PDF) -taulukon ilmaisinominaisuus, joka on melko mahtava. Tämän työkalun etuna on, että voit poimia taulukoita myös skannatuista PDF-tiedostoista(extract tables from scanned PDF) . Voit tunnistaa taulukoita useilta sivuilta ja purkaa ne CSV- , XLS- , XML- , TXT- tai JSON -muotoisina tiedostoina. Ennen purkamista sen avulla voit myös asettaa sivualueen(page range)poimimaan taulukot vain määritetyiltä sivuilta.

Voit napata tämän ohjelmiston täältä(here) . Se on ilmainen vain ei-kaupalliseen käyttöön(free for non-commercial use) . Asennuksen jälkeen suorita tämä ohjelmisto ja lisää PDF -tiedosto (PDF)Open Document -vaihtoehdolla . Napsauta sen jälkeen Tunnista taulukot(Detect tables) -työkalua, kuten yllä olevassa kuvassa on korostettu. Tämä työkalu löytyy Data Extraction -luokasta.

Se avaa laatikon, jossa voit asettaa ehtoja taulukoiden havaitsemiseksi. Voit esimerkiksi asettaa vähimmäismäärän sarakkeita, rivejä, vähimmäisrivinvaihtoja taulukoiden välillä, asettaa taulukon tunnistustilaksi reunuksellisen tai reunattoman taulukon jne. Käytä vaihtoehtoja tai säilytä oletusasetukset.

Paina sen jälkeen Tunnista seuraava taulukko(Detect next table) -painiketta kyseisessä ruudussa. Se tunnistaa ja valitsee taulukon nykyiseltä sivulta. Tällä tavalla voit siirtyä toiselle sivulle ja havaita lisää taulukoita.

tunnistaa taulukoita ja tallentaa pdf-taulukoita valitulla lähdöllä

Kun olet valmis, käytä Jatka purkamiseen(Proceed to extraction) -painiketta ja valitse tulostusmuoto. Lopuksi voit käyttää vaihtoehtoja tallentaaksesi taulukot nykyiseltä sivulta tai määrittääksesi sivualueen ja tallentaaksesi tulosteen.

Työkalu antaa tyydyttävän tuloksen. Mutta joskus se saattaa havaita muuta sisältöä PDF -tiedostosta , eikä se välttämättä pysty poimimaan taulukoita useilta sivuilta. Siinä tapauksessa sinun tulee käyttää sitä taulukoiden hakemiseen ja tallentamiseen yksitellen.

5] Sejda PDF Desktop

Sejda PDF Desktop pdf-excel-muuntimella

Sejda PDF Desktop on myös monikäyttöinen ohjelmisto. Se voi optimoida tai pakata PDF(compress PDF) -tiedoston , lisätä vesileiman PDF-tiedostoon, poistaa rajoituksia PDF-tiedostosta(remove restrictions from PDF) , muokata PDF - dokumenttia jne. Sen ilmaisella suunnitelmalla on kuitenkin rajoituksia. Ilmaissuunnitelmassa voidaan tehdä vain 3 tehtävää päivässä. Myös PDF - kokorajoitus on 50 Mt(50 MB) tai 10 sivua(10 pages) .

Voit käyttää sen PDF–Excel-(PDF to Excel) muunnostyökalua PDF - taulukoiden purkamiseen. Se tunnistaa automaattisesti PDF - sivujen taulukot ja antaa sinun tallentaa ne XLSX- tai CSV -muodossa .

Sen latauslinkki on täällä(here) . Käytä asennuksen jälkeen PDF to Excel -työkalua sen pääliittymästä. Kun olet valinnut työkalun, käytä Valitse PDF-tiedostot(Choose PDF files) -painiketta. Ilmaiseen suunnitelmaan voidaan lisätä vain yksi PDF .

Kun PDF on lisätty, se tarjoaa Muunna PDF CSV-(Convert PDF to CSV) ja Muunna PDF Exceliksi(Convert PDF to Excel) -painikkeet. Käytä painiketta ja voit sitten tallentaa tulosteen haluamaasi paikkaan tietokoneellasi.

Muunna pdf-taulukko excel- tai csv-muotoon

Sen PDF- taulukon tunnistustyökalu on hyvä. Sinun ei tarvitse tunnistaa taulukoita manuaalisesti. Silti joskus se saattaa sisältää muuta tekstisisältöä PDF -taulukkona ja tallentaa sen tulosteeseen. Mutta kokonaistulokset ovat hyviä.

Siinä kaikki.

Nämä ovat hyviä työkaluja taulukoiden poimimiseen PDF -tiedostosta . Tabula- ohjelmisto on muita työkaluja tehokkaampi. Voit silti kokeilla kaikkia työkaluja ja tarkistaa, mikä auttaa.

Samanlainen lukee:(Similar reads:)



About the author

Olen ammattimainen Windows- ja toimistoohjelmistojen arvioija. Minulla on syvät tiedot näistä ohjelmista sekä niiden erilaisista ominaisuuksista ja ominaisuuksista. Arvosteluni ovat objektiivisia ja yksityiskohtaisia, jotta potentiaaliset asiakkaat näkevät, kuinka hyvin ohjelma toimii ja mitä parannuksia voitaisiin tehdä. Haluan myös auttaa ihmisiä löytämään parhaat sovellukset heidän tarpeisiinsa – joko arvostelujen kautta tai löytämään parhaat tarjoukset sovelluksista.



Related posts