Kuinka avata todella suuria teksti- ja CSV-tiedostoja

MS Excel voi näyttää 1 048 576 riviä. Vaikka se voi tuntua todella suurelta määrältä normaalikäytössä, on monia skenaarioita, joissa se ei ole aivan tarpeeksi.

Katsoitpa lokitiedostoja tai suuria tietojoukkoja, on helppo löytää CSV - tiedostoja, joissa on miljoonia rivejä tai valtavia tekstitiedostoja. Koska Excel ei voi tukea näin suuria tiedostoja, miten ne tarkalleen avataan? Otetaan selvää.

Miksi tavalliset tekstieditorit(Normal Text Editors) eivät voi avata todella suuria tiedostoja(Open Really Large Files) ?

Tietokoneessa on gigatavua tallennustilaa, joten miksi tekstieditorit eivät voi avata suuria tiedostoja?

Tässä on kaksi tekijää pelissä. Joillakin sovelluksilla on kovakoodattu rajoitus sille, kuinka paljon dataa ne voivat näyttää. Ei ole väliä kuinka paljon muistia tietokoneessasi on, he eivät vain käytä sitä.

Toinen ongelma on RAM . Monilla tekstieditoreilla ei ole kovaa rajoitusta rivien lukumäärälle, mutta ne eivät pysty näyttämään suuria tiedostoja muistirajoitusten vuoksi. He lataavat koko tiedoston järjestelmän RAM -muistiin , joten jos tämä muisti ei ole tarpeeksi suuri, prosessi epäonnistuu.

Tapa 1: Ilmaisten editorien käyttäminen

Paras tapa tarkastella erittäin suuria tekstitiedostoja on käyttää… tekstieditoria. Ei vain mikä tahansa tekstieditori, vaan koodin kirjoittamiseen tarkoitetut työkalut. Tällaiset sovellukset voivat yleensä käsitellä suuria tiedostoja ilman ongelmia ja ovat ilmaisia.

Large Text File Viewer on luultavasti yksinkertaisin näistä sovelluksista. Se on todella helppokäyttöinen, toimii nopeasti ja sen resurssienjälki on erittäin pieni. Ainoa haittapuoli? Se ei voi muokata tiedostoja. Mutta jos haluat tarkastella vain suuria CSV - tiedostoja, tämä on paras työkalu työhön.

Myös suurten tekstitiedostojen muokkaamiseen kannattaa kokeilla Emacsia(Emacs) . Alun perin Unix - järjestelmille luotu se toimii erinomaisesti myös Windowsissa(Windows) ja pystyy käsittelemään suuria tiedostoja. Samoin Neovim ja Sublime Text ovat kaksi kevyttä IDE(IDEs) :tä, joita voidaan käyttää gigatavun kokoisten CSV - tekstitiedostojen avaamiseen.

Jos etsit vain tietoja suurten lokitiedostojen kautta, klogg on juuri sinulle sopiva työkalu. Suositun gloggin päivityshaarukka(glogg) , tämä sovellus mahdollistaa monimutkaisten hakutoimintojen suorittamisen valtavien tekstitiedostojen kautta helposti. Koska tietokoneella luoduissa lokitiedostoissa voi usein olla miljoonia rivejä, klogg on suunniteltu toimimaan tällaisten tiedostokokojen kanssa ilman ongelmia.

Tapa(Method) 2: Jaa useisiin osiin(Into Multiple Parts)

Koko ongelma yritettäessä avata suuria CSV - tiedostoja on, että ne ovat liian suuria. Mutta entä jos jakaisit nämä useisiin pienempiin tiedostoihin?

Tämä on suosittu ratkaisu, koska se ei yleensä edellytä uuden tekstieditorin käyttöliittymän oppimista. Sen sijaan voit käyttää yhtä monista verkossa saatavilla olevista CSV-jakajista jakaaksesi(one of the many CSV splitters available online) suuren tiedoston useiksi helposti avattaviksi tiedostoiksi. Jokainen näistä tiedostoista voidaan sitten käyttää normaalisti.

Tämä ei kuitenkaan ole paras tapa edetä asiassa. Suuren tiedoston jakaminen voi usein johtaa outoihin kirjoitusvirheisiin tai väärin konfiguroituihin tiedostoihin. Lisäksi jokaisen osan avaaminen erikseen estää sinua suodattamasta koko dataa kerralla.

Tapa 3: Tuo tietokantaan

Useisiin gigatavuihin ulottuvat teksti- ja .csv-tiedostot ovat yleensä suuria tietojoukkoja. Joten miksi ei vain tuoda niitä tietokantaan?

SQL on nykyään yleisin tietokannan merkintäkieli. SQL:stä on käytössä useita versioita(many versions of SQL) , mutta helpoin on luultavasti MySQL . Ja kuten onni, on mahdollista muuntaa CSV-tiedosto MySQL-taulukoksi(convert a CSV file into a MySQL table) .

Tämä ei suinkaan ole helpoin tapa käsitellä suuria CSV - tiedostoja, joten suosittelemme tätä vain, jos haluat käsitellä suuria tietojoukkoja säännöllisesti. Jos MySQL kuulostaa liian vaikealta, voit aina tuoda .csv-tiedostosi MS Accessiin(MS Access) .

Menetelmä(Method) 4: Analysoi Python- kirjastoilla

Kun työskentelet miljoonia tietorivejä sisältävän .csv-tiedoston kanssa, et selvästikään pysty ymmärtämään sitä manuaalisesti. Haluat luultavasti suodattaa tiedot ja suorittaa tiettyjä kyselyitä ymmärtääksesi trendejä.

Joten miksi et kirjoittaisi Python-koodia(write Python code) tehdäksesi juuri sen?

Jälleen kerran, tämä ei ole käyttäjäystävällisin tapa. Vaikka Python ei ole vaikein ohjelmointikieli oppia(Python isn’t the hardest programming language to learn) , se on koodausta, joten se ei ehkä ole paras tapa sinulle. Jos kuitenkin joudut jäsentämään todella suuria CSV -tiedostoja päivittäin, sinun kannattaa ehkä automatisoida tehtävä jollain Python-koodilla(automate the task with some Python code) .

Menetelmä 5: Premium-työkaluilla

Ensimmäisessä menetelmässä näkemämme tekstieditorit eivät olleet CSV - käsittelyyn tarkoitettuja työkaluja. Ne olivat yleiskäyttöisiä työkaluja, joita voitiin käyttää myös suurten .csv-tiedostojen kanssa.

Mutta entä erikoissovellukset? Eikö siellä ole olemassa sovelluksia, jotka on luotu ratkaisemaan tämän ongelman?

Itse asiassa niitä on. Esimerkiksi CSV Explorer perustuu samaan prosessiin, jota kuvailimme kahdessa viimeisessä menetelmässä ( (CSV Explorer)SQL - tietokanta ja Python -koodi) luodakseen sovelluksen, joka pystyy katselemaan ja muokkaamaan kaikenkokoisia CSV -tiedostoja. (CSV)Voit tehdä kaiken mitä laskentataulukkotyökalulta odotat, kuten luoda kaavioita tai suodattaa tietoja CSV Explorerissa(CSV Explorer) .

Toinen vaihtoehto on UltraEdit . Toisin kuin edellinen työkalu, tämä ei ole tarkoitettu vain .csv-tiedostoille, vaan kaikentyyppisille tekstitiedostoille. Se voi helposti käsitellä muutaman gigatavun teksti- ja CSV -tiedostoja, ja sen käyttöliittymä on samanlainen kuin monet aiemmin keskustelleet ilmaiseditorit. 

Ainoa haittapuoli näissä työkaluissa on, että ne ovat premium-sovelluksia, jotka edellyttävät maksullisen lisenssin hankkimista voidaksesi käyttää niitä. Voit aina kokeilla heidän ilmaisia ​​kokeiluversioita tarkistaaksesi niiden ominaisuudet tai jos sinulla on vain kertakäyttöinen käyttö.

Mikä on paras tapa avata suuria teksti-(Large Text) ja CSV-tiedostoja(CSV Files) ?

Tällä Big Datan(Big Data) aikakaudella ei ole harvinaista törmätä gigatavujen tekstitiedostoihin, joita voi olla vaikea edes tarkastella sisäänrakennetuilla työkaluilla, kuten Muistiolla(Notepad) tai MS Excelillä(MS Excel) . Jotta voit avata tällaisia ​​suuria CSV -tiedostoja, sinun on ladattava ja käytettävä kolmannen osapuolen sovellusta.

Jos haluat vain katsella tällaisia ​​tiedostoja, Large Text File Viewer on paras valinta sinulle. Voit itse muokata niitä kokeilemalla monipuolista tekstieditoria, kuten Emacsia(Emacs) , tai valita premium-työkalun, kuten CSV Explorer .

Tekniikat, kuten CSV - tiedoston jakaminen tai sen tuominen tietokantaan, sisältävät liian monta vaihetta. Sinun on parempi hankkia maksullinen lisenssi erityiselle premium-työkalulle, jos huomaat työskenteleväsi paljon valtavien tekstitiedostojen kanssa.



About the author

Olen tietojenkäsittelytieteilijä, jolla on yli 10 vuoden kokemus selainten, Microsoft Officen ja onedriven parista. Olen erikoistunut verkkokehitykseen, käyttäjäkokemustutkimukseen ja laajamittaiseen sovelluskehitykseen. Taitojani käyttävät eräät maailman johtavista yrityksistä, kuten Google, Facebook ja Apple.



Related posts