Oszd fel a szövegfájlt fele (vagy bármely százalékban) az Ubuntu Linuxon
Ha nehézkes szövegfájlja van, amelyet megpróbál feldolgozni, a szétválasztás szekcióba néha segíthet a feldolgozási időben, különösen, ha egy táblázatot importálunk. Vagy lehet, hogy csak egy bizonyos sor vonalat szeretne letölteni egy fájlból.
Adja meg a split, wc, farok, macska és grep. (ne felejtsük el, hogy sed és awk). A Linux gazdag segédprogramokat tartalmaz a parancssori szövegfájlok kezeléséhez. A mi feladatunkra ma osztott és wc-t fogunk használni.
Először nézzük meg naplófájlunkat ... .
> Ls -l
-rw-r-r- 1 thegeek ggroup 42046520 2006-09-19 11:42 access.log
Látjuk, hogy a fájl mérete 42 MB. Ez nagyszerű… de hány sorban foglalkozunk? Ha ezt az Excel-be szeretnénk importálni, kevesebb, mint 65 ezer vonalat kell tartanunk.
Nézzük meg a fájlban lévő sorok számát a wc segédprogram használatával, amely a „szószám” kifejezését jelenti.
> wc -l access.log
146330 access.log
Túllépjük a határt. Ezt három szegmensre kell osztanunk. Ehhez a megosztott segédprogramot fogjuk használni.
> split -l 60000 access.log
> Ls -lösszesen 79124
-rw-rw-r- 1 thegeek ggroup 40465200 2006-09-19 12:00 access.log
-rw-rw-r- 1 thegeek ggroup 16598163 2006-09-19 12:05 xaa
-rw-rw-r- 1 thegeek ggroup 16596545 2006-09-19 12:05 xab
-rw-rw-r- 1 thegeek 7270492 ggroup 2006-09-19 12:05 xac
A szövegfájlokat most három különálló fájlba osztottuk, amelyek mindegyike kevesebb, mint 60000 sort tartalmaz, ami jó számnak tűnt. Az utolsó fájl tartalmazza a maradék összeget. Ha félig vágná ezt a fájlt, akkor ezt tette volna:
> split -l 73165 access.log
És ez az egész.