分割文件的脚本

阅读更多
今天需要把一个2百万的号码文件按行分割成500/个的小文件,当然用linux来做很方便:
首选split:
# split  --version
split (coreutils) 5.2.1
Written by Torbjorn Granlund and Richard M. Stallman.

我的版本支持按行分割:
split -l 500  m.txt -d fg

-d参数指定了分割后的文件用数字来命名,并用fg作为前缀,如果不用-d参数,则会生成xaa,xab这样的字母名。如果不指定前缀,则会用x作为默认前缀。

其次用awk,这个是我比较熟悉的方法:
gawk '{i=int((NR-1)/500)+1;{print $0>>"fg_"i".txt"}}' m.txt


当然windows下还可以用批处理来实现:

忽略空行

    @echo off & setlocal enabledelayedexpansion
    set m=1
    for /f "delims=" %%a in (a.txt) do (
            if !n! GEQ 100 set n=0 & set/a m+=1
            echo %%a>>a_!m!.txt
            set/a n+=1
    )


保留空行

    @echo off & setlocal enabledelayedexpansion
    set m=1
    for /f "delims=" %%a in ('findstr /n .* a.txt') do (
            if !n! GEQ 100 set n=0 & set/a m+=1
            for /f "tokens=1* delims=:" %%i in ("%%a") do echo.%%j>>a_!m!.txt
            set/a n+=1
    )



本文和 http://www.cn-dos.net/forum/viewthread.php?tid=41471完全相同,我搜索批处理方法的时候找到的。自己也记录一下,现在的记忆力越来越不好了。

你可能感兴趣的:(脚本,Java,Linux,PHP,DOS)