python切割文件，我的''大馬士革刀'' ！

flyk0tcfb46p9f 2019-03-24

展開全文

在大型項目中，經(jīng)常需要執(zhí)行數(shù)據(jù)庫腳本，有些腳本特別大。如幾十兆的sql文件，盲目地執(zhí)行可能會導(dǎo)致很多的問題。如：

1）進(jìn)度不可控，時間難把握。

2）腳本中間出現(xiàn)差錯，導(dǎo)致后續(xù)報錯，甚至跑錯語句。

3）有重啟工程，意外宕機，就會中斷執(zhí)行任務(wù)。

4）不利于檢查和完善。

如果能夠?qū)⑦@么大sql文件進(jìn)行切割，分成多個小任務(wù)，每天按照計劃跑，以上問題基本可以得到解決。

安老師通過實戰(zhàn)總結(jié)了一些經(jīng)驗，下面就開始為大家介紹如何精準(zhǔn)切割文件。

大綱

1. 使用os.path模塊和open模塊

2. 切割文件演示

使用os.path模塊和open模塊

1. os.path模塊

2. open模塊

切割文件演示

1. 演示場景

本次默認(rèn)Windows切割文件，演示的圖片如下

1.1 原文件

文件路徑 F:\python\py自動化運維\公眾號\5 python切割文件\test.sql

文件首部(圖一,總1416行，此sql腳本為數(shù)據(jù)庫劈2016年的月分區(qū)。)

文件尾部(圖二)

2. 切割文件代碼

1import os 2import time 3 4def mkSubFile(bufferline, filenamepath, num): 5 [desfilename, typename] = os.path.splitext(filenamepath) 6 nfilename = desfilename + '_' + str(num) + typename 7 print('make file: %s' % nfilename) 8 scriptfile = open(nfilename, 'w') 9 try:10 scriptfile.writelines(bufferline)11 return num + 112 finally:13 scriptfile.close()1415def splitByLineCount(filenamepath, count):16 filename = open(filenamepath, 'r')17 try:18 bufferline = []19 num = 120 filename.seek(0)21 for line in filename:22 bufferline.append(line)23 if len(bufferline) == count and num >=1 :24 num = mkSubFile(bufferline, filenamepath, num)25 bufferline = []26 if len(bufferline) != count and num >=1 :27 num = mkSubFile(bufferline, filenamepath, num)28 finally:29 filename.close()3031if __name__ == '__main__':32 begin = time.time()33 filenamepath = r'F:\python\py自動化運維\公眾號\5 python切割文件\test.sql'34 splitByLineCount(filenamepath, 500)35 end = time.time()36 print('time is %d seconds ' % (end - begin))

2.1 重點代碼詳解

1）執(zhí)行流

begin = time.time() 開始切割時間

filenamepath 需要被切割的文件路徑

splitByLineCount(filenamepath, 500) 切割函數(shù)(被切割文件路徑，滿500行切割文件)

end = time.time() 結(jié)束切割時間

1）第5行 os.path.splitext 拆分原文件路徑，得到文件名和擴展名

2）第6行標(biāo)記切割第幾個文件

3）第8行 scriptfile = open(nfilename, 'w') 開始寫入文件

4）第11行 return num + 1 返回num值，下次切割文件為num+1值

5）第18行 bufferline = []，新建數(shù)組，記錄讀取行數(shù)值

6）第19行 num = 1，第一個切割文件