python提取csv指定列 python讀取多個csv文件中某一列,并生成一個新csv文件?
python讀取多個csv文件中某一列,并生成一個新csv文件?CSV可以直接作為文本讀取。它的格式是一行,由幾列逗號分隔,這與文本文件相同。讀取CSV后,用逗號分隔列,然后將需要的列寫入新文件。只是
python讀取多個csv文件中某一列,并生成一個新csv文件?
CSV可以直接作為文本讀取。它的格式是一行,由幾列逗號分隔,這與文本文件相同。讀取CSV后,用逗號分隔列,然后將需要的列寫入新文件。只是提供想法,我不會寫代碼。我可以用打開的拆分讀線讀取文件
python讀取csv文件中帶有小數(shù)點的的文件?
!f=pd.readCSV(“file name”,encoding=“GB2312”)
讀取文件中某些列的數(shù)據(jù)
data=F6。LOC[:,[“column name 1”,“column name 2”
]假設(shè)數(shù)據(jù)有這些列{“a”,“B”,“C”}
]如果a列的數(shù)據(jù)是{60ml,250ml,250ml,60ml,250ml,250ml,60ml,60ml,250ml,250ml,60ml,}
]只有{60250250,60250250,60,60250250,60,}可以直接寫為:
data[“a”]=data[“a”]結(jié)構(gòu)提取物(”(d))“,expand=false)
數(shù)據(jù)[”a“]。Astype(int)
如果列中有小數(shù),如{8.86℃、8.86℃、8.86℃、8.86℃、8.86℃},如果有負數(shù),則正則化改為:-?D(?)
數(shù)據(jù)[“a”]=數(shù)據(jù)[“a”]結(jié)構(gòu)提取物(”(d(?)?:.d)?)“,如果列是一個百分比,例如{55%,63%,72%,52%,72%}
data[”a“]=data[”a“]結(jié)構(gòu)提取物(”(d(?)?:.d)?)“,Expand=false)
數(shù)據(jù)[”a“]。Astype(float)=數(shù)據(jù)[“a”]。Astype(float)*0.01
這樣就可以得到{0.55,0.63,0.72,0.52,0.72}
大量的數(shù)據(jù)。更推薦使用Python和VBA在內(nèi)存中存儲數(shù)據(jù)。當數(shù)據(jù)沒有分割,計算機配置不高時,會出現(xiàn)更多的卡。經(jīng)過數(shù)據(jù)處理后,計算機在不釋放內(nèi)存的情況下也會更加無卡化VBA一般只啟動兩個CPU核進行數(shù)據(jù)計算,運算效率也相對較低。現(xiàn)在微軟已經(jīng)停止更新VBA了,更建議大家學習python。如果只操作excel,兩種學習難度相差不大,但是Python會有更好的發(fā)展空間
還有一種更方便的方法,那就是使用power Bi三個組件進行數(shù)據(jù)處理,使用power query進行數(shù)據(jù)處理,PowerPivot進行分析,power query進行數(shù)據(jù)處理的優(yōu)勢數(shù)據(jù)可視化的主要觀點是學習周期短,數(shù)據(jù)可以自動刷新,啟動時間相對較快。使用這種方法,效率可能比excel快,但速度仍然不如python快。當然,為了長期的可持續(xù)性,建議大家學習python,但起步時間會比較長