首页 excel正文内容

「技巧1/100」批量提取数据中指定列并输出到文件

excel

2025-01-04 19:46:17

工具&环境

Spyder version: 5.1.5 None

Python version: 3.7.9 64-bit

Operating System: Windows 10

说明：数据为自动生成，可根据自己实际数据套用程序

引言

又是一年，师姐马上毕业。

工作交接，半成品的数据分析结果留下一大堆。

其中有一部分数据长这样：

有N个CSV文件，每个文件中有超50万行，N列数据。

需求

获取N个格式相同文件中指定的某（几）列，如上述数据中B列（学号），C列（评分），并生成各自相应文件如下：

代码实现

# -*- coding: utf-8 -*- """ Created on Wed Apr 6 11:11:00 2022 @author: gaopu """ import pandas as pd import datetime import csv import os dir= "文件所在路径" #指定读取文件列--- 0:第1列 1:第2列 select_col=[1,2] excel_list = [os.path.join(dir, i) for i in os.listdir(dir) if i.endswith('.csv')] for file_path in excel_list: start_time = datetime.datetime.now() file_info =pd.read_csv(file_path,usecols=select_col) #file_info = pd.read_table(file_path,usecols=select_col) file_info.to_csv(file_path+"filter.txt",index=False, sep="t", quoting=csv.QUOTE_NONE,header=True) print(datetime.datetime.now()-start_time)

核心代码讲解

—

1、子文件获取（筛选指定文件）

endswith('.csv')

这里'.csv'可以更换其他，如：'.txt'

excel_list = [os.path.join(dir, i) for i in os.listdir(dir) if i.endswith('.csv')]

2、读取文件内容，指定某（几）列

如果第一步为过滤使用了'.txt'

那么，

file_info =pd.read_csv(file_path,usecols=select_col)

pd.read_csv需要修改成pd.read_table

3、select_col=[1,2]

数组中1,2是列索引（角标），从0开始为第一列，依次递增。

如果想要获取第4、6、7列，那么这里改成[3,5,6]即可

结果：

我在代码中添加了时间戳计算，可以看出每个文本处理时间0.8s左右，速度可以接受。

文件输出：

file_info.to_csv(file_path+"filter.txt",index=False, sep="t", quoting=csv.QUOTE_NONE,header=True)

第1个参数是文件输出路径和名称，

sep="t"参数是列之间数据以制表符分割，此处可更改为自己特定分隔符。

上面代码可以直接拿来即用哟！

文末

天下事有难易乎？为之，则难者亦易矣；不为，则易者亦难矣。人之为学有难易乎？学之，则难者亦易矣；不学，则易者亦难矣。——彭端淑《为学一首示子侄》

获取时间的小时数HOUR函数应用技巧

« 上一篇

你不知道的vlookup函数小技巧，从乱序文字中提取手机号码

下一篇 »

更多相关文章

推荐文章

年会PPT怎么做(年会ppt怎么做好看)

年会PPT怎么做(年会ppt怎么做好看)

我哭了，早知道PPT排版有这么简单就好了

我哭了，早知道PPT排版有这么简单就好了

怎么才能用PPT赚到钱呢，PPT不过就是一个文档啊,它怎么能赚钱呢？

怎么才能用PPT赚到钱呢，PPT不过就是一个文档啊,它怎么能赚钱呢？

ICO推荐

两种方法告诉你如何给文字设置背景(文字背景在哪里设置)

做PPT时图片不要直接插入，套用这4个小技巧，让你的PPT更加高大上，转发分享

PPT里的图片，居然能自动上色，长见识了

热门文章

Excel 数据透视表中的“(空白)”，能不能不要让它出现？
2025-01-04
「Excel技巧」三种方法帮助你快速将多列内容转成一列内容
2025-01-04
excel怎样截屏整个表格，excel快速截屏5种方法
2025-01-04
excel表格死机怎么办(电脑打开excel卡死怎么解决)
2025-01-04
怎么把excel表的密码去掉(解除excel加密的方法步骤详解)
2025-01-04
excel表格怎样自动加数(excel怎么将数据自动增加)
2025-01-04

最新文章

excel表格怎样汇总数据(总分怎么算excel函数)
2025-01-04
excel如何插入幂次方(excel怎么打出次方)
2025-01-04
怎么使用excel做表格(怎么用excel制作表格)
2025-01-04
excel合格率怎么算(excel表格怎么求合格率)
2025-01-04
excel中让数据从高到低进行排序的方法(怎么排序excel数据从高到低)
2025-01-04
excel表格左右滚动设置(在excel右下角下拉选择怎样设置)
2025-01-04

标签列表