python按条件统计excel分区数据

功能：有2232条记录分布在96个行政区，按条件统计出分区记录数

输入：excel文件，含有行政区row[1]和死亡人数row[7}两列

输出：分区记录数

实现代码：

1	import xlrd
2	import pandas as pd
3
4	def statistics(file):
5	# 打开文件，获取excel文件的workbook（工作簿）对象
6	workbook = xlrd.open_workbook(file) # 文件路径
7	worksheet=workbook.sheet_by_index(0)
8
9	nrow=worksheet.nrows
10	print(nrow)
11
12	district=['玄武区','秦淮区','建邺区','鼓楼区','浦口区','栖霞区','雨花台区','江宁区','六合区','溧水区','高淳区',
13	'锡山区','惠山区','滨湖区','梁溪区','新吴区','江阴市','宜兴市',
14	'鼓楼区','云龙区','贾汪区','泉山区','铜山区','丰县','沛县','睢宁县','新沂市','邳州市',
15	'天宁区','钟楼区','新北区','武进区','金坛区','溧阳市',
16	'虎丘区','吴中区','相城区','姑苏区','吴江区','常熟市','张家港市','昆山市','太仓市',
17	'崇川区','港闸区','通州区','如东县','启东市','如皋市','海门市','海安市',
18	'连云区','海州区','赣榆区','东海县','灌云县','灌南县',
19	'淮安区','淮阴区','清江浦区','洪泽区','涟水县','盱眙县','金湖县',
20	'亭湖区','盐都区','大丰区','响水县','滨海县','阜宁县','射阳县','建湖县','东台市',
21	'广陵区','邗江区','江都区','宝应县','仪征市','高邮市',
22	'京口区','润州区','丹徒区','丹阳市','扬中市','句容市',
23	'海陵区','高港区','姜堰区','兴化市','靖江市','泰兴市',
24	'宿城区','宿豫区','沭阳县','泗阳县','泗洪县']
25
26	n=[0]*96
27
28	for i in range(1,nrow):
29	row= worksheet.row_values(i)
30	for j in range(len(n)):
31	if row[1]==district[j] and row[7]=='死亡':
32	n[j]=n[j]+1
33
34	print(n)
35	print(sum(n))
36
37	c={'行政区':district,"死亡人数" : n}
38	data=pd.DataFrame(c)
39	print(data)
40
41	if __name__=="__main__":
42	statistics("F:医学大数据课题论文终稿修改scientific report返修死亡率分析.xls")