功能:有2232条记录分布在96个行政区,按条件统计出分区记录数

输入:excel文件,含有行政区row[1]和死亡人数row[7}两列

输出:分区记录数


实现代码:

1

import xlrd

2

import pandas as pd

3


4

def statistics(file):

5

# 打开文件,获取excel文件的workbook(工作簿)对象

6

workbook = xlrd.open_workbook(file) # 文件路径

7

worksheet=workbook.sheet_by_index(0)

8


9

nrow=worksheet.nrows

10

print(nrow)

11


12

district=['玄武区','秦淮区','建邺区','鼓楼区','浦口区','栖霞区','雨花台区','江宁区','六合区','溧水区','高淳区',

13

'锡山区','惠山区','滨湖区','梁溪区','新吴区','江阴市','宜兴市',

14

'鼓楼区','云龙区','贾汪区','泉山区','铜山区','丰县','沛县','睢宁县','新沂市','邳州市',

15

'天宁区','钟楼区','新北区','武进区','金坛区','溧阳市',

16

'虎丘区','吴中区','相城区','姑苏区','吴江区','常熟市','张家港市','昆山市','太仓市',

17

'崇川区','港闸区','通州区','如东县','启东市','如皋市','海门市','海安市',

18

'连云区','海州区','赣榆区','东海县','灌云县','灌南县',

19

'淮安区','淮阴区','清江浦区','洪泽区','涟水县','盱眙县','金湖县',

20

'亭湖区','盐都区','大丰区','响水县','滨海县','阜宁县','射阳县','建湖县','东台市',

21

'广陵区','邗江区','江都区','宝应县','仪征市','高邮市',

22

'京口区','润州区','丹徒区','丹阳市','扬中市','句容市',

23

'海陵区','高港区','姜堰区','兴化市','靖江市','泰兴市',

24

'宿城区','宿豫区','沭阳县','泗阳县','泗洪县']

25


26

n=[0]*96

27


28

for i in range(1,nrow):

29

row= worksheet.row_values(i)

30

for j in range(len(n)):

31

if row[1]==district[j] and row[7]=='死亡':

32

n[j]=n[j]+1

33


34

print(n)

35

print(sum(n))

36


37

c={'行政区':district,"死亡人数" : n}

38

data=pd.DataFrame(c)

39

print(data)

40


41

if __name__=="__main__":

42

statistics("F:医学大数据课题论文终稿修改scientific report返修死亡率分析.xls")

实现效果:

喜欢记得点赞,在看,加关注(数据杂坛),将持续更新!