功能:有2232条记录分布在96个行政区,按条件统计出分区记录数
输入:excel文件,含有行政区row[1]和死亡人数row[7}两列
输出:分区记录数
实现代码:
1 | import xlrd |
2 | import pandas as pd |
3 | |
4 | def statistics(file): |
5 | # 打开文件,获取excel文件的workbook(工作簿)对象 |
6 | workbook = xlrd.open_workbook(file) # 文件路径 |
7 | worksheet=workbook.sheet_by_index(0) |
8 | |
9 | nrow=worksheet.nrows |
10 | print(nrow) |
11 | |
12 | district=['玄武区','秦淮区','建邺区','鼓楼区','浦口区','栖霞区','雨花台区','江宁区','六合区','溧水区','高淳区', |
13 | '锡山区','惠山区','滨湖区','梁溪区','新吴区','江阴市','宜兴市', |
14 | '鼓楼区','云龙区','贾汪区','泉山区','铜山区','丰县','沛县','睢宁县','新沂市','邳州市', |
15 | '天宁区','钟楼区','新北区','武进区','金坛区','溧阳市', |
16 | '虎丘区','吴中区','相城区','姑苏区','吴江区','常熟市','张家港市','昆山市','太仓市', |
17 | '崇川区','港闸区','通州区','如东县','启东市','如皋市','海门市','海安市', |
18 | '连云区','海州区','赣榆区','东海县','灌云县','灌南县', |
19 | '淮安区','淮阴区','清江浦区','洪泽区','涟水县','盱眙县','金湖县', |
20 | '亭湖区','盐都区','大丰区','响水县','滨海县','阜宁县','射阳县','建湖县','东台市', |
21 | '广陵区','邗江区','江都区','宝应县','仪征市','高邮市', |
22 | '京口区','润州区','丹徒区','丹阳市','扬中市','句容市', |
23 | '海陵区','高港区','姜堰区','兴化市','靖江市','泰兴市', |
24 | '宿城区','宿豫区','沭阳县','泗阳县','泗洪县'] |
25 | |
26 | n=[0]*96 |
27 | |
28 | for i in range(1,nrow): |
29 | row= worksheet.row_values(i) |
30 | for j in range(len(n)): |
31 | if row[1]==district[j] and row[7]=='死亡': |
32 | n[j]=n[j]+1 |
33 | |
34 | print(n) |
35 | print(sum(n)) |
36 | |
37 | c={'行政区':district,"死亡人数" : n} |
38 | data=pd.DataFrame(c) |
39 | print(data) |
40 | |
41 | if __name__=="__main__": |
42 | statistics("F:医学大数据课题论文终稿修改scientific report返修死亡率分析.xls") |
实现效果:
喜欢记得点赞,在看,加关注(数据杂坛),将持续更新!