手把手带你入门Python(十),选择单列和多列数据。
hello大家好我是杨游云,今天是母亲节,祝天下的母亲节日快乐!虽然今天是母亲节,但我们的学习还是不能落下,要养成自律的好习惯。今天打算跟大家讲一些简单基础的内容。
在Python当中如何选择单列和多列数据?话不多说我们马上进入正题。
·tn[]:data_cv今天我们跟大家讲一下在Python当中如何选择单列和多列数据。
首先还是基于之前泰坦尼克号的数据集,要对里面的数据进行一些列的选择。
首先还是运行一下之前的代码。
In []:data_把这份数据集给导入进来,首先运行一下。
"运行完了"就是把整个数据集导入进来,同时查看一下这份数据集的基本情况,因为这份数据就是本地导进来的原始数据集,所以数据里面的缺失值是没有进行任何的处理的,就是最原始的状态。
现在跟大家介绍一下如何去选择泰坦尼克号训练数据集里面的单列或者说多列数据。
首先这份数据集现在就可以用data下划线CSV来表示了。
然后要选择里面的一列数据,比如想选择里面的年龄这列数据,想看一下年龄的数据的具体情况就可以在数据集的后面加上一个中括号。
然后把要选择的列名用一个英文的双引号或者单引号都可以。
把列名放到单引号或者双引号的中间就表示要查看数据集里面的这一列指定的数据。
那这里就是年龄age。这个字段这里需要注意的是列名的写法一定要跟原始数集列名的写法一模一样。
因为Python里面是区分大小写的,跟SQL不一样,所以大家一定要注意列名的写法一定要写正确。随意加空格或者是其他符号都不可以。
这个就是要查看的年龄单列数据,运行一下好,运行完了就可以看到这一列数据里面所有数据的取值情况。中间的三个点就表示它。因为篇幅的原因没办法每个都列完出来,所以用了一个省略号。
从结果就可以看到这一列年龄的数据大概的情况,整体来说就是用一个中括号然后把要查看的列放到中括号中间,同时用一个单引号或者双引号给引起来就可以了。就这么简单。
这个是选择单列数据的一个方法,如果要同时去选择其中的多列数据,比如想要把这份数据集里面三个有缺失值的字段也就是年龄还有字段,还有字段还有字段。dtypes:float还有最后字段(5),dtype:这三列含有缺失值的字段全部给选出来。看一下该怎么操作。
·首先还是数据集,后面还是一个中括号,中括号里面是不能直接写多个字段名的。因为这里面就设计的是要提取的是字段的列表,所以在这里面还要多加一个中括号就表示要提取的字段。它是一个多个字段,把要提取的每个字段放到中括号里面,每个字段用一个逗号分割,才能实现同时选择多列数据的效果。
这里该怎么写?首先在这个里面的中括号里面还是要加上一个双引号或者单引号。把要选择的字段第一个是age给放进来,中间用一个英文逗号data隔开,接着写第二个字段。第二个字段就是cabin,可以复制一下以防写错放到第二个双引号的中间。第三个同理,第三个字段就是停靠的港口字段,也是复制一下放到第三个双引号里面,这样就可以把三个字段同时选择出来了。
大家可以看一下每个字段,一定是要用一个单引号或者选择单列是一样的,不同的是它里面因为涉及到多个字段,所以中间用一个英文逗号来隔开每个字段。
·最后再在外层加一个中括号,通过这样的方式来同时选择多个字段,运行一下看一下效果。运行完了就可以看到已经把这3列有缺失值的数据全部给展示出来了,中间一样的35,省略了一些数据没有展示。通过这种方式就可以查看想要查看的指定某一列或者多列数据里面数据的大概情况。
以上就是在Python当中选择单列和多列数据的基本方法,你学会了吗?是不是很简单?下期我们讲Python如何对数据进行排序?记得关注我,我们下期再见。