BOOKING

2020年5月6日星期三

about SFO data, group by 用法

关于Groupby的用法,看来是必须掌握的。
首先本以为可以直接使用df.get_group,但是不行
必须要先


sfo_groupdata=sfo.groupby(['TRANSACTION'])

然后再作一个for loop 打印出每一个值

for TRANSACTION, TRANSACTION_df in sfo_groupdata:
    print(TRANSACTION)
    print(TRANSACTION_df)


这样就可以列表出来了, 然后再使用get_group这个方法,就可以调出来所有AIR CHINA的数据了

airchina = sfo_groupdata.get_group('AIR CHINA')
airchina

用下面的describe()列举出全部的相关的参数

airchina.describe()

TIMEFLIGHT_NUMBERTRANSACTIONTERMINALGATEREMARK
count34883488348834883450177
unique3488521124
top09/29/2015 02:38:00 PMCA985ARRIG99Closed
freq1160817443488272597


Count: 表示AirChina出现的次数
uniqe: 表示出现的唯一次数
top: 最上面的一次出现的次数

没有评论:

发表评论