python练习——探索Chipotle快餐数据1. 将数据集存⼊⼀个名为 chipo 的数据框内
import pandas as pd
chipo = pd.read_csv('chipotle.tsv',sep='\t')
知识点:
读取csv⽂件ad_csv('a.csv')
读取txt⽂件data = pd.read_table('a.txt')
读取json⽂
ad_json('a.json')
读取excel⽂件ad_excel('a.xsl') ad_excel('a.xslx')
2. 查看前 10 ⾏内容
chipo.head(10)
3. 数据集中有多少个列(columns)?
或者
chipo.shape[1]
4. 打印出全部的列名称
或者
chipo.keys()
5. 数据集的索引是怎样的?
chipo.index
6. 被下单数最多商品(item)是什么?
chipo["item_name"].value_counts().head(1)#下单数最多的商品是Chicken Bowl
7. 在 item_name 这⼀列中,⼀共有多少种商品被下单?
len(chipo["item_name"].unique())#
或者
chipo["item_name"].nunique()
知识点:
8. ⼀共有多少个商品被下单?
chipo["quantity"].sum()
9. 将 item_price 转换为浮点数
print("转换前的数据类型",chipo["item_price"].dtypes)
for i in range(len(chipo["item_price"])):
chipo["item_price"][i]=chipo["item_price"][i].replace('$','')
chipo["item_price"]=chipo["item_price"].astype('float')
print("转换后的数据类型",chipo["item_price"].dtypes)
10. 在该数据集对应的时期内,收⼊(revenue)是多少?
chipo['sub_total'] = round(chipo['item_price'] * chipo['quantity'],2)#单价x数量chipo['sub_total'].sum()
python怎么读取json文件
知识点:
round函数⽤于指定保留⼩数位数,返回四舍五⼊的结果
11. 在该数据集对应的时期内,⼀共有多少订单?
len(chipo["order_id"].unique())
或者
chipo["order_id"].nunique()
12. 每⼀单(order)对应的平均总价是多少
(chipo['quantity']*chipo['item_price']).sum()/chipo["order_id"].nunique()

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。