2. 用`describe()`函数获取数据的统计信息,显示前10行:
```python
fdata.describe().head(10)
```
3. 用`rename()`函数,将列名修改为汉字,消费总额,小费,性别,是否抽烟,星期,聚餐时间段,人数:
```python
fdata.rename(columns={'total_bill':'消费总额', 'tip':'小费', 'sex':'性别', 'smoker':'是否抽烟', 'day':'星期', 'time':'聚餐时间段', 'size':'人数'}, inplace=True)
```
4. 利用字典键值对的方法,增加一列"人均消费",用`round()`函数返回计算后的整数值,显示前10行。人均消费由 消费总额/人数:
```python
fdata['人均消费'] = (fdata['消费总额'] / fdata['人数']).round().astype(int)
fdata.head(10)
```
5. 查询抽烟男性中人均消费大于5的数据,参考例4-29,4-30中`query`和布尔选择的用法进行查询:
```python
fdata.query("性别 == 'Male' and 是否抽烟 == 'Yes' and 人均消费 > 5")
```
6. 画散点图,分析“小费”和“消费总额”,参考例4-68:
```python
import matplotlib.pyplot as plt
plt.scatter(fdata['消费总额'], fdata['小费'])
plt.xlabel('消费总额')
plt.ylabel('小费')
plt.show()
```
7. 分析男女顾客哪个更慷慨,分组看看男性还是女性的小费平均水平更高,利用`groupby('性别')`进行分组,然后求`mean()`值,注意`groupby`返回的是对象,参考例子4-46:
```python
fdata.groupby('性别')['小