来源:NKG下载网 更新:2024-02-11 22:01:46
用手机看
我是一名数据分析师,最近在使用pandas进行数据处理的时候,遇到了一个问题,需要给DataFrame新增一列,并根据条件给新列赋值。今天我就来分享一下我的亲身体验。
在使用pandas进行数据分析时,经常需要对数据进行加工和处理。其中,新增一列并按条件赋值是常见的操作。下面,我将从自己的角度出发,分享三个关键点。
第一,为DataFrame新增一列
要为DataFrame新增一列,我们可以使用`df['new_column']= values`的方式,其中`new_column`是新列的名称,`values`是新列的值。这里需要注意的是,`values`的长度必须与DataFrame的行数相同。例如,我要为一个包含学生姓名和成绩的DataFrame新增一列"评价":
python import pandas as pd data ={'姓名':['小明','小红','小刚'], '成绩':[80, 90, 70]} df = pd.DataFrame(data) df['评价']=''
通过以上代码,我们成功为DataFrame新增了一列"评价"。
第二,按条件给新列赋值
在实际应用中,我们经常需要根据某些条件给新列赋值。这时,我们可以使用`df.loc[condition,'new_column']= value`的方式,其中`condition`是条件,`new_column`是新列的名称,`value`是新列的值。例如,我要根据成绩给学生评价:
```python
df.loc[df['成绩']>= 90,'评价']='优秀'
df.loc[(df['成绩']>= 80)&(df['成绩']< 90),'评价']='良好'。
imtoken最新版下载:https://nekogram.com.cn/yingyong/9801.html