根据你提供的代码,可能有两个问题导致输出为空:
数据清洗:
data.dropna()
并没有对原始数据进行就地修改,而是返回了一个删除了缺失值的新DataFrame。因此,在计算A1和A2时,仍然使用的是未删除缺失值的原始数据。你可以将data.dropna()
的结果赋值给data
变量以更新数据。条件判断:在判断”Transported”列是否为True时,如果该列的值是布尔类型(True/False),则不应该用引号括起来。应将条件改为
data['Transported'] == True
或者简化为data['Transported']
.
以下是修正后的代码示例:
import pandas as pd
data = pd.read_csv('train.csv')
data = data.dropna()
A1 = data[data['Age'] >= 60]
A2 = data[(data['Age'] >= 60) & (data['Transported'] == True)]
print(A1.shape)
print(A2)
请注意,在这种情况下,确保csv文件路径正确,并且csv文件中包含名为’Age’和’Transported’的列。如果问题仍然存在,请提供更多关于数据和代码的详细信息,以便我能够更好地帮助你找到解决方案。
内容由零声教学AI助手提供,问题来源于学员提问