根据错误信息,看起来是因为列名emp_job
在数据集中不存在导致的问题。请确保列名正确,并且在查询语句中使用与实际数据集匹配的列名。
如果您不确定数据集中的列名,可以尝试使用df.show()
查看数据集的结构,然后根据实际情况更新查询语句中的列名。
例如:
spark.sql("SELECT DISTINCT emp_job FROM emp ORDER BY 1 DESC").show()
这里使用了数字索引作为排序列,确保它与您想要排序的列相对应。同时,请确保选择正确的表和字段名称以避免解析错误。
内容由零声教学AI助手提供,问题来源于学员提问