根据错误信息,看起来是因为列名emp_job
在数据集中不存在导致的问题。请确保列名正确,并且在查询语句中使用与实际数据集匹配的列名。
从错误信息中可以看出,数据集中存在以下字段:[emp.1800, emp.1012, emp.203, emp.\u804c\u5de5, emp.\u5f20\u5218\u534e, emp.\u5973, emp.206]。
请检查您的数据集以及其中的字段名称,并确保在查询语句中使用正确的名称。如果字段名称包含特殊字符或Unicode字符,请使用反引号(`)将其括起来,例如:
spark.sql("SELECT DISTINCT `emp.工作` FROM emp ORDER BY 1 DESC").show()
请注意,在ORDER BY子句中,数字1表示第一个选择的列。确保它与您想要排序的列相对应。
内容由零声教学AI助手提供,问题来源于学员提问