", line 1, in File "/opt/spark-2.3.3-bin-hadoop2.7/python/pyspark/sql/session.py", line 710, in sql return Da...-DPDK中文网" />

>>> spark.sql("SELECT DISTINCT emp_job FROM emp ORDER BY 1 DESC").show() Traceback (most recent call last): File "", line 1, in File "/opt/spark-2.3.3-bin-hadoop2.7/python/pyspark/sql/session.py", line 710, in sql return Da...

根据错误信息,看起来是因为列名emp_job在数据集中不存在导致的问题。请确保列名正确,并且在查询语句中使用与实际数据集匹配的列名。

从错误信息中可以看出,数据集中存在以下字段:[emp.1800, emp.1012, emp.203, emp.\u804c\u5de5, emp.\u5f20\u5218\u534e, emp.\u5973, emp.206]。

请检查您的数据集以及其中的字段名称,并确保在查询语句中使用正确的名称。如果字段名称包含特殊字符或Unicode字符,请使用反引号(`)将其括起来,例如:

spark.sql("SELECT DISTINCT `emp.工作` FROM emp ORDER BY 1 DESC").show()

请注意,在ORDER BY子句中,数字1表示第一个选择的列。确保它与您想要排序的列相对应。


内容由零声教学AI助手提供,问题来源于学员提问

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:", line 1, in File "/opt/spark-2.3.3-bin-hadoop2.7/python/pyspark/sql/session.py", line 710, in sql return Da...">https://sdn.0voice.com/?id=3953

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?