ZBLOG

mostPow = df.sort(df["Magnitude"].desc(), df["Year"].desc()).take(500) mostPowDF = spark.createDataFrame(mostPow) mostPowDF.show(10) #mostPowDF.toPandas().to_csv("mostPow2.csv",encoding='utf-8',index=False)

这段代码从DataFrame中按照”Magnitude”和”Year”降序排序,并选取前500行。然后,它将结果转换为Spark DataFrame对象并显示前10行。

mostPow = df.sort(df["Magnitude"].desc(), df["Year"].desc()).take(500)
mostPowDF = spark.createDataFrame(mostPow)
mostPowDF.show(10)
#mostPowDF.toPandas().to_csv("mostPow2.csv", encoding='utf-8', index=False)

如果你想将结果保存到CSV文件中,请取消注释最后一行的代码(去掉#),并指定正确的文件路径和名称。编码方式为UTF-8,并且不包含索引列(即不写入行号)。


内容由零声教学AI助手提供,问题来源于学员提问

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:https://sdn.0voice.com/?id=4244

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?