How to handle data skew in Spark window functions?

前端未结

关注

 0  1448

I have a data set that I\'m trying to process in PySpark. The data (on disk as Parquet) contains user IDs, session IDs, and metadata related to each session. I\'m adding a n