Как найти максимальное значение столбца в Python dataframe
у меня есть фрейм данных в pyspark
. В этом фрейме данных у меня есть столбец id
Это уникально.
теперь я хочу найти maximum
значение колонки id
во фрейме данных.
Я пробовал как ниже
df['id'].max()
, но получил ниже ошибки
TypeError: 'Column' object is not callable
пожалуйста, дайте мне знать, как найти maximum
значение столбца в кадр данных
в ответе @Dadep ссылка дает правильное ответ
2 ответов
Если вы используете панды .max()
совместимость :
>>> df2=pd.DataFrame({'A':[1,5,0], 'B':[3, 5, 6]})
>>> df2['A'].max()
5
еще, если это spark
таблицы данных:
лучший способ получить максимальное значение в столбце Spark dataframe
Я прихожу из scala, но я считаю, что это также применимо к python.
val max = df.select(max("id")).first()
но вы должны сначала импортировать следующее:
import org.apache.spark.sql.functions.max