Заменить значения в кадре данных Pandas в цикле
Я пытаюсь выполнить цикл через фрейм данных pandas и заменить значения в определенных столбцах, если они соответствуют определенным условиям. Я понимаю, что есть более простые способы сделать это в целом, но в моем конкретном примере мне нужен цикл, потому что результат для одной строки может зависеть от предыдущей строки. Ниже приведен воспроизводимый пример того, что происходит неправильно. Когда я пытаюсь заменить текст, он не заменяет его.
import pandas as pd
df = pd.DataFrame({"A": ["I", "AM", "NOT", "WORKING", "!"], "B": [20, 30, 10, 40, 50], "C": [32, 234, 23, 23, 42523]})
for index, row in df.iterrows():
row['A'] = "I am working!"
print(df)
, который печатает:
A B C
0 I 20 32
1 AM 30 234
2 NOT 10 23
3 WORKING 40 23
4 ! 50 42523
1 ответов
вы можете написать в исходный кадр, используя .loc
:
>>> for index, row in df.iterrows():
... df.loc[index, "A"] = "I am working! {}".format(row["B"])
...
>>> df
A B C
0 I am working! 20 20 32
1 I am working! 30 30 234
2 I am working! 10 10 23
3 I am working! 40 40 23
4 I am working! 50 50 42523
[5 rows x 3 columns]
в сторону: даже если одна строка зависит от предыдущей строки, могут быть способы ее векторизации, но я признаю, что иногда гораздо проще сделать это вручную, на основе цикла.