Pyspark RDD.фильтр () с подстановочным знаком

у меня есть Pyspark RDD с текстовым столбцом, который я хочу использовать в качестве фильтра, поэтому у меня есть следующий код:

table2 = table1.filter(lambda x: x[12] == "*TEXT*")

для проблема... Как вы видите, я использую * попытаться сказать ему интерпретировать это как подстановочный знак, но безуспешно. У кого-нибудь есть помощь ?

1 ответов


лямбда-функция является чистым python, поэтому что-то вроде ниже будет работать

table2 = table1.filter(lambda x: "TEXT" in x[12])