Как удалить строки из фрейма данных pandas, содержащего определенную строку в определенном столбце?

Question

Как удалить строки из фрейма данных pandas, содержащего определенную строку в определенном столбце?

У меня есть очень большой фрейм данных в python, и я хочу удалить все строки, которые имеют определенную строку внутри определенного столбца.

Например, я хочу удалить все строки, которые имеют строку " XYZ " в качестве подстроки в столбце C фрейма данных.

Может ли это быть реализовано эффективным способом с помощью .метод drop ()?

742 6

python pandas

6 ответов:

Comments

Ничего не найдено.

Brian from QuantRocket · Accepted Answer · 2015-02-23 19:49:32

Pandas имеет векторизованные строковые операции, поэтому вы можете просто отфильтровать строки, содержащие строку, которую вы не хотите:
In [91]: df = pd.DataFrame(dict(A=[5,3,5,6], C=["foo","bar","fooXYZbar", "bat"]))

In [92]: df
Out[92]:
   A          C
0  5        foo
1  3        bar
2  5  fooXYZbar
3  6        bat

In [93]: df[df.C.str.contains("XYZ") == False]
Out[93]:
   A    C
0  5  foo
1  3  bar
3  6  bat

ksooklall · Accepted Answer · 2017-04-13 22:03:16

Если ваше ограничение строки не является только одной строкой, вы можете удалить соответствующие строки с помощью:
df = df[~df['your column'].isin(['list of strings'])]
Выше будут удалены все строки, содержащие элементы вашего списка

Rupert Schiessl · Accepted Answer · 2017-08-14 21:58:12

Это будет работать только в том случае, если вы хотите сравнить точные строки. Он не будет работать, если вы хотите проверить, содержит ли строка столбца какую-либо из строк в списке. Правильным способом сравнения со списком было бы:
   searchfor = ['john', 'doe']
   df = df[~df.col.str.contains('|'.join(searchfor))]

Amy Annine · Accepted Answer · 2018-04-04 12:00:10

new_df = df[df.C != 'XYZ']
Ссылка: https://chrisalbon.com/python/data_wrangling/pandas_dropping_column_and_rows/

Zhou Ruohua · Accepted Answer · 2018-06-12 16:26:05

Если вы не хотите удалять все NaN, используйте
df[~df.C.str.contains("XYZ") == True]

ak3191 · Accepted Answer · 2018-08-02 20:36:06

Приведенный ниже код даст вам список всех строк: -
df[df['C'] != 'XYZ']
Для хранения значений из приведенного выше кода в фрейм данных : -
newdf = df[df['C'] != 'XYZ']