pandas- все статьи тега ➜ страница 6

Разница между map, applymap и apply методы в панд

можете ли вы сказать мне, когда использовать эти методы векторизации с основными примерами? Я вижу map Это Series метод, в то время как остальные DataFrame методы. Я запутался насчет apply и методы. Почему у нас есть два метода для применения функции к фрейму данных? Опять же, простые примеры, которые иллюстрируют использование было бы здорово! ...

1507

24 июля 2019 г.

python pandas vectorization

Как проверить, является ли какое-либо значение NaN в кадре данных Pandas

в Python Pandas, каков наилучший способ проверить, имеет ли фрейм данных одно (или несколько) значений NaN? Я знаю о функции pd.isnan, но это возвращает фрейм данных булевых значений для каждого элемента. Этот пост прямо здесь не совсем отвечает на мой вопрос. ...

1678

24 июля 2019 г.

python pandas nan

Как преобразовать индекс pandas в фрейме данных в столбец?

это кажется довольно очевидным, но я не могу понять, как преобразовать индекс фрейма данных в столбец? например: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 в, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596 ...

1325

24 июля 2019 г.

python pandas

Каков наиболее эффективный способ перебора кадров данных с пандами?

Я хочу выполнять свои собственные сложные операции с финансовыми данными в кадрах данных в последовательном порядке. например, я использую следующий файл MSFT CSV, взятый из Yahoo Finance: Date,Open,High,Low,Close,Volume,Adj Close 2011-10-19,27.37,27.47,27.01,27.13,42880000,27.13 2011-10-18,26.94,27.40,26.80,27.31,52487900,27.31 2011-10-17,27.11,27.42,26.85,26.98,39433400,26.98 2011-10-14,27.31,27.50,27.02,27.27,50947700,27.27 .... затем я делаю следующее: #!/usr/bin/env python from pandas ...

774

24 июля 2019 г.

python pandas performance for-loop

Установите значение для конкретной ячейки в фрейме данных pandas с помощью индекса

Я создал панд DataFrame df=DataFrame(index=['A','B','C'], columns=['x','y']) и x y A NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки " C "и столбца "x". Я ожидал получить такой результат: x y A NaN NaN B NaN NaN C 10 NaN этот код: df.xs('C')['x']=10 но содержание df не изменились. Это снова только Нэн в кадре данных. какие предложения? ...

2271

24 июля 2019 г.

python pandas

Создание пустого фрейма данных Pandas, а затем его заполнение?

Я начинаю с документов фрейма данных pandas здесь:http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнить фрейм данных значениями в виде временного ряда расчета. Поэтому в основном я хотел бы инициализировать фрейм данных со столбцами A, B и строками временных меток, все 0 или все NaN. затем я добавлю начальные значения и перейду к этим данным, вычисляя новую строку из предыдущей строки, скажем row[A][t] = row[A][t-1]+1 или так. в настоящее время я использую к ...

4438

24 июля 2019 г.

python pandas dataframe

Как подсчитать количество строк в группе (и другие статистические данные) в pandas group by?

у меня есть фрейм данных df и я использую несколько столбцов из его groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() таким образом, я почти получаю таблицу (фрейм данных), что мне нужно. Отсутствует дополнительный столбец, содержащий количество строк в каждой группе. Другими словами, Я имею в виду, но я также хотел бы знать, сколько число было использовано для получения этих средств. Например, в первой группе есть 8 значений, а во второй 10 и так далее. ...

1136

24 июля 2019 г.

python group-by pandas distinct

панды: фильтровать строки фрейма данных с цепочкой операторов

большинство операций в pandas можно выполнить с цепочкой оператора (groupby,aggregate,apply и т. д.), Но единственный способ, который я нашел для фильтрации строк, - это обычное индексирование скобок df_filtered = df[df['column'] == value] это непривлекательно, как это требует я назначаю df к переменной, прежде чем иметь возможность фильтровать по ее значениям. Есть что-то более похожее на следующее? df_filtered = df.mask(lambda x: x['column'] == value) ...

863

24 июля 2019 г.

python pandas

Как сбросить индекс в фрейме данных pandas?

у меня есть фрейм данных, из которого я удаляю некоторые строки. В результате я получаю фрейм данных, в котором индекс выглядит примерно так:[1,5,6,10,11] и я хотел бы сбросить его в [0,1,2,3,4]. Как я могу это сделать? добавил следующий, кажется, работает: df = df.reset_index() del df['index'] следующее не работает: df = df.reindex() ...

902

24 июля 2019 г.

python pandas indexing dataframe

Импорт нескольких файлов csv в pandas и объединение в один фрейм данных

Я хотел бы прочитать несколько csv-файлов из каталога в pandas и объединить их в один большой фрейм данных. Я не смог это выяснить. Вот что у меня есть до сих пор: import glob import pandas as pd # get data file names path =r'C:DRODCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate all data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True) Я думаю, мне нужна помощь в цикле for??? ...

730

24 июля 2019 г.

python pandas concatenation csv

Как создать тестовые и обучающие образцы из одного фрейма данных с панд?

У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования. спасибо! ...

754

24 июля 2019 г.

python pandas python-2.7 dataframe

UnicodeDecodeError при чтении CSV-файла в панд с Python

Я запускаю программу, которая обрабатывает 30 000 подобных файлов. Случайное число из них останавливаются и производят эту ошибку... File "C:Importersrcdfmanimporter.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:Python33libsite-packagespandasioparsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:Python33libsite-packagespandasioparsers.py", line 205, in _read return parser.read() File "C:Pyt ...

2323

24 июля 2019 г.

python pandas unicode csv

Python Pandas ошибка токенизации данных

Я пытаюсь использовать панды для манипулирования .CSV-файл, но я получаю эту ошибку: панды.синтаксический анализатор.CParserError: ошибка маркирования данных. C ошибка: ожидается 2 поля в строке 3, увидел 12 Я попытался прочитать документы панды, но ничего не нашел. мой код очень простой: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Как я могу решить это? Я должен использовать csv модуль или другой язык ? файл из Морнингстар ...

6741

24 июля 2019 г.

python pandas csv

Как повернуть фрейм данных

что такое pivot? как мне повернуть? этот стержень? длинный формат в широкий формат? я видел много вопросов о сводных таблицах. Даже если они не знают, что они спрашивают о сводных таблицах, они обычно это делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все аспекты поворота.... ... Но я собираюсь дать ему идти. проблема с существующими вопросами и ответами заключается в том, что часто вопрос фокусируется на нюансе, который ОП имеет проблемы с обобщен ...

721

24 июля 2019 г.

python group-by pandas pivot

Преобразование Python dict в фрейм данных

у меня есть словарь Python, как показано ниже: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06- ...

1253

24 июля 2019 г.

python pandas dataframe

Переназначение значений в столбце pandas с помощью dict

у меня есть словарь, который выглядит так: di = {1: "A", 2: "B"} Я хотел бы применить его к столбцу "col1" фрейма данных, аналогичного: col1 col2 0 w a 1 1 2 2 2 NaN для: col1 col2 0 w a 1 A 2 2 B NaN как я могу лучше всего это сделать? По какой-то причине термины googling, относящиеся к этому, показывают мне только ссылки о том, как сделать столбцы из диктовок и наоборот :-/ ...

1248

24 июля 2019 г.

python dictionary pandas remap

Название или имя столбца индекса Pandas

Как мне получить имя столбца индекса в python pandas? Вот пример фрейма данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 то, что я пытаюсь сделать, это получить / установить заголовок индекса dataframe. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' : ["Apples", "Oranges", "Puppies", "Ducks"]} df = pd.DataFrame(data) df.index = df["Index ...

3722

24 июля 2019 г.

python pandas dataframe columnname

подсчитайте частоту появления значения в столбце фрейма данных

у меня есть набор данных |category| cat a cat b cat a Я хотел бы иметь возможность вернуть что-то вроде (показывая уникальные значения и частоту) category | freq | cat a 2 cat b 1 ...

641

24 июля 2019 г.

python pandas

Pandas DataFrame-найти строку, где значения для столбца максимальны

Как я могу найти строку, для которой значение определенного столбца maximal? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующие строки. ...

3675

24 июля 2019 г.

python pandas

Как удалить строки из фрейма данных pandas на основе условного выражения

у меня есть фрейм данных pandas, и я хочу удалить строки из него, где длина строки в определенном столбце больше 2. Я знаю, что могу использовать df.dropna() чтобы избавиться от строк, которые содержат какие-либо NaN, но я не вижу как удалить строки на основе условного выражения. ответ на этот вопрос кажется очень близко к тому, что я хочу ... кажется, я должен быть в состоянии сделать что-то вроде этого: df[(len(df['column name']) < 2)] но я просто получить ошибка: KeyError: u'no item ...

12962

24 июля 2019 г.

python pandas