pandas- все статьи тега ➜ страница 6
Разница между map, applymap и apply методы в панд
можете ли вы сказать мне, когда использовать эти методы векторизации с основными примерами? Я вижу map Это Series метод, в то время как остальные DataFrame методы. Я запутался насчет apply и методы. Почему у нас есть два метода для применения функции к фрейму данных? Опять же, простые примеры, которые иллюстрируют использование было бы здорово! ...
Как проверить, является ли какое-либо значение NaN в кадре данных Pandas
в Python Pandas, каков наилучший способ проверить, имеет ли фрейм данных одно (или несколько) значений NaN? Я знаю о функции pd.isnan, но это возвращает фрейм данных булевых значений для каждого элемента. Этот пост прямо здесь не совсем отвечает на мой вопрос. ...
Как преобразовать индекс pandas в фрейме данных в столбец?
это кажется довольно очевидным, но я не могу понять, как преобразовать индекс фрейма данных в столбец? например: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 в, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596 ...
Каков наиболее эффективный способ перебора кадров данных с пандами?
Я хочу выполнять свои собственные сложные операции с финансовыми данными в кадрах данных в последовательном порядке. например, я использую следующий файл MSFT CSV, взятый из Yahoo Finance: Date,Open,High,Low,Close,Volume,Adj Close 2011-10-19,27.37,27.47,27.01,27.13,42880000,27.13 2011-10-18,26.94,27.40,26.80,27.31,52487900,27.31 2011-10-17,27.11,27.42,26.85,26.98,39433400,26.98 2011-10-14,27.31,27.50,27.02,27.27,50947700,27.27 .... затем я делаю следующее: #!/usr/bin/env python from pandas ...
Установите значение для конкретной ячейки в фрейме данных pandas с помощью индекса
Я создал панд DataFrame df=DataFrame(index=['A','B','C'], columns=['x','y']) и x y A NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки " C "и столбца "x". Я ожидал получить такой результат: x y A NaN NaN B NaN NaN C 10 NaN этот код: df.xs('C')['x']=10 но содержание df не изменились. Это снова только Нэн в кадре данных. какие предложения? ...
Создание пустого фрейма данных Pandas, а затем его заполнение?
Я начинаю с документов фрейма данных pandas здесь:http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнить фрейм данных значениями в виде временного ряда расчета. Поэтому в основном я хотел бы инициализировать фрейм данных со столбцами A, B и строками временных меток, все 0 или все NaN. затем я добавлю начальные значения и перейду к этим данным, вычисляя новую строку из предыдущей строки, скажем row[A][t] = row[A][t-1]+1 или так. в настоящее время я использую к ...
Как подсчитать количество строк в группе (и другие статистические данные) в pandas group by?
у меня есть фрейм данных df и я использую несколько столбцов из его groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() таким образом, я почти получаю таблицу (фрейм данных), что мне нужно. Отсутствует дополнительный столбец, содержащий количество строк в каждой группе. Другими словами, Я имею в виду, но я также хотел бы знать, сколько число было использовано для получения этих средств. Например, в первой группе есть 8 значений, а во второй 10 и так далее. ...
панды: фильтровать строки фрейма данных с цепочкой операторов
большинство операций в pandas можно выполнить с цепочкой оператора (groupby,aggregate,apply и т. д.), Но единственный способ, который я нашел для фильтрации строк, - это обычное индексирование скобок df_filtered = df[df['column'] == value] это непривлекательно, как это требует я назначаю df к переменной, прежде чем иметь возможность фильтровать по ее значениям. Есть что-то более похожее на следующее? df_filtered = df.mask(lambda x: x['column'] == value) ...
Как сбросить индекс в фрейме данных pandas?
у меня есть фрейм данных, из которого я удаляю некоторые строки. В результате я получаю фрейм данных, в котором индекс выглядит примерно так:[1,5,6,10,11] и я хотел бы сбросить его в [0,1,2,3,4]. Как я могу это сделать? добавил следующий, кажется, работает: df = df.reset_index() del df['index'] следующее не работает: df = df.reindex() ...
Импорт нескольких файлов csv в pandas и объединение в один фрейм данных
Я хотел бы прочитать несколько csv-файлов из каталога в pandas и объединить их в один большой фрейм данных. Я не смог это выяснить. Вот что у меня есть до сих пор: import glob import pandas as pd # get data file names path =r'C:DRODCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate all data into one DataFrame big_frame = pd.concat(dfs, ignore_index=True) Я думаю, мне нужна помощь в цикле for??? ...
Как создать тестовые и обучающие образцы из одного фрейма данных с панд?
У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования. спасибо! ...
UnicodeDecodeError при чтении CSV-файла в панд с Python
Я запускаю программу, которая обрабатывает 30 000 подобных файлов. Случайное число из них останавливаются и производят эту ошибку... File "C:Importersrcdfmanimporter.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:Python33libsite-packagespandasioparsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:Python33libsite-packagespandasioparsers.py", line 205, in _read return parser.read() File "C:Pyt ...
Python Pandas ошибка токенизации данных
Я пытаюсь использовать панды для манипулирования .CSV-файл, но я получаю эту ошибку: панды.синтаксический анализатор.CParserError: ошибка маркирования данных. C ошибка: ожидается 2 поля в строке 3, увидел 12 Я попытался прочитать документы панды, но ничего не нашел. мой код очень простой: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Как я могу решить это? Я должен использовать csv модуль или другой язык ? файл из Морнингстар ...
Как повернуть фрейм данных
что такое pivot? как мне повернуть? этот стержень? длинный формат в широкий формат? я видел много вопросов о сводных таблицах. Даже если они не знают, что они спрашивают о сводных таблицах, они обычно это делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все аспекты поворота.... ... Но я собираюсь дать ему идти. проблема с существующими вопросами и ответами заключается в том, что часто вопрос фокусируется на нюансе, который ОП имеет проблемы с обобщен ...
Преобразование Python dict в фрейм данных
у меня есть словарь Python, как показано ниже: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06- ...
Переназначение значений в столбце pandas с помощью dict
у меня есть словарь, который выглядит так: di = {1: "A", 2: "B"} Я хотел бы применить его к столбцу "col1" фрейма данных, аналогичного: col1 col2 0 w a 1 1 2 2 2 NaN для: col1 col2 0 w a 1 A 2 2 B NaN как я могу лучше всего это сделать? По какой-то причине термины googling, относящиеся к этому, показывают мне только ссылки о том, как сделать столбцы из диктовок и наоборот :-/ ...
Название или имя столбца индекса Pandas
Как мне получить имя столбца индекса в python pandas? Вот пример фрейма данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 то, что я пытаюсь сделать, это получить / установить заголовок индекса dataframe. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' : ["Apples", "Oranges", "Puppies", "Ducks"]} df = pd.DataFrame(data) df.index = df["Index ...
подсчитайте частоту появления значения в столбце фрейма данных
у меня есть набор данных |category| cat a cat b cat a Я хотел бы иметь возможность вернуть что-то вроде (показывая уникальные значения и частоту) category | freq | cat a 2 cat b 1 ...
Pandas DataFrame-найти строку, где значения для столбца максимальны
Как я могу найти строку, для которой значение определенного столбца maximal? df.max() даст мне максимальное значение для каждого столбца, я не знаю, как получить соответствующие строки. ...
Как удалить строки из фрейма данных pandas на основе условного выражения
у меня есть фрейм данных pandas, и я хочу удалить строки из него, где длина строки в определенном столбце больше 2. Я знаю, что могу использовать df.dropna() чтобы избавиться от строк, которые содержат какие-либо NaN, но я не вижу как удалить строки на основе условного выражения. ответ на этот вопрос кажется очень близко к тому, что я хочу ... кажется, я должен быть в состоянии сделать что-то вроде этого: df[(len(df['column name']) < 2)] но я просто получить ошибка: KeyError: u'no item ...