dataframe- все статьи тега ➜ страница 2
pandas-группировка и фильтрация последовательных значений
У меня есть этот фрейм данных df: U,Datetime 01,2015-01-01 20:00:00 01,2015-02-01 20:05:00 01,2015-04-01 21:00:00 01,2015-05-01 22:00:00 01,2015-07-01 22:05:00 02,2015-08-01 20:00:00 02,2015-09-01 21:00:00 02,2014-01-01 23:00:00 02,2014-02-01 22:05:00 02,2015-01-01 20:00:00 02,2014-03-01 21:00:00 03,2015-10-01 20:00:00 03,2015-11-01 21:00:00 03,2015-12-01 23:00:00 03,2015-01-01 22:05:00 03,2015-02-01 20:00:00 03,2015-05-01 21:00:00 03,2014-01-01 20:00:00 03,2014-02-01 21:00:00 Сделано U и Da ...
Прочитать все, кроме последней строки CSV-файла в pandas
У меня есть CSV-файлы, которые я читаю в pandas с: #!/usr/bin/env python import pandas as pd import sys filename = sys.argv[1] df = pd.read_csv(filename) К сожалению, последняя строка этих файлов часто повреждена (имеет неправильное количество запятых). В настоящее время я открываю каждый файл в текстовом редакторе и удаляю последнюю строку. Можно ли удалить последнюю строку в том же скрипте python / pandas, который загружает CSV, чтобы избежать необходимости выполнять этот дополнительны ...
Pandas DataFrame groupby два столбца и получить первый и последний
У меня есть DataFrame как следовать. df = pd.DataFrame({'id' : [1,1,2,3,2], 'value' : ["a","b","a","a","c"], 'Time' : ['6/Nov/2012 23:59:59 -0600','6/Nov/2012 00:00:05 -0600','7/Nov/2012 00:00:09 -0600','27/Nov/2012 00:00:13 -0600','27/Nov/2012 00:00:17 -0600']}) Мне нужно получить вывод, подобный следующему. combined_id | enter time | exit time | time difference Combined_id должна быть создана группировка 'ID' и 'значение' g = df.groupby(['id', 'value']) Следующее Не р ...
Как перебирать строки в фрейме данных в панд?
у меня есть DataFrame от Панды: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df выход: c1 c2 0 10 100 1 11 110 2 12 120 теперь я хочу перебрать строки этого кадра. Для каждой строки Я хочу иметь доступ к ее элементам (значения в ячейках) по имени столбцов. Например: for row in df.rows: print row['c1'], row['c2'] можно ли это сделать у панд? Я нашел это аналогичный вопрос. Но это не дает мне ответа, в ...
Удалить столбец из таблицы данных с помощью панды-дель-ДФ.имя столбца
при удалении столбца в таблице данных я использую: del df['column_name'] и это прекрасно работает. Почему я не могу использовать следующее? del df.column_name как вы можете получить доступ к колонке / серии как df.column_name, Я ожидаю, что это сработает. ...
Добавление нового столбца в существующий фрейм данных в Python pandas
у меня есть следующий индексированный фрейм данных с именованными столбцами и строками не-непрерывными числами: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Я хотел бы добавить новый столбец,'e', к существующему фрейму данных и не хотите ничего менять в фрейме данных (т. е. новый столбец всегда имеет ту же длину, что и фрейм данных). 0 -0.335485 1 -1.166658 2 -0.3 ...
Получить список из заголовков столбцов pandas DataFrame
Я хочу получить список заголовков столбцов из фрейма данных pandas. Фрейм данных будет поступать из пользовательского ввода, поэтому я не буду знать, сколько столбцов будет или как они будут называться. например, если мне дают фрейм данных, как это: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 6 7 7 5 4 8 3 6 8 2 8 7 9 9 10 8 6 6 4 9 10 10 7 Я хотел бы получить список, как показано ни ...
Выбор нескольких столбцов в панды фрейма данных
у меня есть данные в разных столбцах, но я не знаю как извлечь его, чтобы сохранить его в другой переменной. index a b c 1 2 3 4 2 3 4 5 Как выбрать 'a','b' и сохранить его в df1? пробовал df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] ни один, кажется, не работает. (Незначительное Редактирование) ...
Как получить количество строк в кадре данных Pandas?
Я пытаюсь получить количество строк dataframe df с пандами, и вот мой код. Способ 1: total_rows = df.count print total_rows +1 Способ 2: total_rows = df['First_columnn_label'].count print total_rows +1 оба фрагмента кода дают мне эту ошибку: TypeError: неподдерживаемые типы операндов для+: 'instancemethod ' и'int' что я делаю не так? По данным ответ дано @ root лучший (the самый быстрый) способ проверить длину df-это позвонить: df.shape[0] ...
Создайте пустые данные.рамка
Я пытаюсь инициализировать данные.рамка без каких-либо строк. В принципе, я хочу указать типы данных для каждого столбца и назвать их, но не иметь никаких строк, созданных в результате. лучшее, что я смог сделать до сих пор что-то вроде: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] который создает данные.фрейм с одной строкой, содержащей все типы данных и имена столбцов, которые я хотел, но так ...
Преобразование панды метода groupBy объекта в таблице данных
Я начинаю с входных данных, как это df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) который при печати выглядит следующим образом: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory группировка достаточно прост: g1 = df1.groupby( [ "Name", "City"] ).count() и ...
Как бороться с SettingWithCopyWarning у панд?
фон Я только что обновил свои панды с 0.11 до 0.13. 0rc1. Теперь, приложение выскакивает много новых предупреждений. Один из них такой: E:FinReporterFM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE Я хочу знать, что именно это означает? Нужно ли мне что-то менять? как я должен приостановить предупреждение, если я настаиваю на ис ...
Создание пустого фрейма данных Pandas, а затем его заполнение?
Я начинаю с документов фрейма данных pandas здесь:http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнить фрейм данных значениями в виде временного ряда расчета. Поэтому в основном я хотел бы инициализировать фрейм данных со столбцами A, B и строками временных меток, все 0 или все NaN. затем я добавлю начальные значения и перейду к этим данным, вычисляя новую строку из предыдущей строки, скажем row[A][t] = row[A][t-1]+1 или так. в настоящее время я использую к ...
Как сбросить индекс в фрейме данных pandas?
у меня есть фрейм данных, из которого я удаляю некоторые строки. В результате я получаю фрейм данных, в котором индекс выглядит примерно так:[1,5,6,10,11] и я хотел бы сбросить его в [0,1,2,3,4]. Как я могу это сделать? добавил следующий, кажется, работает: df = df.reset_index() del df['index'] следующее не работает: df = df.reindex() ...
Одновременно объединить несколько данных.кадры в списке
у меня есть список из многих данных.кадры, которые я хочу объединить. Проблема здесь в том, что каждый данные.фрейм отличается по количеству строк и столбцов, но все они разделяют ключевые переменные (которые я назвал "var1" и "var2" в коде ниже). Если данные есть.рамки были идентичны с точки зрения столбцов, я мог просто rbind, для которого rbind plyr.fill выполнит эту работу, но это не так с этими данными. потому что merge команда работает только на 2 данные.кадры, я обратился к Интернету за ...
Как создать тестовые и обучающие образцы из одного фрейма данных с панд?
У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования. спасибо! ...
Разделить строковый столбец фрейма данных на несколько столбцов
Я хотел бы взять данные из формы before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 и использовать split() в графе "type" С выше, чтобы получить что-то вроде этого: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 4 foo bar 4 6 foo bar_2 Я придумал что-то невероятно сложное с участием какой-то формы apply это сработало, но с те ...
Преобразование Python dict в фрейм данных
у меня есть словарь Python, как показано ниже: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06- ...
Название или имя столбца индекса Pandas
Как мне получить имя столбца индекса в python pandas? Вот пример фрейма данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 то, что я пытаюсь сделать, это получить / установить заголовок индекса dataframe. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' : ["Apples", "Oranges", "Puppies", "Ducks"]} df = pd.DataFrame(data) df.index = df["Index ...
Как создать пустой фрейм данных с именами столбцов, указанных в R? [дубликат]
Возможные Дубликаты:создать пустые данные.Кадр Мне нужно создать пустой фрейм данных в R с указанными именами столбцов. Любой самый простой способ ? ...