dataframe- все статьи тега ➜ страница 3
Вызовите функцию apply-like для каждой строки фрейма данных с несколькими аргументами из каждой строки
у меня есть фрейм данных с несколькими столбцами. Для каждой строки в фрейме данных я хочу вызвать функцию в строке, и вход функции использует несколько столбцов из этой строки. Например, допустим, у меня есть эти данные и этот testFunc, который принимает два аргумента: > df <- data.frame(x=c(1,2), y=c(3,4), z=c(5,6)) > df x y z 1 1 3 5 2 2 4 6 > testFunc <- function(a, b) a + b допустим, я хочу применить этот testFunc к столбцам x и z. Итак, для строки 1 я хочу 1+5, а для ...
Фильтрация данных.строки фрейма по логическому условию
Я хочу, чтобы отфильтровать строки data.frame на основе логического условия. Предположим, что у меня есть фрейм данных, как expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.1569 ...
Агрегировать / суммировать несколько переменных в группе (например, sum, mean)
из фрейма данных, есть ли простой способ агрегировать (sum,mean,max et c) несколько переменных одновременно? ниже приведены некоторые примеры данных: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = data.frame(date, year, month, x1, x2) Я хотел бы одновременно агрегировать x1 и x2 переменные df2 фрейм данных по годам и месяцам. Следующий код ...
Переименовать один заголовок столбца в панды фрейма данных
у меня есть фрейм данных под названием data. Как бы я переименовал только один заголовок столбца? Например gdp до log(gdp)? data = y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 6 7 7 5 4 8 3 6 8 2 8 7 9 9 10 8 6 6 4 9 10 10 7 ...
панды: как разделить текст в столбце на несколько строк?
Я работаю с большим csv-файлом, и в предпоследнем столбце есть строка текста, которую я хочу разделить определенным разделителем. Мне было интересно, есть ли простой способ сделать это с помощью панд или питона? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 Я хочу разделить на пробел(' ') а потом двоеточие(':') ...
Как разделить столбец на два столбца?
у меня есть фрейм данных с одним столбцом, и я хотел бы разделить его на два столбца, с одним заголовком столбца как'fips' и другие 'row' мой фрейм данных df выглядит так: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL Я не знаю, как использовать df.row.str[:] для достижения моей цели разделения ячейки строки. Я могу использовать df['fips'] = hello, чтобы добавить новый столбец и заполнить ег ...
Python pandas dataframe: получение количества столбцов
как программно получить количество столбцов в кадре данных pandas? Я надеялся на что-то вроде: df.num_columns ...
Разделить (взорвать) запись строки фрейма данных pandas на отдельные строки
у меня есть pandas dataframe в котором один столбец текстовых строк содержит значения, разделенные запятыми. Я хочу разделить каждое поле CSV и создать новую строку для каждой записи (предположим, что CSV чист и должен быть разделен только на','). Например, a должны стать b: In [7]: a Out[7]: var1 var2 0 a,b,c 1 1 d,e,f 2 In [8]: b Out[8]: var1 var2 0 a 1 1 b 1 2 c 1 3 d 2 4 e 2 5 f 2 до сих пор я пробовал различные простые функци ...
Как отобразить панд DataFrame поплавков с помощью строки формата для столбцов?
Я хотел бы отобразить панд dataframe с заданным форматом с помощью print() и IPython display(). Например: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Я хотел бы как-то принудить это к печати cost foo 3.46 bar 4.57 baz 5.68 quux 6.79 без необходимости изменять сами данные или создавать копи ...
Как добавить строки в таблице данных R
Я посмотрел вокруг StackOverflow, но я не могу найти решение, специфичное для моей проблемы, которая включает в себя добавление строк в кадр данных R. Я инициализирую пустой 2-столбцовый фрейм данных, как показано ниже. df = data.frame(x = numeric(), y = character()) затем моя цель состоит в том, чтобы перебирать список значений и в каждой итерации добавлять значение в конец списка. Я начал со следующего кода. for (i in 1:10) { df$x = rbind(df$x, i) df$y = rbind(df$y, toString(i)) } ...
Превратите панд мульти-индекс в столбец
у меня есть фрейм данных с 2 уровнями индекса: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 который я хочу превратить в это: Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 ...
Удалить столбцы из фрейма данных, где все значения NA
У меня возникли проблемы с фрейм данных, и я не мог решить эту проблему сам: Элемент dataframe имеет произвольную свойства в виде столбцов и каждую строку - один набор данных. Вопрос в том: Как это избавиться от Столбцов, где к все строки значение NA? ...
Как получить первый столбец фрейма данных pandas в виде серии?
пробовал: x=pandas.DataFrame(...) s = x.take([0], axis=1) и s получает фрейм данных, а не ряд. ...
Разделить столбец на разделитель в фрейме данных [дубликат]
этот вопрос уже есть ответ здесь: разделить столбец строки фрейма данных на несколько столбцов 15 ответов Я хотел бы разделить один столбец на два в пределах фрейма данных на основе разделителя. Например, a|b b|c стать a b b c в рамках данных рамка. спасибо! ...
Как объединить два фрейма данных на основе двух столбцов?
Я знаю, что могу использовать plyr и его друзья, чтобы объединить фреймы данных, и merge также, но до сих пор я не знаю, как объединить два фрейма данных с несколькими столбцами на основе 2 столбцов? ...
Как напечатать (на бумаге) хорошо отформатированный фрейм данных
Я хотел бы печатать красиво отформатированные фреймы данных на бумаге, в идеале из сценария. (Я пытаюсь собирать данные с помощью инструмента и автоматически обрабатывать и печатать их с помощью сценария R). прямо сейчас я могу написать фрейм данных в текстовый файл с помощью write.table(), но это имеет две проблемы: полученный текстовый файл плохо отформатирована (столбцы не обязательно совпадают с их заголовками) и Я не знаю как печатать текст файл в р. Я ищу больше для общих стратегий, ч ...
Какие правила используют панды для создания представления и копии?
Я запутался в правилах, которые панды используют при принятии решения о том, что выбор из фрейма данных является копией исходного фрейма данных или представлением на оригинале. если у меня, например, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я понимаю, что a query возвращает копию так, что-то вроде foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 не повлияет на исходный фрейм данных,df. Я также понимаю, что скалярные или именованные срез ...
Добавить недостающие даты для панды фрейма данных
мои данные могут иметь несколько событий на заданную дату или никаких событий на дату. Я беру эти события, подсчитываю по дате и строю их. Однако, когда я строю их, мои две серии не всегда совпадают. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() В приведенном выше коде idx становится диапазон скажем 30 дат. 09-01-2013 в 09-30-2013 Однако S может быть только 25 или 26 дней, потому что нет событий на указанную дату. Затем я получ ...
Как добавить постоянный столбец в таблице данных СПАРК?
Я хочу добавить столбец в DataFrame С некоторым произвольным значением (то же самое для каждой строки). Я получаю сообщение об ошибке, когда я использую withColumn следующим образом: dt.withColumn('new_column', 10).head(5) --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-50-a6d0257ca2be> in <module>() 1 dt = (messages 2 .select(messages.fromuserid, m ...
панды уникальные значения несколько столбцов
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) что является лучшим способом, чтобы вернуть уникальные значения из столбца col1' и 'столбец col2'? требуется 'Bob', 'Joe', 'Bill', 'Mary', 'Steve' ...