dataframe- все статьи тега ➜ страница 3


Вызовите функцию apply-like для каждой строки фрейма данных с несколькими аргументами из каждой строки

у меня есть фрейм данных с несколькими столбцами. Для каждой строки в фрейме данных я хочу вызвать функцию в строке, и вход функции использует несколько столбцов из этой строки. Например, допустим, у меня есть эти данные и этот testFunc, который принимает два аргумента: > df <- data.frame(x=c(1,2), y=c(3,4), z=c(5,6)) > df x y z 1 1 3 5 2 2 4 6 > testFunc <- function(a, b) a + b допустим, я хочу применить этот testFunc к столбцам x и z. Итак, для строки 1 я хочу 1+5, а для ...

Фильтрация данных.строки фрейма по логическому условию

Я хочу, чтобы отфильтровать строки data.frame на основе логического условия. Предположим, что у меня есть фрейм данных, как expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.1569 ...

Агрегировать / суммировать несколько переменных в группе (например, sum, mean)

из фрейма данных, есть ли простой способ агрегировать (sum,mean,max et c) несколько переменных одновременно? ниже приведены некоторые примеры данных: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = data.frame(date, year, month, x1, x2) Я хотел бы одновременно агрегировать x1 и x2 переменные df2 фрейм данных по годам и месяцам. Следующий код ...

Переименовать один заголовок столбца в панды фрейма данных

у меня есть фрейм данных под названием data. Как бы я переименовал только один заголовок столбца? Например gdp до log(gdp)? data = y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4 7 4 6 7 7 5 4 8 3 6 8 2 8 7 9 9 10 8 6 6 4 9 10 10 7 ...

панды: как разделить текст в столбце на несколько строк?

Я работаю с большим csv-файлом, и в предпоследнем столбце есть строка текста, которую я хочу разделить определенным разделителем. Мне было интересно, есть ли простой способ сделать это с помощью панд или питона? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 Я хочу разделить на пробел(' ') а потом двоеточие(':') ...

Как разделить столбец на два столбца?

у меня есть фрейм данных с одним столбцом, и я хотел бы разделить его на два столбца, с одним заголовком столбца как'fips' и другие 'row' мой фрейм данных df выглядит так: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL Я не знаю, как использовать df.row.str[:] для достижения моей цели разделения ячейки строки. Я могу использовать df['fips'] = hello, чтобы добавить новый столбец и заполнить ег ...

Python pandas dataframe: получение количества столбцов

как программно получить количество столбцов в кадре данных pandas? Я надеялся на что-то вроде: df.num_columns ...

Разделить (взорвать) запись строки фрейма данных pandas на отдельные строки

у меня есть pandas dataframe в котором один столбец текстовых строк содержит значения, разделенные запятыми. Я хочу разделить каждое поле CSV и создать новую строку для каждой записи (предположим, что CSV чист и должен быть разделен только на','). Например, a должны стать b: In [7]: a Out[7]: var1 var2 0 a,b,c 1 1 d,e,f 2 In [8]: b Out[8]: var1 var2 0 a 1 1 b 1 2 c 1 3 d 2 4 e 2 5 f 2 до сих пор я пробовал различные простые функци ...

Как отобразить панд DataFrame поплавков с помощью строки формата для столбцов?

Я хотел бы отобразить панд dataframe с заданным форматом с помощью print() и IPython display(). Например: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Я хотел бы как-то принудить это к печати cost foo 3.46 bar 4.57 baz 5.68 quux 6.79 без необходимости изменять сами данные или создавать копи ...

Как добавить строки в таблице данных R

Я посмотрел вокруг StackOverflow, но я не могу найти решение, специфичное для моей проблемы, которая включает в себя добавление строк в кадр данных R. Я инициализирую пустой 2-столбцовый фрейм данных, как показано ниже. df = data.frame(x = numeric(), y = character()) затем моя цель состоит в том, чтобы перебирать список значений и в каждой итерации добавлять значение в конец списка. Я начал со следующего кода. for (i in 1:10) { df$x = rbind(df$x, i) df$y = rbind(df$y, toString(i)) } ...

Превратите панд мульти-индекс в столбец

у меня есть фрейм данных с 2 уровнями индекса: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 который я хочу превратить в это: Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 ...

Удалить столбцы из фрейма данных, где все значения NA

У меня возникли проблемы с фрейм данных, и я не мог решить эту проблему сам: Элемент dataframe имеет произвольную свойства в виде столбцов и каждую строку - один набор данных. Вопрос в том: Как это избавиться от Столбцов, где к все строки значение NA? ...

Как получить первый столбец фрейма данных pandas в виде серии?

пробовал: x=pandas.DataFrame(...) s = x.take([0], axis=1) и s получает фрейм данных, а не ряд. ...

Разделить столбец на разделитель в фрейме данных [дубликат]

этот вопрос уже есть ответ здесь: разделить столбец строки фрейма данных на несколько столбцов 15 ответов Я хотел бы разделить один столбец на два в пределах фрейма данных на основе разделителя. Например, a|b b|c стать a b b c в рамках данных рамка. спасибо! ...

Как объединить два фрейма данных на основе двух столбцов?

Я знаю, что могу использовать plyr и его друзья, чтобы объединить фреймы данных, и merge также, но до сих пор я не знаю, как объединить два фрейма данных с несколькими столбцами на основе 2 столбцов? ...

Как напечатать (на бумаге) хорошо отформатированный фрейм данных

Я хотел бы печатать красиво отформатированные фреймы данных на бумаге, в идеале из сценария. (Я пытаюсь собирать данные с помощью инструмента и автоматически обрабатывать и печатать их с помощью сценария R). прямо сейчас я могу написать фрейм данных в текстовый файл с помощью write.table(), но это имеет две проблемы: полученный текстовый файл плохо отформатирована (столбцы не обязательно совпадают с их заголовками) и Я не знаю как печатать текст файл в р. Я ищу больше для общих стратегий, ч ...

Какие правила используют панды для создания представления и копии?

Я запутался в правилах, которые панды используют при принятии решения о том, что выбор из фрейма данных является копией исходного фрейма данных или представлением на оригинале. если у меня, например, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я понимаю, что a query возвращает копию так, что-то вроде foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 не повлияет на исходный фрейм данных,df. Я также понимаю, что скалярные или именованные срез ...

Добавить недостающие даты для панды фрейма данных

мои данные могут иметь несколько событий на заданную дату или никаких событий на дату. Я беру эти события, подсчитываю по дате и строю их. Однако, когда я строю их, мои две серии не всегда совпадают. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() В приведенном выше коде idx становится диапазон скажем 30 дат. 09-01-2013 в 09-30-2013 Однако S может быть только 25 или 26 дней, потому что нет событий на указанную дату. Затем я получ ...

Как добавить постоянный столбец в таблице данных СПАРК?

Я хочу добавить столбец в DataFrame С некоторым произвольным значением (то же самое для каждой строки). Я получаю сообщение об ошибке, когда я использую withColumn следующим образом: dt.withColumn('new_column', 10).head(5) --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-50-a6d0257ca2be> in <module>() 1 dt = (messages 2 .select(messages.fromuserid, m ...

панды уникальные значения несколько столбцов

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) что является лучшим способом, чтобы вернуть уникальные значения из столбца col1' и 'столбец col2'? требуется 'Bob', 'Joe', 'Bill', 'Mary', 'Steve' ...