dataframe- все статьи тега ➜ страница 4


создание диаграмм рассеяния matplotlib из фреймов данных в панд Python

каков наилучший способ сделать серию диаграмм рассеяния с помощью matplotlib С pandas фрейм данных в Python? например, если у меня есть фрейм данных df что имеет некоторые столбцы интереса, я нахожу себя обычно преобразования все в массивы: import matplotlib.pylab as plt # df is a DataFrame: fetch col1 and col2 # and drop na rows if any of the columns are NA mydata = df[["col1", "col2"]].dropna(how="any") # Now plot with matplotlib vals = mydata.values plt.scatter(vals[:, 0], vals[:, 1]) п ...

масштабирование столбцов фрейма данных pandas с помощью sklearn

у меня есть фрейм данных pandas со столбцами смешанного типа, и я хотел бы применить min_max_scaler sklearn к некоторым столбцам. В идеале, я хотел бы сделать эти преобразования, но не придумал, как это сделать. Я написал следующий код, который работает: import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','sm ...

Преобразование времени unix в читаемую дату в Pandas DataFrame

у меня есть фрейм данных с Unix и цены в нем. Я хочу преобразовать столбец индекса так, чтобы он отображался в удобочитаемых датах. Так, например, у меня есть" дата " как 1349633705 в столбце индекса, но я бы хотел, чтобы она отображалась как 10/07/2012 (или по крайней мере 10/07/2012 18:15). Для некоторого контекста вот код, с которым я работаю, и то, что я уже пробовал: import json import urllib2 from datetime import datetime response = urllib2.urlopen('http://blockchain.info/charts/market-pr ...

мутировать каждый / суммировать каждый в dplyr: как выбрать определенные столбцы и дать новые имена мутированным столбцам?

Я немного запутался в dplyr глагол mutate_each. это довольно просто использовать основные mutate чтобы преобразовать столбец данных в, скажем, z-оценки и создать новый столбец в ваших данных.кадр (здесь с именем z_score_data): newDF <- DF %>% select(one_column) %>% mutate(z_score_data = one_column - (mean(one_column) / sd(one_column)) однако, поскольку у меня есть много столбцов данных, которые я хотел бы преобразовать, похоже, мне следует использовать mutate_each глагол. newDF ...

R применить функцию() к определенным столбцам фрейма данных

Я хочу использовать функцию apply на фрейме данных, но только применить функцию к последним 5 столбцам. B<- by(wifi,(wifi$Room),FUN=function(y){apply(y, 2, A)}) это относится ко всем столбцам y B<- by(wifi,(wifi$Room),FUN=function(y){apply(y[4:9], 2, A)}) Это относится только к столбцам 4-9 из y, но общий возврат B удаляет первые 3 столбца... Я все еще хочу их, я просто не хочу применять к ним. wifi[,1:3]+B также не делать то, что я ожидал/хотел. ...

Как суммировать все значения столбца в данных.кадр?

у меня есть фрейм данных с несколькими столбцами; некоторые числовые и некоторые символы. Как вычислить сумму столбца? я погуглил для этого, и я вижу множество функций (sum,cumsum,rowsum,rowSums,colSums,aggregate,apply), но я не могу понять ее смысл. например, предположим, что у меня есть фрейм данных people со следующими столбцами Name Height Weight Mary 65 110 John 70 200 Jane 64 115 … как я могу получить сумму всех Весов? ...

Каков наиболее эффективный способ создания словаря двух столбцов фрейма данных pandas?

каков наиболее эффективный способ организации следующих панд Dataframe: data = Position Letter 1 a 2 b 3 c 4 d 5 e в словарь как alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']? ...

Объединение двух фреймов данных по индексу

Привет у меня есть следующие таблицы данных: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B как мне объединить индексы, чтобы получить: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 421 18 false 0.0 1 B Я спрашиваю, пот ...