pandas- все статьи тега ➜ страница 9


Как загрузить tsv-файл в фрейм данных Pandas?

Я новичок в python и панд. Я пытаюсь получить tsv файл загружен в панд DataFrame. Это то, что я пытаюсь и ошибка, которую я получаю: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='t')) File "C:Python27libsite-packagespandascoreframe.py", line 318, in __init__ raise PandasError ...

перетасовка / перестановка фрейма данных в панд

какой простой и эффективный способ перетасовать фрейм данных в панд, по строкам или по столбцам? Т. е. как написать функцию shuffle(df, n, axis=0) это занимает фрейм данных, ряд перетасовок n, и ось (axis=0 это строки axis=1 is columns) и возвращает копию кадра данных, который был перетасован n раза. Edit: ключ должен сделать это, не разрушая метки строк / столбцов фрейма данных. Если вы просто перемешать df.index что теряет все, что информация. Я хочу, чтобы в результате df быть таким же, как ...

Найти целочисленный индекс строк с NaN в фрейме данных pandas

У меня есть панда DataFrame, как это: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 есть ли эффективный способ найти "целочисл ...

Панды читать CSV-файл из URL

Я использую Python 3.4 с IPython и имею следующий код. Я не могу прочитать csv-файл из данного URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) У меня есть следующие ошибки "ожидаемый путь к файлу или файлоподобный объект, получил тип" Как я могу это исправить? ...

Как группировать записи фрейма данных pandas по дате в не уникальном столбце

В Пандах DataFrame содержит столбец с именем "date", который содержит неуникальные datetime значения. Я могу сгруппировать строки в этом кадре с помощью: data.groupby(data['date']) однако это разбивает данные на datetime значения. Я хотел бы сгруппировать эти данные по годам, хранящимся в столбце" дата". на этой странице показывает, как группировать по годам в случаях, когда метка времени используется в качестве индекса, что не верно в моем случае. как мне достичь этой группировки? ...

Каков наиболее эффективный способ создания словаря двух столбцов фрейма данных pandas?

каков наиболее эффективный способ организации следующих панд Dataframe: data = Position Letter 1 a 2 b 3 c 4 d 5 e в словарь как alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']? ...

Панды питона: несколько агрегаций одного столбца

учитывая следующий (полностью избыточный) пример фрейма данных df = pandas.DataFrame({ "date":[datetime.date(2012,x,1) for x in range(1,11)], "returns":0.05*np.random.randn(10), "dummy":np.repeat(1,10) }) существует ли встроенный способ применить две разные агрегирующие функции к одному столбцу, не вызывая agg несколько раз? синтаксически неправильно, но интуитивно правильно, способ сделать это буд ...

Сохранить список фреймов данных в многолистовой электронной таблице Excel

как я могу экспортировать список фреймов данных в одну электронную таблицу Excel? Документы для to_excel состояние: Примечания Если передать существующий объект ExcelWriter, то лист будет добавлен к существующей книге. Это может быть использовано для сохранения различных Фреймы данных для одной книги writer = ExcelWriter('output.xlsx')df1.to_excel(writer, 'sheet1')df2.to_excel(writer, 'sheet2')writer.save() после этого я подумал, что могу написать функция, которая сохраняет спи ...

Панда DataFrame в список списков

легко превратить список списков в панд фрейм данных: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) но как мне превратить df обратно в список списков? lol = df.what_to_do_now? print lol # [[1,2,3],[3,4,5]] ...

Объединение двух фреймов данных по индексу

Привет у меня есть следующие таблицы данных: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B как мне объединить индексы, чтобы получить: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 421 18 false 0.0 1 B Я спрашиваю, пот ...

Панды: прокатное среднее по временному интервалу

Я новичок в панд.... У меня есть куча данных опроса; я хочу вычислить скользящее среднее, чтобы получить оценку для каждого дня на основе трехдневного окна. Как я понимаю из этого вопроса, функции rolling_* вычисляют окно на основе заданного числа значений, а не определенного диапазона datetime. есть другая функция, которая реализует эту функцию? Или я застрял писать свой собственный? EDIT: пример входных данных: polls_subset.tail(20) Out[185]: favorable unfavorable other ...

как фильтровать фреймы данных pandas по нескольким столбцам

чтобы отфильтровать фрейм данных (df) по одному столбцу, если мы рассмотрим данные с мужчинами и женщинами, мы можем: males = df[df[Gender]=='Male'] Вопрос 1-но что, если данные охватывали несколько лет, и я хотел видеть только мужчин за 2014 год? на других языках я мог бы сделать что-то вроде: if A = "Male" and if B = "2014" then (за исключением того, что я хочу сделать это и получить подмножество исходного фрейма данных в новом объекте dataframe) Вопрос 2. Как мне сделать это в цикле ...

Pandas в html () усекает содержимое строки

у меня есть панды питона DataFrame объект, содержащий текстовые данные. Моя проблема в том, что когда я использую to_html() функция, она усекает строки в выводе. например: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print (df.to_html()) выход усекается на adapis... <table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>text</th> ...

Удаление нескольких столбцов на основе имен столбцов в Pandas

у меня есть некоторые данные, и когда я импортирую его, я получаю следующие ненужные столбцы, которые я ищу простой способ удалить все эти 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', 'Unnamed: 38', 'Unnamed: 39', 'Unnamed: 40', 'Unnamed: 41', 'Unnamed: 42', 'Unnamed: 43', 'Unnamed: 44', 'Unnamed: 45', 'Unnamed: 46 ...

Замена панд или Numpy Nan на None для использования с MysqlDB

Я пытаюсь написать фрейм данных Pandas (или могу использовать массив numpy) в базу данных mysql с помощью MysqlDB . MysqlDB, похоже, не понимает "nan", и моя база данных выдает ошибку, говоря, что nan нет в списке полей. Мне нужно найти способ преобразовать ' nan ' в NoneType. какие идеи? ...

Правильный способ обратить панды вспять.Фрейм данных?

вот мой код: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) когда я запускаю этот код, я получаю следующую ошибку: Traceback (most recent call last): File "C:Python33libsite-packagespandascoregeneric.py", line 665, in _get_item_cache return cache[item] KeyError: 5 During handling of the above exception, another exception occurred: Traceback (most recent call last): File "C: ...