pandas- все статьи тега ➜ страница 9

Как загрузить tsv-файл в фрейм данных Pandas?

Я новичок в python и панд. Я пытаюсь получить tsv файл загружен в панд DataFrame. Это то, что я пытаюсь и ошибка, которую я получаю: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='t')) File "C:Python27libsite-packagespandascoreframe.py", line 318, in __init__ raise PandasError ...

727

24 июля 2019 г.

python pandas csv

перетасовка / перестановка фрейма данных в панд

какой простой и эффективный способ перетасовать фрейм данных в панд, по строкам или по столбцам? Т. е. как написать функцию shuffle(df, n, axis=0) это занимает фрейм данных, ряд перетасовок n, и ось (axis=0 это строки axis=1 is columns) и возвращает копию кадра данных, который был перетасован n раза. Edit: ключ должен сделать это, не разрушая метки строк / столбцов фрейма данных. Если вы просто перемешать df.index что теряет все, что информация. Я хочу, чтобы в результате df быть таким же, как ...

655

24 июля 2019 г.

python numpy pandas

Найти целочисленный индекс строк с NaN в фрейме данных pandas

У меня есть панда DataFrame, как это: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 есть ли эффективный способ найти "целочисл ...

669

24 июля 2019 г.

python pandas

Панды читать CSV-файл из URL

Я использую Python 3.4 с IPython и имею следующий код. Я не могу прочитать csv-файл из данного URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) У меня есть следующие ошибки "ожидаемый путь к файлу или файлоподобный объект, получил тип" Как я могу это исправить? ...

982

24 июля 2019 г.

python pandas csv request

Как группировать записи фрейма данных pandas по дате в не уникальном столбце

В Пандах DataFrame содержит столбец с именем "date", который содержит неуникальные datetime значения. Я могу сгруппировать строки в этом кадре с помощью: data.groupby(data['date']) однако это разбивает данные на datetime значения. Я хотел бы сгруппировать эти данные по годам, хранящимся в столбце" дата". на этой странице показывает, как группировать по годам в случаях, когда метка времени используется в качестве индекса, что не верно в моем случае. как мне достичь этой группировки? ...

1787

24 июля 2019 г.

python pandas

Каков наиболее эффективный способ создания словаря двух столбцов фрейма данных pandas?

каков наиболее эффективный способ организации следующих панд Dataframe: data = Position Letter 1 a 2 b 3 c 4 d 5 e в словарь как alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']? ...

615

24 июля 2019 г.

python dictionary pandas dataframe

Панды питона: несколько агрегаций одного столбца

учитывая следующий (полностью избыточный) пример фрейма данных df = pandas.DataFrame({ "date":[datetime.date(2012,x,1) for x in range(1,11)], "returns":0.05*np.random.randn(10), "dummy":np.repeat(1,10) }) существует ли встроенный способ применить две разные агрегирующие функции к одному столбцу, не вызывая agg несколько раз? синтаксически неправильно, но интуитивно правильно, способ сделать это буд ...

608

24 июля 2019 г.

python pandas aggregate

Сохранить список фреймов данных в многолистовой электронной таблице Excel

как я могу экспортировать список фреймов данных в одну электронную таблицу Excel? Документы для to_excel состояние: Примечания Если передать существующий объект ExcelWriter, то лист будет добавлен к существующей книге. Это может быть использовано для сохранения различных Фреймы данных для одной книги writer = ExcelWriter('output.xlsx')df1.to_excel(writer, 'sheet1')df2.to_excel(writer, 'sheet2')writer.save() после этого я подумал, что могу написать функция, которая сохраняет спи ...

596

24 июля 2019 г.

python pandas openpyxl

Панда DataFrame в список списков

легко превратить список списков в панд фрейм данных: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) но как мне превратить df обратно в список списков? lol = df.what_to_do_now? print lol # [[1,2,3],[3,4,5]] ...

508

24 июля 2019 г.

python pandas

Объединение двух фреймов данных по индексу

Привет у меня есть следующие таблицы данных: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B как мне объединить индексы, чтобы получить: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 421 18 false 0.0 1 B Я спрашиваю, пот ...

942

24 июля 2019 г.

python merge pandas dataframe concat

Панды: прокатное среднее по временному интервалу

Я новичок в панд.... У меня есть куча данных опроса; я хочу вычислить скользящее среднее, чтобы получить оценку для каждого дня на основе трехдневного окна. Как я понимаю из этого вопроса, функции rolling_* вычисляют окно на основе заданного числа значений, а не определенного диапазона datetime. есть другая функция, которая реализует эту функцию? Или я застрял писать свой собственный? EDIT: пример входных данных: polls_subset.tail(20) Out[185]: favorable unfavorable other ...

615

24 июля 2019 г.

python pandas time-series

как фильтровать фреймы данных pandas по нескольким столбцам

чтобы отфильтровать фрейм данных (df) по одному столбцу, если мы рассмотрим данные с мужчинами и женщинами, мы можем: males = df[df[Gender]=='Male'] Вопрос 1-но что, если данные охватывали несколько лет, и я хотел видеть только мужчин за 2014 год? на других языках я мог бы сделать что-то вроде: if A = "Male" and if B = "2014" then (за исключением того, что я хочу сделать это и получить подмножество исходного фрейма данных в новом объекте dataframe) Вопрос 2. Как мне сделать это в цикле ...

873

24 июля 2019 г.

python pandas filter

Pandas в html () усекает содержимое строки

у меня есть панды питона DataFrame объект, содержащий текстовые данные. Моя проблема в том, что когда я использую to_html() функция, она усекает строки в выводе. например: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print (df.to_html()) выход усекается на adapis... <table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>text</th> ...

524

24 июля 2019 г.

python html pandas

Удаление нескольких столбцов на основе имен столбцов в Pandas

у меня есть некоторые данные, и когда я импортирую его, я получаю следующие ненужные столбцы, которые я ищу простой способ удалить все эти 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', 'Unnamed: 38', 'Unnamed: 39', 'Unnamed: 40', 'Unnamed: 41', 'Unnamed: 42', 'Unnamed: 43', 'Unnamed: 44', 'Unnamed: 45', 'Unnamed: 46 ...

523

24 июля 2019 г.

python pandas

Замена панд или Numpy Nan на None для использования с MysqlDB

Я пытаюсь написать фрейм данных Pandas (или могу использовать массив numpy) в базу данных mysql с помощью MysqlDB . MysqlDB, похоже, не понимает "nan", и моя база данных выдает ошибку, говоря, что nan нет в списке полей. Мне нужно найти способ преобразовать ' nan ' в NoneType. какие идеи? ...

812

24 июля 2019 г.

numpy pandas mysql-python

Правильный способ обратить панды вспять.Фрейм данных?

вот мой код: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) когда я запускаю этот код, я получаю следующую ошибку: Traceback (most recent call last): File "C:Python33libsite-packagespandascoregeneric.py", line 665, in _get_item_cache return cache[item] KeyError: 5 During handling of the above exception, another exception occurred: Traceback (most recent call last): File "C: ...

681

24 июля 2019 г.

python pandas reverse