group-by- все статьи тега
Python pandas groupby ключевая ошибка в пандах.коллекция Hashtable.PyObjectHashTable.получить товар
Я делаю то, что кажется простой группой в Пандах. Колонка-это колонка строк без НАН или странных строк. Тем не менее, я продолжаю получать ниже ошибку. Кто-нибудь знает, почему это может произойти? Я чувствую, что это может иметь какое-то отношение к моим данным, но, кажется, все в порядке... Я бегу by_user = df.groupby('User') И трассировка стека: by_user = df.groupby('User') File "c:Anacondalibsite-packagespandascoregeneric.py", line 2773, in groupby sort=sort, group_keys=group_keys ...
Сумма вдоль столбца панды, обусловленная значением Мультииндекса?
У меня есть следующий фрейм данных Pandas df: Value time Position 1493791210867023000 0.0 21156.0 1.0 1230225.0 2.0 1628088.0 3.0 2582359.0 4.0 3388164.0 1493791210880251000 0.0 21156.0 1.0 1230225.0 2.0 1628088.0 3.0 258235 ...
Вам итого, итого и Итого отчет на PHP от данных MySQL
Мне нужно выяснить: 1) Сколько всего записей сделал конкретный пользователь на дату 2) Сколько всего записей было сделано на определенную дату. Я могу выполнить этот запрос: SELECT app_user,DATE(app_doe),COUNT(*) AS entries,`institution`,`qualification` FROM `details` WHERE MONTH(app_doe)="12" AND YEAR(app_doe)="2017" GROUP BY app_user,DATE(app_doe),`institution`,`qualification` ORDER BY DATE(app_doe) DESC,app_user И получить следующий вывод из таблицы mysql. Мне нужно организовать да ...
R pandas groupby индекс первой строки в каждой группе
Как получить индекс первой строки в каждой группе по группам? (я знаю .метод groupBy.first () возвращает первую строку в каждой группе, но я не знаю, как получить их индекс) Большое спасибо! ...
min () операция над вложенными groupby в pandas
Я просто знакомлюсь с пандами и не могу преодолеть концептуальную проблему. Мой фрейм данных выглядит следующим образом: df=pd.DataFrame({'ANIMAL':[1,1,1,1,1,2,2,2], 'AGE_D' : [3,6,47,377,698,1,9,241], 'AGE_Y' : [1,1,1,2,2,1,1,1]}) Я хотел бы сделать вложенную группу внутри animal и age_y, а затем выбрать min в подгруппе. Желаемый результат будет тогда: ANIMAL AGE_Y AGE_D 1 1 3 1 2 377 2 1 1 Я могу сделать это без вложенности ...
Выберите первую строку в каждой группе по группам?
как следует из названия, я хотел бы выбрать первую строку каждого набора строк, сгруппированных с GROUP BY. в частности, если у меня есть purchases таблица, которая выглядит так: SELECT * FROM purchases; Мой Вывод: id | customer | total ---+----------+------ 1 | Joe | 5 2 | Sally | 3 3 | Joe | 2 4 | Sally | 1 Я хотел бы запросить id самой крупной покупки (total) каждого customer. Что-то вроде этого: SELECT FIRST(id), customer, FIRST(total) FROM purchases GROUP BY cu ...
Группировка По Нескольким Столбцам
Как я могу сделать GroupBy несколько столбцов в LINQ что-то похожее на это в SQL: SELECT * FROM <TableName> GROUP BY <Column1>,<Column2> Как я могу преобразовать это в LINQ: QuantityBreakdown ( MaterialID int, ProductID int, Quantity float ) INSERT INTO @QuantityBreakdown (MaterialID, ProductID, Quantity) SELECT MaterialID, ProductID, SUM(Quantity) FROM @Transactions GROUP BY MaterialID, ProductID ...
Получение последней записи в каждой группе-MySQL
есть таблица messages, который содержит данные, как показано ниже: Id Name Other_Columns ------------------------- 1 A A_data_1 2 A A_data_2 3 A A_data_3 4 B B_data_1 5 B B_data_2 6 C C_data_1 если я запускаю запрос select * from messages group by name, я получу результат в виде: 1 A A_data_1 4 B B_data_1 6 C C_data_1 какой запрос вернет следующий результат? 3 A A_data_3 5 B B_data_2 6 ...
Преобразование панды метода groupBy объекта в таблице данных
Я начинаю с входных данных, как это df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) который при печати выглядит следующим образом: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory группировка достаточно прост: g1 = df1.groupby( [ "Name", "City"] ).count() и ...
Каков наиболее эффективный метод группирования по массиву объектов JavaScript?
каков наиболее эффективный способ группировки объектов в массиве? например, учитывая этот массив объектов: [ { Phase: "Phase 1", Step: "Step 1", Task: "Task 1", Value: "5" }, { Phase: "Phase 1", Step: "Step 1", Task: "Task 2", Value: "10" }, { Phase: "Phase 1", Step: "Step 2", Task: "Task 1", Value: "15" }, { Phase: "Phase 1", Step: "Step 2", Task: "Task 2", Value: "20" }, { Phase: "Phase 2", Step: "Step 1", Task: "Task 1", Value: "25" }, { Phase: "Phase 2", Step: "Ste ...
Что быстрее, выберите DISTINCT или GROUP BY в MySQL?
если у меня есть таблица CREATE TABLE users ( id int(10) unsigned NOT NULL auto_increment, name varchar(255) NOT NULL, profession varchar(255) NOT NULL, employer varchar(255) NOT NULL, PRIMARY KEY (id) ) и я хочу получить все уникальные значения profession поле, что было бы быстрее (или рекомендуется): SELECT DISTINCT u.profession FROM users u или SELECT u.profession FROM users u GROUP BY u.profession ? ...
Как подсчитать количество строк в группе (и другие статистические данные) в pandas group by?
у меня есть фрейм данных df и я использую несколько столбцов из его groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() таким образом, я почти получаю таблицу (фрейм данных), что мне нужно. Отсутствует дополнительный столбец, содержащий количество строк в каждой группе. Другими словами, Я имею в виду, но я также хотел бы знать, сколько число было использовано для получения этих средств. Например, в первой группе есть 8 значений, а во второй 10 и так далее. ...
Как повернуть фрейм данных
что такое pivot? как мне повернуть? этот стержень? длинный формат в широкий формат? я видел много вопросов о сводных таблицах. Даже если они не знают, что они спрашивают о сводных таблицах, они обычно это делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все аспекты поворота.... ... Но я собираюсь дать ему идти. проблема с существующими вопросами и ответами заключается в том, что часто вопрос фокусируется на нюансе, который ОП имеет проблемы с обобщен ...
SQL - использование псевдонима в группе по
просто любопытно о синтаксисе SQL. Так что если у меня есть SELECT itemName as ItemName, substring(itemName, 1,1) as FirstLetter, Count(itemName) FROM table1 GROUP BY itemName, FirstLetter Это было бы неправильно, потому что GROUP BY itemName, FirstLetter очень надо GROUP BY itemName, substring(itemName, 1,1) но почему мы не можем просто использовать первый для удобства? ...
MySQL "Group By" и " Order By"
Я хочу иметь возможность выбрать кучу строк из таблицы электронных писем и сгруппировать их по отправителю. Мой запрос выглядит так: SELECT `timestamp`, `fromEmail`, `subject` FROM `incomingEmails` GROUP BY LOWER(`fromEmail`) ORDER BY `timestamp` DESC запрос почти работает так, как я хочу - он выбирает записи, сгруппированные по электронной почте. Проблема в том, что тема и метка времени не соответствуют самой последней записи для конкретного адреса электронной почты. например, он мо ...
панды groupby сортировка внутри групп
Я хочу сгруппировать свой фрейм данных по двум столбцам, а затем отсортировать агрегированные результаты внутри групп. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 market B 7 2 market C 8 4 market D 9 1 market E In [168]: df.groupby(['job','source']).agg({'count':sum}) Out[168]: count job source market A 5 B 3 C 2 D ...
Угрозу безопасность компьютера и IGrouping
у меня были проблемы с артикуляцией, различия между ILookup<TKey, TVal> и IGrouping<TKey, TVal>, и мне любопытно, правильно ли я понимаю это сейчас. LINQ, которая усугубляет эту проблему путем создания последовательности IGrouping элементы, а также давая мне ToLookup метод расширения. Поэтому мне казалось, что они были одинаковыми, пока я не присмотрелся повнимательнее. var q1 = from n in N group n by n.MyKey into g select g; // q1 is IEnumerable<IGrouping<TKey, ...
Группировка по месяцам и годам в MySQL
учитывая таблицу с меткой времени в каждой строке, как бы вы отформатировали запрос, чтобы вписаться в этот конкретный формат объекта json. Я пытаюсь организовать объект json в годы / месяцы. json, чтобы основать запрос: { "2009":["August","July","September"], "2010":["January", "February", "October"] } вот запрос, который у меня есть до сих пор - SELECT MONTHNAME(t.summaryDateTime) as month, YEAR(t.summaryDateTime) as year FROM trading_summary t GROUP BY MONTH(t.summaryDateTi ...
Подсчет уникальных значений с панд на группы [дубликат]
этот вопрос уже есть ответ здесь: количество панд (различных) эквивалент 3 ответы мне нужно посчитать уникальные ID значения в каждом domain У меня есть ID, domain 123, 'vk.com' 123, 'vk.com' 123, 'twitter.com' 456, 'vk.com' 456, 'facebook.com' 456, 'vk.com' 456, 'google.com' 789, 'twitter.com' 789, 'vk.com' пробовал df.groupby(['domain', 'ID']).count() Но я хочу получить domain, count vk.com 3 tw ...
Имеет ли значение порядок столбцов в предложении group by?
Если у меня есть два столбца, один с очень высокой мощностью и один с очень низкой мощностью (уникальный # значений), имеет ли значение, в каком порядке я группируюсь? вот пример: select dimensionName, dimensionCategory, sum(someFact) from SomeFact f join SomeDim d on f.dimensionKey = d.dimensionKey group by d.dimensionName, -- large number of unique values d.dimensionCategory -- small number of unique values есть ли ситуации, когда это имеет значение? ...