cluster-analysis- все статьи тега
Как раскрасить метки дендрограммы в соответствии с определенными группами? (в R)
У меня есть числовая матрица в R с 24 строками и 10 000 столбцами. Имена строк этой матрицы в основном являются именами файлов, из которых я прочитал данные, соответствующие каждой из 24 строк. Кроме того, у меня есть отдельный список факторов с 24 целыми, указывающий группу, к которой принадлежат 24 файла. Существует 3 группы-спирты, углеводороды и сложные эфиры. Имена и соответствующая группа, к которой они принадлежат, выглядят следующим образом: > MS.mz [1] "int-354.19" "int-361.35" "in ...
Найти центроид в скоплении пикселей
Как вычислить центроид кластера, образованного пикселями? Я представляю пиксели по их красным, синим и зеленым значениям (например, pixel(116 133 55)). Центроид должен быть средним числом экземпляров в кластере , но как я могу вычислить среднее между пикселями? [я пытался вычислить среднее значение для каждого цвета (центроид ["красный"]=sum_red_pixel_values/количество пикселей и т. д.), Но это дает неправильные результаты] Если это помогает в любом случае, я использую евклидову функцию р ...
Кластеризация по дате (по расстоянию) в Ruby
У меня есть огромный журнал с действиями, выполняемыми пользователями (например, модерирование контента). Я хотел бы найти "массовые" действия, то есть действия, которые слишком плотны (пользователь, вероятно, сделал эти действия, не думая об этом слишком много :) ). Это привело бы к кластеризации действий по дате (в линейном пространстве) и к маркировке слишком плотных кластеров. Я не эксперт в алгоритмах и методах кластеризации, но я думаю, что K-означает кластеризацию это не поможет, так к ...
Как определить k при использовании кластеризации k-средних?
Я изучал о k-средних кластеризации, и одна вещь, которая не понятно как вы выбираете значение k. Это просто вопрос проб и ошибок, или есть больше? ...
Что такое интуитивное объяснение метода максимизации ожиданий? [закрытый]
максимизация ожиданий, если это своего рода вероятностный метод классификации данных. Пожалуйста, поправьте меня, если я ошибаюсь, если это не классификатор. Что такое интуитивное объяснение этой техники ЭМ? Что такое ожидание здесь и что максимизируется? ...