Набор данных супермаркета для априорного алгоритма



'я должен разработать программное обеспечение, предназначенное для бизнес-аналитика супермаркета "Future Stores", программное обеспечение выполняет майнинг правил Ассоциации по заданным переходным данным сделок продажи супермаркетов и готовит политику дисконтирования, подготавливая комбо.
Программное обеспечение использует алгоритмы интеллектуального анализа данных, а именно алгоритм априори. Правила Ассоциации будут отображаться в удобной для пользователя форме для генерации дисконтирования
политика, основанная на позитивной ассоциации правила.'



Откуда я могу получить набор данных супермаркета для проверки алгоритма априори, который я закодировал?

449   2  

2 ответов:

Чтобы получить набор данных рынка, вы можете перейти сюда : fimi.ua.ac.be/data/ и загрузите набор данныхretail .

Это анонимные наборы данных транзакций из бельгийского магазина.

Он идеально подходит для тестирования Apriori или других частых алгоритмов интеллектуального анализа наборов элементов и ассоциативных правил.

Вместо того чтобы искать набор данных реального мира, вы должны разработать небольшой конкретный набор данных для каждого модульного теста. Набор данных должен обеспечивать минимально необходимое предварительное условие для проверки одного объекта системы. Это позволит легче обнаруживать ошибки, поддерживать тесты в течение долгого времени и демонстрировать возможности и модели использования системы другим разработчикам.

Примером из другого домена могут служить тесты для пользовательской подсистемы, создающей и проверяющей логины для вебсайт.

  • addsNewUser - пустой набор данных
  • throwsExceptionForDuplicateUsername - однопользовательский набор данных
  • correctPasswordPasses - тот же набор данных
  • throwsExceptionForIncorrectUsername - тот же набор данных
  • throwsExceptionForIncorrectPassword - тот же набор данных
  • throwsExceptionWhenNewUsernameExists - набор данных для двух пользователей

Обновление: Если вам нужен очень большой набор данных для выполнения интеграции или тестирования производительности, вам, вероятно, придется написать программу для генерации случайной коллекции покупок. Я сомневаюсь, что какие-либо существующие супермаркеты готовы (или способны) расстаться с их реальными наборами данных.

Тем не менее, когда я работал подрядчиком у поставщика медицинского страхования много лет назад (до HIPAA), мне дали образец набора данных для работы. Он содержал реальную информацию о пациенте, включая SSNs и конфиденциальную историю болезни. : (

Comments

    Ничего не найдено.