text-classification- все статьи тега
как я могу выполнить задачу классификации текста, используя меньше памяти
(1) Моя цель: Я пытаюсь использовать SVM для классификации 10000 документов (каждый из которых содержит 400 слов) в 10 классов(равномерно распределенных). Особенности, изученные в моей работе, включают слово n-грамм(n=1~4),символ n-грамм (n=1~6). (2) Мой подход: я представляю каждый документ, используя векторы значений частоты для каждого элемента в документе. И использование TF-IDF для формализации векторов. ниже приведены части моего кода: def commonVec(dicts,count1,count2): ''' put ...