sklearn-pandas- все статьи тега
Добавление столбцов pandas в разреженную матрицу
У меня есть дополнительные производные значения для переменных X, которые я хочу использовать в своей модели. XAll = pd_data[['title','wordcount','sumscores','length']] y = pd_data['sentiment'] X_train, X_test, y_train, y_test = train_test_split(XAll, y, random_state=1) Поскольку я работаю с текстовыми данными в заголовке, я сначала преобразую их в dtm отдельно: vect = CountVectorizer(max_df=0.5) vect.fit(X_train['title']) X_train_dtm = vect.transform(X_train['title']) column_index = X_tra ...