Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Python: Общие вопросы > Расширение числа признаков для предсказания


Автор: alexesuser 4.10.2023, 13:08
Код

stopwords = set(nltk_stopwords.words('russian'))
count_tf_idf_train = TfidfVectorizer(stop_words=list(stopwords))
tf_idf_train = count_tf_idf_train.fit_transform(lemm_str)

Создаю вектор, который хочу передать обученной модели, но модель возвращает ошибку :  X has 14 features, but LogisticRegression is expecting 1675 features as input.

Судя по сообщению, необходимо увеличить число признаков до максимума (т.е. добавить еще 1661 нулевое значение.)
 Пытался сделать так:
Код

zero = np.zeros(1661).reshape(1,1661)
zero.shape

np.concatenate([tf_idf_train, zero])


Но возвращает ошибку: ValueError: zero-dimensional arrays cannot be concatenated

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)