lstm- все статьи тега ➜ страница 0


Понимание простой LSTM pytorch

import torch,ipdb import torch.autograd as autograd import torch.nn as nn import torch.nn.functional as F import torch.optim as optim from torch.autograd import Variable rnn = nn.LSTM(input_size=10, hidden_size=20, num_layers=2) input = Variable(torch.randn(5, 3, 10)) h0 = Variable(torch.randn(2, 3, 20)) c0 = Variable(torch.randn(2, 3, 20)) output, hn = rnn(input, (h0, c0)) Это пример LSTM из docs. Я не знаю, понимаю следующие вещи: Что такое выходной размер и почему он нигде не указан? По ...

Сиамская сеть с LSTM для сходства предложений в Керасе дает периодически один и тот же результат

Я новичок в Керасе и пытаюсь решить задачу сходства предложений, используя NN в Керасе. Я использую word2vec в качестве встраивания слов, а затем сиамскую сеть, чтобы предсказать, насколько похожи два предложения. Базовая сеть для сиамской сети - это LSTM,и для объединения двух базовых сетей я использую лямбда-слой с косинусной метрикой similairty. В качестве набора данных я использую SICK dataset, который дает оценку каждой паре предложений, от 1(разные) до 5(очень похожие). Я создал сеть и т ...

Понимание Keras LSTMs

Я пытаюсь примирить мое понимание LSTMs и указал здесь в этот пост Кристофер Ола выполнены в водоснабжении. Я следую за блог написанный Джейсоном Браунли для учебника Keras. То, что меня в основном смущает, изменение формы ряда данных в [samples, time steps, features] и статусные LSTMs давайте сосредоточимся на двух вышеупомянутых вопросах со ссылкой на код вставлено ниже: # reshape into X=t and Y=t+1 look_back = 3 trainX, trainY = create_dataset(train, look_back) testX, testY = create_data ...