RecurrentJava - 经管之家

1关注
62粉丝

VIP

已卖：4901份资源

学术权威

14%

还不是VIP/贵宾

-

TA的文库 其他...

R资源总汇

Panel Data Analysis

Experimental Design

0%

威望: 1 级
论坛币: 49675 个
通用积分: 56.2487
学术水平: 370 点
热心指数: 273 点
信用等级: 335 点
经验: 57805 点
帖子: 4005
精华: 21
在线时间: 582 小时
注册时间: 2005-5-8
最后登录: 2023-11-26

楼主

ReneeBK 发表于 2016-9-3 08:18:39 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

RecurrentJava

RecurrentJava is a reimplementation of Andrej Karpathy's RecurrentJS, in Java.

It currently features:

Deep Recurrent Neural Networks
Long Short-Term Memory Networks
Gated Recurrent Unit Neural Networks
Backpropagation Through Time handled via Automatic Differentiation.

ExamplePaulGraham.java shows how to do character-by-character sentence prediction and generation.

Sample output:

========================================REPORT:calculating perplexity over entire data set...Median Perplexity = 1.4959Temperature 1.0 prediction: "there's a more kemmaces of meanness that hade? tagh o; mool" "it fart dect about twish i could see gve..."Temperature 0.75 prediction: "that's not absolutely note a lot of the startup? path they'll should owt" "i realize how crazy all thi..."Temperature 0.5 prediction: "the most stripiess to more here that happens never get them" "if you do that role kropate that's the w..."Temperature 0.25 prediction: "the person who needs something making the same spignf befart" "the startup founders who never about wh..."Temperature 0.1 prediction: "the startup founders who never about which in your expanding, it's a sign when idea way we don't the..."Argmax prediction: "the problem is not that most towns kill startups" "the problem is not that most towns kill startups" "th..."========================================License

MIT

本帖隐藏的内容

RecurrentJava-master.zip (11.5 MB)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Recurrent CURRENT curr Java jav prediction currently features Memory entire

相关帖子

沙发

ReneeBK 发表于 2016-9-3 08:20:35

package model;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import matrix.Matrix;
import autodiff.Graph;
public class FeedForwardLayer implements Model {
private static final long serialVersionUID = 1L;
Matrix W;
Matrix b;
Nonlinearity f;
public FeedForwardLayer(int inputDimension, int outputDimension, Nonlinearity f, double initParamsStdDev, Random rng) {
W = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
b = new Matrix(outputDimension);
this.f = f;
}
@Override
public Matrix forward(Matrix input, Graph g) throws Exception {
Matrix sum = g.add(g.mul(W, input), b);
Matrix out = g.nonlin(f, sum);
return out;
}
@Override
public void resetState() {
}
@Override
public List<Matrix> getParameters() {
List<Matrix> result = new ArrayList<>();
result.add(W);
result.add(b);
return result;
}
}

复制代码

藤椅

ReneeBK 发表于 2016-9-3 08:21:15

package model;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import matrix.Matrix;
import autodiff.Graph;
/*
* As described in:
* "Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation"
* http://arxiv.org/abs/1406.1078
*/
public class GruLayer implements Model {
private static final long serialVersionUID = 1L;
int inputDimension;
int outputDimension;
Matrix IHmix, HHmix, Bmix;
Matrix IHnew, HHnew, Bnew;
Matrix IHreset, HHreset, Breset;
Matrix context;
Nonlinearity fMix = new SigmoidUnit();
Nonlinearity fReset = new SigmoidUnit();
Nonlinearity fNew = new TanhUnit();
public GruLayer(int inputDimension, int outputDimension, double initParamsStdDev, Random rng) {
this.inputDimension = inputDimension;
this.outputDimension = outputDimension;
IHmix = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
HHmix = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
Bmix = new Matrix(outputDimension);
IHnew = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
HHnew = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
Bnew = new Matrix(outputDimension);
IHreset = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
HHreset = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
Breset= new Matrix(outputDimension);
}
@Override
public Matrix forward(Matrix input, Graph g) throws Exception {
Matrix sum0 = g.mul(IHmix, input);
Matrix sum1 = g.mul(HHmix, context);
Matrix actMix = g.nonlin(fMix, g.add(g.add(sum0, sum1), Bmix));
Matrix sum2 = g.mul(IHreset, input);
Matrix sum3 = g.mul(HHreset, context);
Matrix actReset = g.nonlin(fReset, g.add(g.add(sum2, sum3), Breset));
Matrix sum4 = g.mul(IHnew, input);
Matrix gatedContext = g.elmul(actReset, context);
Matrix sum5 = g.mul(HHnew, gatedContext);
Matrix actNewPlusGatedContext = g.nonlin(fNew, g.add(g.add(sum4, sum5), Bnew));
Matrix memvals = g.elmul(actMix, context);
Matrix newvals = g.elmul(g.oneMinus(actMix), actNewPlusGatedContext);
Matrix output = g.add(memvals, newvals);
//rollover activations for next iteration
context = output;
return output;
}
@Override
public void resetState() {
context = new Matrix(outputDimension);
}
@Override
public List<Matrix> getParameters() {
List<Matrix> result = new ArrayList<>();
result.add(IHmix);
result.add(HHmix);
result.add(Bmix);
result.add(IHnew);
result.add(HHnew);
result.add(Bnew);
result.add(IHreset);
result.add(HHreset);
result.add(Breset);
return result;
}
}

复制代码

板凳

ReneeBK 发表于 2016-9-3 08:21:57

package model;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import matrix.Matrix;
import autodiff.Graph;
public class LinearLayer implements Model {
private static final long serialVersionUID = 1L;
Matrix W;
//no biases
public LinearLayer(int inputDimension, int outputDimension, double initParamsStdDev, Random rng) {
W = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
}
@Override
public Matrix forward(Matrix input, Graph g) throws Exception {
Matrix out = g.mul(W, input);
return out;
}
@Override
public void resetState() {
}
@Override
public List<Matrix> getParameters() {
List<Matrix> result = new ArrayList<>();
result.add(W);
return result;
}
}

复制代码

报纸

ReneeBK 发表于 2016-9-3 08:23:22

package model;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import matrix.Matrix;
import autodiff.Graph;
public class LstmLayer implements Model {
private static final long serialVersionUID = 1L;
int inputDimension;
int outputDimension;
Matrix Wix, Wih, bi;
Matrix Wfx, Wfh, bf;
Matrix Wox, Woh, bo;
Matrix Wcx, Wch, bc;
Matrix hiddenContext;
Matrix cellContext;
Nonlinearity fInputGate = new SigmoidUnit();
Nonlinearity fForgetGate = new SigmoidUnit();
Nonlinearity fOutputGate = new SigmoidUnit();
Nonlinearity fCellInput = new TanhUnit();
Nonlinearity fCellOutput = new TanhUnit();
public LstmLayer(int inputDimension, int outputDimension, double initParamsStdDev, Random rng) {
this.inputDimension = inputDimension;
this.outputDimension = outputDimension;
Wix = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
Wih = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
bi = new Matrix(outputDimension);
Wfx = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
Wfh = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
//set forget bias to 1.0, as described here: http://jmlr.org/proceedings/papers/v37/jozefowicz15.pdf
bf = Matrix.ones(outputDimension, 1);
Wox = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
Woh = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
bo = new Matrix(outputDimension);
Wcx = Matrix.rand(outputDimension, inputDimension, initParamsStdDev, rng);
Wch = Matrix.rand(outputDimension, outputDimension, initParamsStdDev, rng);
bc = new Matrix(outputDimension);
}
@Override
public Matrix forward(Matrix input, Graph g) throws Exception {
//input gate
Matrix sum0 = g.mul(Wix, input);
Matrix sum1 = g.mul(Wih, hiddenContext);
Matrix inputGate = g.nonlin(fInputGate, g.add(g.add(sum0, sum1), bi));
//forget gate
Matrix sum2 = g.mul(Wfx, input);
Matrix sum3 = g.mul(Wfh, hiddenContext);
Matrix forgetGate = g.nonlin(fForgetGate, g.add(g.add(sum2, sum3), bf));
//output gate
Matrix sum4 = g.mul(Wox, input);
Matrix sum5 = g.mul(Woh, hiddenContext);
Matrix outputGate = g.nonlin(fOutputGate, g.add(g.add(sum4, sum5), bo));
//write operation on cells
Matrix sum6 = g.mul(Wcx, input);
Matrix sum7 = g.mul(Wch, hiddenContext);
Matrix cellInput = g.nonlin(fCellInput, g.add(g.add(sum6, sum7), bc));
//compute new cell activation
Matrix retainCell = g.elmul(forgetGate, cellContext);
Matrix writeCell = g.elmul(inputGate, cellInput);
Matrix cellAct = g.add(retainCell, writeCell);
//compute hidden state as gated, saturated cell activations
Matrix output = g.elmul(outputGate, g.nonlin(fCellOutput, cellAct));
//rollover activations for next iteration
hiddenContext = output;
cellContext = cellAct;
return output;
}
@Override
public void resetState() {
hiddenContext = new Matrix(outputDimension);
cellContext = new Matrix(outputDimension);
}
@Override
public List<Matrix> getParameters() {
List<Matrix> result = new ArrayList<>();
result.add(Wix);
result.add(Wih);
result.add(bi);
result.add(Wfx);
result.add(Wfh);
result.add(bf);
result.add(Wox);
result.add(Woh);
result.add(bo);
result.add(Wcx);
result.add(Wch);
result.add(bc);
return result;
}
}

复制代码

地板

ReneeBK 发表于 2016-9-3 08:24:58

package model;
import java.util.ArrayList;
import java.util.List;
import matrix.Matrix;
import autodiff.Graph;
public class NeuralNetwork implements Model {
private static final long serialVersionUID = 1L;
List<Model> layers = new ArrayList<>();
public NeuralNetwork(List<Model> layers) {
this.layers = layers;
}
@Override
public Matrix forward(Matrix input, Graph g) throws Exception {
Matrix prev = input;
for (Model layer : layers) {
prev = layer.forward(prev, g);
}
return prev;
}
@Override
public void resetState() {
for (Model layer : layers) {
layer.resetState();
}
}
@Override
public List<Matrix> getParameters() {
List<Matrix> result = new ArrayList<>();
for (Model layer : layers) {
result.addAll(layer.getParameters());
}
return result;
}
}

复制代码

RecurrentJava [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

本帖隐藏的内容

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

RecurrentJava [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

本帖隐藏的内容

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群