pytorch保存和加载模型 pytorch保存参数

2024-11-10 09:55 精选资讯

大家好，今日乐乐来为大家解答以上的问题。pytorch保存和加载模型，pytorch保存参数很多人还不知道，现在让我们一起来看看吧！

1、elifsentiment==12. 模型开发：平台内置了多种流行的深度学习框架，如TensorFlow、PyTorch等，并提供了丰富的算法和模型组件，用户可以通过简单的拖拽和配置，快速构建自己的模型。

2、此外，ModelArts还支持自定义算法和模型的导入，以满足不同的业务需求。

3、:torch.nn包下的Embedding，作为训练的一层，随模型训练得到适合的词向量。

4、实际上，上面通过随机初始化建立了词向量层后，建立了一个“二维表”，存储了词典中每个词的词向量。

5、每个mini-batch的训练，都要从词向量表找到mini-batch对应的单词的词向量作为RNN的输入放进网络。

6、那么怎么把mini-batch中的每个句子的所有单词的词向量找出来放进网络呢，输入是什么样子，输出是什么样子？首先我们知道肯定先要建立一个词典，建立词典的时候都会建立一个dict：word2id：存储单词到词典序号的映射。

7、设一个mini-batch如下所示：显然，这个mini-batch有3个句子，即batch_size=3步首先要做的是：将句子标准化，所谓标准化，指的是：大写转小写，标点分离，这部分很简单就略过。

8、经处理后，mini-batch变为：可见，这个list的元素成了一个个list。

9、还要做一步：将上面的三个list按单词数从多到少排列。

10、标点也算单词。

11、至于为什么，后面会说到。

12、那就变成了：同时，每个句子结尾要加EOS，设EOS在词典中的index是1。

13、那么长度要更新：很显然，这个mini-batch中的句子长度不一致。

14、所以为了规整的处理，对长度不足的句子，进行填充。

15、填充PAD设序号是2，填充之后为：这样就可以直接取词向量训练了吗?不能。

16、上面batch有3个样例，RNN的每一步要输入每个样例的一个单词，一次输入batch_size个样例，所以batch要按list外层是时间步数(即序列长度)，list内层是batch_size排列。

17、即batch的维度应该是：怎么变换呢？变换方法可以是：使用itertools模块的zip_longest函数。

18、而且，使用这个函数，连填充这一步都可以省略，因为这个函数可以实现填充。

19、经变换，结果应该是：batch还要转成LongTensor：这里的batch就是词向量层的输入。

20、词向量层的输出是什么样的？好了，现在使用建立了的embedding直接通过batch取词向量了，如：设词向量维度是6，结果是：。

本文到这结束，希望上面文章对大家有所帮助。

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系 836084111@qq.com 删除。