Transformer模型中的哪些部分有助于处理长距离依赖关系?
A. Multi-head Attention
B. Feed-forward Neural Network
C. Positional Encoding
D. Layer Normalization
题目来源于CDA模拟题库
点击此处获取答案
|
楼主: CDA网校
|
316
1
[每天一个数据分析师] 每天一个数据分析题(二百四十九) |
|
已卖:189份资源 泰斗 2%
-
|
|
![]() |
|
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


