楼主: Luce2030
153 0

[其他] 大模型 LLaMA 深度解析 [推广有奖]

  • 0关注
  • 3粉丝

已卖:210份资源

学科带头人

12%

还不是VIP/贵宾

-

威望
0
论坛币
61 个
通用积分
108.5803
学术水平
11 点
热心指数
34 点
信用等级
4 点
经验
27963 点
帖子
1330
精华
0
在线时间
830 小时
注册时间
2024-1-22
最后登录
2026-4-18

楼主
Luce2030 发表于 2025-3-13 08:46:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
+课程资料            2.6 MB
| GLUVariantsImproveTransformer.pdf             108.0 KB
| inference.py             8.1 KB
| LLaMA.pdf             731.0 KB
| model.py             10.2 KB
| params.json             102 Byte
| RoFormerEnhancedTransformerwithRotaryPositionEmbedding.pdf             585.0 KB
| RootMeanSquareLayerNormalization.pdf             537.0 KB
| Self-AttentionwithRelativePositionRepresentations.pdf             230.0 KB
| test_top_p.ipynb             9.4 KB
| tokenizer.model             488.0 KB
课时01 01_LLaMA概述_ev.mp4            24.6 MB
课时02 02_训练LLaMA使用的数据集_ev.mp4            40.6 MB
课时03 03_LLaMA大模型整体架构_ev.mp4            39.1 MB
课时04 04_InputEmbedding模块_ev.mp4            26.7 MB
课时05 05_为什么要去进行归一化_ev.mp4            26.7 MB
课时06 06_深入理解归一化对于大模型的重要性_ev.mp4            22.5 MB
课时07 07_BatchNorm_ev.mp4            11.1 MB
课时08 08_LayerNorm_ev.mp4            18.8 MB
课时09 09_RMSNorm_ev.mp4            28.2 MB
课时10 10_绝对位置编码_ev.mp4            15.7 MB
课时11 11_相对位置编码_ev.mp4            31.8 MB
课时12 12_RoPE_ev.mp4            43.8 MB
课时13 13_SwiGLU_ev.mp4            34.6 MB
课时14 14_语言模型的本质与MaskedSelfAttention_ev.mp4            22.5 MB
课时15 15_KVcache是如何计算提高效率的_ev.mp4            18.3 MB
课时16 16_MQA和GQA_ev.mp4            26.0 MB
课时17 17_代码实战之ModelArgs_ev.mp4            24.0 MB
课时18 18_代码实战之构建Transformer_ev.mp4            49.9 MB
课时19 19_代码实战之提前计算RoPE需要的mθ_ev.mp4            43.0 MB
课时20 20_代码实战之将x按照2个值一组进行分组_ev.mp4            27.9 MB
课时21 21_代码实战之对token的向量应用旋转矩阵_ev.mp4            37.8 MB
课时22 22_代码实战之RMSNorm_ev.mp4            23.3 MB
课时23 23_代码实战之EncoderBlock_ev.mp4            23.0 MB
课时24 24_代码实战之SelfAttention类的初始化_ev.mp4            27.7 MB
课时25 25_代码实战之SelfAttention中应用RoPE和对KV进行缓存_ev.mp4            25.9 MB
课时26 26_代码实战之应用公式计算SelfAttention_ev.mp4            35.7 MB
课时27 27_代码实战之为了实现GQA需要对KV进行拷贝_ev.mp4            25.5 MB
课时28 28_代码实战之计算FFN中隐藏层节点数量_ev.mp4            25.2 MB
课时29 29_代码实战之FFN中三个矩阵以及SwishGLU的运算实现_ev.mp4            15.0 MB
课时30 30_代码实战之加载checkpoint文件_ev.mp4            36.5 MB
课时31 31_代码实战之加载分词器、model模型及模型参数_ev.mp4            35.6 MB
课时32 32_代码实战之测试模型加载_ev.mp4            20.2 MB
课时33 33_代码实战之模型推理预测_ev.mp4            22.1 MB
课时34 34_代码实战之准备模型推理需要的输入tokens张量_ev.mp4            57.2 MB
课时35 35_代码实战之模型生成与解码得到response文本_ev.mp4            49.6 MB
课时36 36_代码实战之运行结果展示_ev.mp4            22.8 MB
课时37 37_什么是推理的策略_ev.mp4            11.3 MB
课时38 38_GreedySearch_ev.mp4            9.1 MB
课时39 39_BeamSearch_ev.mp4            16.4 MB
课时40 40_Temperature_ev.mp4            13.7 MB
课时41 41_RandomSampling_ev.mp4            4.4 MB
课时42 42_基于TopK的随机采样_ev.mp4            9.2 MB
课时43 43_基于TopP的随机采样_ev.mp4            14.5 MB
课时44 44_代码实战之增加TopP采样策略_ev.mp4            44.0 MB
课时45 45_代码实战之测试TopP采样策略_ev.mp4            41.1 MB



大模型 LLaMA 深度解析.part01.rar (100 MB, 需要: RMB 29 元)
大模型 LLaMA 深度解析.part02.rar (100 MB) 大模型 LLaMA 深度解析.part03.rar (100 MB) 大模型 LLaMA 深度解析.part04.rar (100 MB) 大模型 LLaMA 深度解析.part05.rar (100 MB) 大模型 LLaMA 深度解析.part06.rar (100 MB) 大模型 LLaMA 深度解析.part07.rar (100 MB) 大模型 LLaMA 深度解析.part08.rar (100 MB) 大模型 LLaMA 深度解析.part09.rar (100 MB) 大模型 LLaMA 深度解析.part10.rar (100 MB) 大模型 LLaMA 深度解析.part11.rar (100 MB) 大模型 LLaMA 深度解析.part12.rar (23.17 MB)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Ama Lam Presentation Presentatio Attention

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-19 07:47