题名:	从零构建大模型 [ 专著] cong ling gou jian da mo xing / 梁楠著 ,
ISBN:	978-7-302-68561-6 价格： CNY99.00
语种:	chi
载体形态:	284页图 24cm
出版发行:	出版地：北京出版社：清华大学出版社出版日期： 2025
内容提要:	本书共12章，涵盖了Transformer模型的基础理论，如Seq2Seq模型、分词、嵌入层和自注意力机制等关键概念，并深入剖析了GPT模型的核心实现与文本生成过程，以及BERT模型的预训练和微调技术。同时，也对ViT（视觉Transformer）模型的架构、训练方法，以及高阶微调策略如Adapter Tuning和P-Tuning进行了详尽讲解。
主题词:	人工智能
中图分类法:	TP18 版次： 5
主要责任者:	梁楠 liang nan 著