松鼠学苑大语言模型专场培训邀请函

Table of Contents

  1. 项目背景.
  2. 课程内容.
  3. 组织形式.
  4. 关于松鼠学苑.
  5. 关于She平台.

1. 项目背景

大语言模型是近十年人工智能领域里程碑式技术革命,彻底改写 AI 技术路线、研发范式、应用边界与通用智能发展路径,是当前 AI 产业与学术研究的绝对核心底座,实现了AI从感知智能到认知智能的历史性跨越,彻底颠覆AI研发范式、即从专用模型转向基础模型,重塑NLP学科使之成为自然语言处理领域终极解决方案,倒逼AI底层全产业链技术革新,重塑算力、数据、算法生态,衍生全新研究方向,完善人工智能学科体系。

为此,松鼠学苑历经数年、邀请业界知名学者共同研发,推出大语言模型专场培训班。培训内容以论文为依托,逐步展开注意力机制的演进路线,并以开源deepseek为实验对象,以实操深入理解大语言模型的建模与训练过程。

所有实操部分均依托She平台提供算力和工具环境支撑,以帮助学员快速启动实训项目。

2. 课程内容

项目1:注意力机制演进过程

1、Content-base attention/Graves2014

2、Additive attention/Bahdanau2015

3、Dot-Product attention/Luong2015

4、Scaled Dot-Product attention/Vaswani2017

项目2:大语言模型deepseek架构原理及训练实战

现阶段人工智能典型应用的核心是大语言模型,开源deepseek的出现又将大模型推向另一个高度。从循环神经网络到LSTM、而后注意力机制(Attention Is All You Need)又开启大语言模型竞赛而创立了更多的架构变体,并衍生出智能体等深度应用。

在这里插入图片描述 在这里插入图片描述

3. 组织形式

(1)、开班日期:学校(企业)指定。

(2)、开班时长:根据课程推进情况确定,通常为2-5天。

(3)、开班地点:学校(企业)指定。

(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。

(5)、参加人数:人数不限,小班、一对一教学效果最佳。

(6)、联系方式:

微信:yuhaifeng1018

邮箱:training@kinginsai.com

4. 关于松鼠学苑

早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。

以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。

经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。

为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。

5. 关于She平台

依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。

在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。

以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。

在这里插入图片描述

此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。