一、松鼠学苑假期(集中式)师资培训

1. 松鼠学苑假期(集中式)师资培训邀请函

二、松鼠学苑大数据人工智能高端专场培训体系

2. 松鼠学苑大语言模型专场培训邀请函

3. 松鼠学苑人工智能专场培训邀请函

4. 松鼠学苑人工智能科普培训邀请函

5. 松鼠学苑大数据专场培训邀请函

三、松鼠学苑发展历程

在这里插入图片描述

四、主营业务

在这里插入图片描述

五、She教研解决方案

1、远端浏览器,从Google、GitHub、Maven等获取技术资源不再有羁绊。

2、基于Devfile的、一键式、无差别构建,基于账号的隔离独享环境,基于浏览器的全新开发模式,让你和你的 小伙伴的软件工程环境精准的一致,而且能随心所欲的创建一个新的属于你的环境。

3、全系列、分步骤镜像,让你的大数据能够从任一成功阶段继续,从裸Linux到Zookeeper、Hadoop、Tez、 Hive、Spark、Oozie、HBase,到Kafka、Flink、Ambari,All in One的Jupyter,最新版本的TensorFlow, 使用你擅长的任一语言,Python、Java、Scala、R、Julia。

4、无需任何配置,只要bind任一端口,你的应用便自动地expose出去,自动配置域名。

六、She平台架构

在这里插入图片描述

She是构建在docker/k8s之上、用于软件开发调试的大数据平台,平 台本身是架构在大数据集群之上的分布式系统,包括三层:计算资源管 理层、She核心调度层、应用层,应用层集合了所有课程环境,Devfile 和Workspace是其中两个核心概念:

1.Devfile是开展某项软件类开发任务所需环境的定义,那么将这个草稿 建设起来的就是Workspace,即Workspace是物理的、而Devfile是逻辑 的、是静态的:Workspace包括了物理上运行的各容器或物理机实体、端 口、命名等一干看得见摸得着的资源,所以Devfile定义了某个实训任务 的资源需求情况,如CPU、GPU、Memory、Disk等,而运行中的Work space的则实际占有了这些资源,因此,从这个意义上看,具体的实训 任务决定了She平台的硬件配置需求。

2.Devfile是She平台的预置环境,即其对应的Workspace中已经安装了 一系列版本号确定的工具,这些工具集的选择是根据这项开发任务的通 用需求而定的,是通用的;但是我们可以根据需要卸载、升级、安装相 应工具。

七、HFS三节点集群拓扑结构

在这里插入图片描述

为了降低实训成本,我们以三节点为例搭建HFS集群,但这个集群理论上可以水平扩展到10万点的规模。

松鼠学苑大语言模型专场培训邀请函

Table of Contents

  1. 项目背景.
  2. 课程内容.
  3. 组织形式.
  4. 关于松鼠学苑.
  5. 关于She平台.

1. 项目背景

大语言模型是近十年人工智能领域里程碑式技术革命,彻底改写 AI 技术路线、研发范式、应用边界与通用智能发展路径,是当前 AI 产业与学术研究的绝对核心底座,实现了AI从感知智能到认知智能的历史性跨越,彻底颠覆AI研发范式、即从专用模型转向基础模型,重塑NLP学科使之成为自然语言处理领域终极解决方案,倒逼AI底层全产业链技术革新,重塑算力、数据、算法生态,衍生全新研究方向,完善人工智能学科体系。

为此,松鼠学苑历经数年、邀请业界知名学者共同研发,推出大语言模型专场培训班。培训内容以论文为依托,逐步展开注意力机制的演进路线,并以开源deepseek为实验对象,以实操深入理解大语言模型的建模与训练过程。

所有实操部分均依托She平台提供算力和工具环境支撑,以帮助学员快速启动实训项目。

2. 课程内容

项目1:注意力机制演进过程

1、Content-base attention/Graves2014

2、Additive attention/Bahdanau2015

3、Dot-Product attention/Luong2015

4、Scaled Dot-Product attention/Vaswani2017

项目2:大语言模型deepseek架构原理及训练实战

现阶段人工智能典型应用的核心是大语言模型,开源deepseek的出现又将大模型推向另一个高度。从循环神经网络到LSTM、而后注意力机制(Attention Is All You Need)又开启大语言模型竞赛而创立了更多的架构变体,并衍生出智能体等深度应用。

在这里插入图片描述 在这里插入图片描述

3. 组织形式

(1)、开班日期:学校(企业)指定。

(2)、开班时长:根据课程推进情况确定,通常为2-5天。

(3)、开班地点:学校(企业)指定。

(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。

(5)、参加人数:人数不限,小班、一对一教学效果最佳。

(6)、联系方式:

微信:yuhaifeng1018

邮箱:training@kinginsai.com

4. 关于松鼠学苑

早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。

以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。

经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。

为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。

5. 关于She平台

依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。

在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。

以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。

在这里插入图片描述

此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。

松鼠学苑人工智能专场培训邀请函

Table of Contents

  1. 项目背景.
  2. 课程内容.
  3. 组织形式.
  4. 交付内容.
  5. 讲师团队.
  6. 典型问题集.
  7. 关于松鼠学苑.
  8. 关于She平台.

项目背景

软件行业的发展关系到一个国家的未来,软件产业已成为21世纪拥有最大产业规模和最具广阔前景的新兴产业之一,甚至于上升到软件定义世界的高度。然而,传统的“以纲为本”的人才培养模式不适应高速的技术更新推动的市场需求、教学内容陈旧导致应届毕业生不能立刻胜任工作等问题严重影响了我国IT信息类专业人才的培养,展开分析如下:

首先,IT信息技术的更新周期太快了,平均以周为更新周期、有的技术框架甚至以天为更新周期。高跳槽率和严酷的市场竞争环境造就了大部分IT企业是“功利”的,没有勇气和耐心来慢慢培养人才,他们需要的是“来之能战”的技术工程师。世界经济论坛(World Economic Forum)统计,美国81%的IT专业毕业生可以立刻胜任工作,而只有25%的印度毕业生做得到这一点,中国的这个比例只有10%。传统“以纲为本”的人才培养模式以及过于陈旧的教学内容对于一些知识更新率低的传统专业(例如地球物理)并无不妥,但是对于高知识更新率的信息类专业来说则问题较多,反倒催生更多的校外IT培训机构,这会给学生和家长产生对高等教育的认知错觉。

其次,高等教育市场正快速洗牌。当前,一本院校面临的是生源质量的竞争,二三本院校和高职院校面临的是更为严酷的生源数量的竞争。部分高校倒闭是我国高等教育改革转型中必经的阵痛,高教领域引入市场机制中的优胜劣汰、公平竞争是大势所趋。但大学的班级规模在变,学生的学习需求在变,社会对学生的需求在变,家长的期望在变,专业和学科发展需求在变,教师的需求也在变,大学的功能与职能都在变。但是,受制于高等教育现状,大学的课程体系和教学模式改变速度慢,这很难迎接市场快速洗牌的挑战。

最后,

(1)、大数据已经成为一种战略资源,具有广阔的应用前景。目前我国大数据技术人才缺口巨大,尤其是兼具技术能力与行业经验的复合型人才,更加缺乏。为此,高校相继开设数据科学与大数据技术、大数据技术与应用、大数据管理与应用等专业,其中前两个专业方向培养大数据研究与应用型工科人才,大数据管理与应用专业不仅涉及到大数据技术和大数据应用两个课程模块,还涉及商科、管理学、经济学、社会学、财务等其他交叉学科,为大数据时代经济社会发展需要培养更多更高层次的应用复合型人才。

(2)、人工智能(Artificial Intelligence,AI)是一门涉及计算机科学、统计学、数学、心理学、神经脑科学等多个领域的交叉学科,随着生成式AI(AIGC)的巨大成功,人工智能与人类的融合将变革社会的方方面面,而人工智能与其他学科的交叉复合将会推动全领域的科技新一轮革命,这也是各大厂推出"All In AI"战略的时代背景;不仅如此,人工智能已经上升到国家战略的层面,成为民族复兴的科技保障与推手。作为高等教育工作者需要尽早拥抱AI、并用AI及其发展的眼光培育莘莘学子,作为各领域从业者需要以开放的心态接纳AI时代已经到来的现实、并积极更新迭代自己的知识库以在职场立于不败之地。

为此,松鼠学苑联合知名互联网科技公司的大数据人工智能领域科学家,提出“1+n”的IT信息类人才培养模式改革实施方案,即一套精心打磨、以来源于产业而非纯工业应用为目标的学科平台,加上n年持续技术更新迭代的课程内容。

为了满足高校师资(企业高级技术人员)技能快速便捷提升的需求,松鼠学苑开展大数据、人工智能师资培训专场,松鼠学苑讲师受邀到高校(企业),开展定制化培训服务。

1、课程内容

以下内容可根据学校(企业)的需求调整。

项目1:大语言模型架构原理及其衍生应用

现阶段人工智能典型应用的核心是大语言模型,开源deepseek的出现又将大模型推向另一个高度。从循环神经网络到LSTM、而后注意力机制(Attention Is All You Need)又开启大语言模型竞赛而创立了更多的架构变体,并衍生出智能体等深度应用。厘清大模型的本质方能快速理解众多新生应用。

在这里插入图片描述 在这里插入图片描述 在这里插入图片描述

项目2:基于Yolo的多模态数据融合与目标检测

作为图像和视频解决方案的核心技术,CNN已经成为学习人工智能绕不开的课题。基于CNN的架构Yolo已经成为此领域的成熟解决方案,而多模态数据的融合更加速推动了这个领域向更深层次发展。

在这里插入图片描述

2. 组织形式

(1)、开班日期:学校(企业)指定。

(2)、开班时长:根据课程推进情况确定,通常为2-5天。

(3)、开班地点:学校(企业)指定。

(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。

(5)、参加人数:人数不限,小班、一对一教学效果最佳。

(6)、联系方式:

微信:15822708861

邮箱: training@kinginsai.com

(7)、关于证书

我们证书有两类:

  1. 一类是以松鼠学苑为发证单位的学术型证书。

  2. 一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。

3. 专业体系建设交付内容

(1)、She(Squirrel technology higher extensible platform)基础平台+人工智能实训平台AFS,解决人工智能领域教学、科研基础环境底座问题。

(2)、深度学习算法类项目不少于5个。

(3)、深度学习可视化项目不少于6个。

(4)、辅助资源不少于1G Byte。

4. 讲师团队

余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,松鼠学苑大数据与人工智能首席科学家;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构特邀讲师、高校客座教授。 所有课程素材均来自松鼠学苑教研团队,此团队由来自百度、阿里、华为、头条、小米、新浪、58同城等科技企业资深架构师、科学家组成。

5. 典型问题集

以下问题是从之前专场培训中整理出来的、有深度的典型问题(持续更新)。

编号问题领域提出问题时的进度(课程案例)是否需要解释性演示子案例
1BP算法如何保证一致性人工智能项目2:基于深度网络的图像识别
2BP算法学习速率选择方法与交叉影响因素人工智能项目2:基于深度网络的图像识别
3为什么不适用泛函等数学工具给出一个适当的解、而是用MLP的训练方式给出模型结果人工智能项目2:基于深度网络的图像识别
4人脑神经元是分区域的,为什么您的课程里总是强调模型的架构设计人工智能项目2:基于深度网络的图像识别;项目3:大模型的架构原理
5为什么仅仅对MLP权重做正则化人工智能项目2:基于深度网络的图像识别
6使用卷积网络和使用openCV图像处理算法本质上是相同的吗人工智能项目2:基于深度网络的图像识别
7BERT、GPT-3、XLNet的本质区别是什么人工智能项目3:大模型的架构原理
8注意力机制V、K、Q在现实中代表什么,能用案例说明吗人工智能项目3:大模型的架构原理
9注意力机制中位置编码为什么选择sin/cos函数人工智能项目3:大模型的架构原理
10TensorVisual中的可视化预测计算和训练计算在什么时间点进行的,需要多大的运算量人工智能项目2:基于深度网络的图像识别
11AIGC应用本地端的算力需求人工智能项目1:AIGC大模型的API调用与应用
12数据融合怎么通过大数据技术实现大数据根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案
13我用分布式编程或者并行编程方式也能处理大数据,为什么需要引入一套全新的大数据理论大数据基于传统编程语言的数据分析处理程序的设计与实现(C、Shell、Python、Scala)
14机房网络受限怎么加载离线大数据资源,如数据、源码包大数据在三台Linux主机上搭建高可用Hadoop集群
15大数据集群的架构优势、高可用怎么验证大数据在三台Linux主机上搭建高可用Hadoop集群
16如何从应用角度看大数据生态圈中的组件的功能和作用大数据根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案
17数据仓库建模理论是什么、ODS/DWD/DWS/DWT/ADS层的实际意义是什么大数据基于电商大数据集的数据仓库建设
18在小数据集时很容易得到六度理论的最终结果、但在您的Flink程序中却只得出了单个节点的结果大数据基于Spark/Flink的社交网络数据分析
19数据和计算都是分布式的,为什么您强调先数据后计算大数据基于Spark/Flink的社交网络数据分析

6. 关于松鼠学苑

早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。

以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。

经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。

为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。

7. 关于She平台

依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。

在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。

以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。

在这里插入图片描述

此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。

人工智能科普培训邀请函

Table of Contents

  1. 培训目标.
  2. 培训对象.
  3. 培训时长.
  4. 课程内容.
  5. 联系方式.

1. 培训目标

1、让零基础学员理解人工智能是什么、能做什么、不能做什么,如何有效的使用人工智能工具

2、让零基础学员掌握人工智能基础概念,能理解众多人工智能现象的背后基本逻辑

3、让零基础学员理解人工智能的风险与未来发展趋势,为工作生活决策提供知识支撑

2. 培训对象

企事业单位员工、教师、学生

3. 培训时长

120分钟

4. 课程内容

1、人工智能的概念及其内涵

2、人工智能的曲折发展历史及其兴衰背后的逻辑

3、人工智能的典型应用

4、数据、算法、算力之间相互推动相互制约的逻辑关系

5、人工智能的未来发展趋势与机遇

5. 联系方式

微信:15822708861

邮箱:training@kinginsai.com

松鼠学苑大数据专场培训邀请函

Table of Contents

  1. 项目背景.
  2. 课程内容.
  3. 组织形式.
  4. 交付内容.
  5. 讲师团队.
  6. 典型问题集.
  7. 关于松鼠学苑.
  8. 关于She平台.

项目背景

软件行业的发展关系到一个国家的未来,软件产业已成为21世纪拥有最大产业规模和最具广阔前景的新兴产业之一,甚至于上升到软件定义世界的高度。然而,传统的“以纲为本”的人才培养模式不适应高速的技术更新推动的市场需求、教学内容陈旧导致应届毕业生不能立刻胜任工作等问题严重影响了我国IT信息类专业人才的培养,展开分析如下:

首先,IT信息技术的更新周期太快了,平均以周为更新周期、有的技术框架甚至以天为更新周期。高跳槽率和严酷的市场竞争环境造就了大部分IT企业是“功利”的,没有勇气和耐心来慢慢培养人才,他们需要的是“来之能战”的技术工程师。世界经济论坛(World Economic Forum)统计,美国81%的IT专业毕业生可以立刻胜任工作,而只有25%的印度毕业生做得到这一点,中国的这个比例只有10%。传统“以纲为本”的人才培养模式以及过于陈旧的教学内容对于一些知识更新率低的传统专业(例如地球物理)并无不妥,但是对于高知识更新率的信息类专业来说则问题较多,反倒催生更多的校外IT培训机构,这会给学生和家长产生对高等教育的认知错觉。

其次,高等教育市场正快速洗牌。当前,一本院校面临的是生源质量的竞争,二三本院校和高职院校面临的是更为严酷的生源数量的竞争。部分高校倒闭是我国高等教育改革转型中必经的阵痛,高教领域引入市场机制中的优胜劣汰、公平竞争是大势所趋。但大学的班级规模在变,学生的学习需求在变,社会对学生的需求在变,家长的期望在变,专业和学科发展需求在变,教师的需求也在变,大学的功能与职能都在变。但是,受制于高等教育现状,大学的课程体系和教学模式改变速度慢,这很难迎接市场快速洗牌的挑战。

最后,

(1)、大数据已经成为一种战略资源,具有广阔的应用前景。目前我国大数据技术人才缺口巨大,尤其是兼具技术能力与行业经验的复合型人才,更加缺乏。为此,高校相继开设数据科学与大数据技术、大数据技术与应用、大数据管理与应用等专业,其中前两个专业方向培养大数据研究与应用型工科人才,大数据管理与应用专业不仅涉及到大数据技术和大数据应用两个课程模块,还涉及商科、管理学、经济学、社会学、财务等其他交叉学科,为大数据时代经济社会发展需要培养更多更高层次的应用复合型人才。

(2)、人工智能(Artificial Intelligence,AI)是一门涉及计算机科学、统计学、数学、心理学、神经脑科学等多个领域的交叉学科,随着生成式AI(AIGC)的巨大成功,人工智能与人类的融合将变革社会的方方面面,而人工智能与其他学科的交叉复合将会推动全领域的科技新一轮革命,这也是各大厂推出"All In AI"战略的时代背景;不仅如此,人工智能已经上升到国家战略的层面,成为民族复兴的科技保障与推手。作为高等教育工作者需要尽早拥抱AI、并用AI及其发展的眼光培育莘莘学子,作为各领域从业者需要以开放的心态接纳AI时代已经到来的现实、并积极更新迭代自己的知识库以在职场立于不败之地。

为此,松鼠学苑联合知名互联网科技公司的大数据人工智能领域科学家,提出“1+n”的IT信息类人才培养模式改革实施方案,即一套精心打磨、以来源于产业而非纯工业应用为目标的学科平台,加上n年持续技术更新迭代的课程内容。

为了满足高校师资(企业高级技术人员)技能快速便捷提升的需求,松鼠学苑开展大数据、人工智能师资培训专场,松鼠学苑讲师受邀到高校(企业),开展定制化培训服务。

1、课程内容

以下内容可根据学校(企业)的需求调整。

在这里插入图片描述

项目1:PB级数据处理

项目背景与研究内容:C、Shell、Python、Scala的大规模数据处理程序的执行效率对比分析,引出大规模数据处理方法论变革的软硬件动因,并反向实证大数据变革的技术驱动;大数据底层编程语言MapReduce的设计思想;以需求为导向阐述大数据集群结构与大数据生态体系。

在这里插入图片描述

在这里插入图片描述

项目2:复杂社会网络的研究

项目概要:大数据存储与大数据处理技术的推动,人类个体的选择愈发依赖于数据所揭示的成功道路的指引。从事科研,借助于论文大数据,通过相互之间的引用关系网络,我们能透析研究方向和进入时间点与成功之间的内在关系;借助于六度分隔理论,我们可以理性认知“世界真小”、尚未成功并不是因为缺少关系网;通过股票市场指标的变化,我们可以建模反推个体的决策偏好,降低盲从的代价。

我们以Flink/Hive/Hadoop集群作为数据处理的工具,以计算图作为程序设计理论,以实际计算的结果印证复杂社会网络的研究结论,而不是一系列美妙的心灵鸡汤。

在这里插入图片描述

在这里插入图片描述

2. 组织形式

(1)、开班日期:学校(企业)指定。

(2)、开班时长:根据课程推进情况确定,通常为2-5天。

(3)、开班地点:学校(企业)指定。

(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。

(5)、参加人数:人数不限,小班、一对一教学效果最佳。

(6)、联系方式:

微信:15822708861

邮箱: training@kinginsai.com

(7)、关于证书

我们证书有两类:

  1. 一类是以松鼠学苑为发证单位的学术型证书。

  2. 一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。

3. 专业体系建设交付内容

(1)、She(Squirrel technology higher extensible platform)基础平台+大数据实训平台HFS,解决大数据领域教学、科研基础环境底座问题。

(2)、覆盖主流大数据生态体系框架的一套全栈课程。

(3)、大数据项目不少于10个。

(4)、数据集不少100G Byte。

4. 讲师团队

余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,松鼠学苑大数据与人工智能首席科学家;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构特邀讲师、高校客座教授。 所有课程素材均来自松鼠学苑教研团队,此团队由来自百度、阿里、华为、头条、小米、新浪、58同城等科技企业资深架构师、科学家组成。

5. 典型问题集

以下问题是从之前专场培训中整理出来的、有深度的典型问题(持续更新)。

编号问题领域提出问题时的进度(课程案例)是否需要解释性演示子案例
1BP算法如何保证一致性人工智能项目2:基于深度网络的图像识别
2BP算法学习速率选择方法与交叉影响因素人工智能项目2:基于深度网络的图像识别
3为什么不适用泛函等数学工具给出一个适当的解、而是用MLP的训练方式给出模型结果人工智能项目2:基于深度网络的图像识别
4人脑神经元是分区域的,为什么您的课程里总是强调模型的架构设计人工智能项目2:基于深度网络的图像识别;项目3:大模型的架构原理
5为什么仅仅对MLP权重做正则化人工智能项目2:基于深度网络的图像识别
6使用卷积网络和使用openCV图像处理算法本质上是相同的吗人工智能项目2:基于深度网络的图像识别
7BERT、GPT-3、XLNet的本质区别是什么人工智能项目3:大模型的架构原理
8注意力机制V、K、Q在现实中代表什么,能用案例说明吗人工智能项目3:大模型的架构原理
9注意力机制中位置编码为什么选择sin/cos函数人工智能项目3:大模型的架构原理
10TensorVisual中的可视化预测计算和训练计算在什么时间点进行的,需要多大的运算量人工智能项目2:基于深度网络的图像识别
11AIGC应用本地端的算力需求人工智能项目1:AIGC大模型的API调用与应用
12数据融合怎么通过大数据技术实现大数据根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案
13我用分布式编程或者并行编程方式也能处理大数据,为什么需要引入一套全新的大数据理论大数据基于传统编程语言的数据分析处理程序的设计与实现(C、Shell、Python、Scala)
14机房网络受限怎么加载离线大数据资源,如数据、源码包大数据在三台Linux主机上搭建高可用Hadoop集群
15大数据集群的架构优势、高可用怎么验证大数据在三台Linux主机上搭建高可用Hadoop集群
16如何从应用角度看大数据生态圈中的组件的功能和作用大数据根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案
17数据仓库建模理论是什么、ODS/DWD/DWS/DWT/ADS层的实际意义是什么大数据基于电商大数据集的数据仓库建设
18在小数据集时很容易得到六度理论的最终结果、但在您的Flink程序中却只得出了单个节点的结果大数据基于Spark/Flink的社交网络数据分析
19数据和计算都是分布式的,为什么您强调先数据后计算大数据基于Spark/Flink的社交网络数据分析

6. 关于松鼠学苑

早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。

以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。

经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。

为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。

7. 关于She平台

依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。

在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。

以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。

在这里插入图片描述

此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。

松鼠学苑假期(集中式)师资培训邀请函

一、 学习收获

1.掌握大数据+、云计算、智能+方向学科课程设计方案,以快速启动这类学科的教研任务落地。

2.收获大数据+、云计算、智能+方向学科实验实训案例。

3.洞悉大数据+、云计算、智能+方向教研平台的类型、特点及其选用的方法。

二、 开课信息

1、开班时间及费用

开课时间:2023年8月2日-2023年8月6日。

费用:培训费、资料费、环境使用费:5800元/人。

2、付款方式

方式1:点击链接微信支付到企业账户(请在备注中注明姓名和手机号),关注公众号“松鼠学苑”,点击右下角“关于我们”,找到并点击“微信支付”付费。请注意,商户名称为“松鼠学苑”。

方式2:对公账户转账,账户信息如下,

3、教学助理联系方式:

4、注意事项:

参加培训老师仅需配备一台安装最新版本Chrome浏览器的计算机即可,对计算机的性能没有要求(使用我们的云资源完成所有操作)。

5、正式邀请函(盖章版):

点击下载

6、师资培训回执表(集体报名):

点击下载

7、关于证书

我们证书有两类:

  1. 一类是以松鼠学苑为发证单位的学术型证书。

  2. 一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。

三、 课程内容

在这里插入图片描述

四、 师资团队

余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,大数据与人工智能领域高级研究员;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;主持建设央行应收账款系统,主持架构个人征信大数据分析与建模系统;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构和高校特邀讲师。

所有课程素材均来自松鼠学苑大数据与云计算教研组,其中松鼠学苑教研组由来自百度、阿里、华为、头条、新浪、58同城等一二线互联网企业资深架构师组成。

五、 项目简介

项目1:PB级数据处理

项目背景与研究内容:C、Shell、Python、Scala的大规模数据处理程序的执行效率对比分析,引出大规模数据处理方法论变革的软硬件动因,并反向实证大数据变革的技术驱动;大数据底层编程语言MapReduce的设计思想;以需求为导向阐述大数据集群结构与大数据生态体系。

在这里插入图片描述

在这里插入图片描述

项目2:复杂社会网络的研究

项目概要:大数据存储与大数据处理技术的推动,人类个体的选择愈发依赖于数据所揭示的成功道路的指引。从事科研,借助于论文大数据,通过相互之间的引用关系网络,我们能透析研究方向和进入时间点与成功之间的内在关系;借助于六度分隔理论,我们可以理性认知“世界真小”、尚未成功并不是因为缺少关系网;通过股票市场指标的变化,我们可以建模反推个体的决策偏好,降低盲从的代价。

我们以Flink/Hive/Hadoop集群作为数据处理的工具,以计算图作为程序设计理论,以实际计算的结果印证复杂社会网络的研究结论,而不是一系列美妙的心灵鸡汤。

在这里插入图片描述

在这里插入图片描述

项目3:基于深度网络的图像识别

项目概要:谈起人工智能,广场舞大妈都能说出一系列人工智能对社会的推动案例、并能谆谆教导年轻一代好好学习科学知识;但人工智能的原理,特别是深度神经网络的原理是不是那么高不可攀,很多人未必能够厘清。

我们以TensorFlow为深度神经网络训练工具,以各类可视化图像为基础,抽丝剥茧,感性认知人工智能,并基于此做出对人工智能发展方向的准确判断。

AI赋能教学改革系列讲座

1、授课计划

课题授课日期授课讲师授课地点
深入理解人工智能2026.6.23(周二)7-8节余海峰信息技术学院407机房
大语言模型及其衍生应用2026.7.7(周二)7-8节余海峰信息技术学院407机房
智能体的构建与应用2026.9.29(周二)7-8节余海峰信息技术学院407机房
大语言模型与智能体在科研中的深度应用2026.10.13(周二)7-8节余海峰信息技术学院407机房
生成式AI(AIGC)在漫剧中的应用2026.11.3(周二)7-8节余海峰(暂定)信息技术学院407机房
人工智能在航空领域的应用2026.11.17(周二)7-8节余海峰(暂定、拟邀请校外专家)信息技术学院407机房
人工智能在航天领域的应用2026.12.8(周二)7-8节余海峰(暂定、拟邀请校外专家)信息技术学院407机房
人工智能在低空经济领域的应用2026.12.29(周二)7-8节余海峰(暂定、拟邀请校外专家)信息技术学院407机房

2、课程内容

1. 深入理解人工智能

  1. 人工智能基本概念及其背后的逻辑:是什么、能做什么、不能做什么
  2. 典型的人工智能模型的基本要素
  3. 深度学习解决的典型问题:图像视频、语言文字、语音
  4. 人工智能的发展起伏与背后成因、未来发展趋势与机遇

2. 大语言模型及其衍生应用

  1. RagFlow/DeepSeek大模型环境的私有搭建
  2. 构建自己的专业知识库
  3. 大模型在备课、出卷等教学环节中的应用

3. 智能体的构建与应用

  1. 智能体结构及相关协议
  2. 小龙虾的本地搭建
  3. 让小龙虾成为教学助理、科研助理

4. 大语言模型与智能体在科研中的深度应用

  1. ChatGPT智能分析课题研究方向研究热点及选题设计
  2. ChatGPT智能构建论文结构与内容挖掘与分析、内容生成

5. 生成式AI(AIGC)在漫剧中的应用

  1. 剧本创作(ChatGPT)
  2. 视觉生成(Midjourney)
  3. 视频生成(Runway Gen-3)
  4. 配音(ElevenLabs/ Suno)
  5. 剪辑(Premiere Pro)

6. 人工智能在航空领域的应用

引入相关领域的人工智能应用项目

7. 人工智能在航天领域的应用

引入相关领域的人工智能应用项目

8. 人工智能在低空经济领域的应用

引入相关领域的人工智能应用项目

3、主要讲师简介

余海峰,毕业于南开大学通信与信息系统专业,硕士研究生学历,研究方向为统计学习与泛函分析理论、大规模优化算法与大模型训练优化器设计、大数据系统架构设计、分布式复杂软件系统架构设计。

4、联系方式

微信:扫码加主讲老师微信、拉入课程交流群

在这里插入图片描述

网站操作提示

1. 操作提示

对于使用微信点击链接的方式访问的用户

  1. 点击红色框的图标可以展开/关闭左侧导航栏。

  2. 在绿色导航栏中触摸滑动可以看见更多导航菜单。

在这里插入图片描述

  1. 这里提及的地址 http://she.kinginsai.com、http://she-she.dev.kinginsai.com 均为She平台C端版本地址,对于部署了She平台的高校用户,请使用私有部署的地址。

  2. 由于微信可能会有网页缓存,可以点击页面刷新获取最新内容。手册、课程平台等会不定期更新,如果您的微信页面缓存时间正好在更新周期内、则可能浏览的是过期的页面内容。

在这里插入图片描述

关于视频清晰度问题

所有视频都是高清的,由于网络等综合原因,可能有时打开课程、手册中的视频时清晰度非常差,此时请反复调节视频播放的清晰度以获取高清界面,如高清->标清->高清。

学苑网课中心