松鼠学苑大数据专场培训邀请函

Table of Contents

  1. 项目背景.
  2. 课程内容.
  3. 组织形式.
  4. 交付内容.
  5. 讲师团队.
  6. 典型问题集.
  7. 关于松鼠学苑.
  8. 关于She平台.

项目背景

软件行业的发展关系到一个国家的未来,软件产业已成为21世纪拥有最大产业规模和最具广阔前景的新兴产业之一,甚至于上升到软件定义世界的高度。然而,传统的“以纲为本”的人才培养模式不适应高速的技术更新推动的市场需求、教学内容陈旧导致应届毕业生不能立刻胜任工作等问题严重影响了我国IT信息类专业人才的培养,展开分析如下:

首先,IT信息技术的更新周期太快了,平均以周为更新周期、有的技术框架甚至以天为更新周期。高跳槽率和严酷的市场竞争环境造就了大部分IT企业是“功利”的,没有勇气和耐心来慢慢培养人才,他们需要的是“来之能战”的技术工程师。世界经济论坛(World Economic Forum)统计,美国81%的IT专业毕业生可以立刻胜任工作,而只有25%的印度毕业生做得到这一点,中国的这个比例只有10%。传统“以纲为本”的人才培养模式以及过于陈旧的教学内容对于一些知识更新率低的传统专业(例如地球物理)并无不妥,但是对于高知识更新率的信息类专业来说则问题较多,反倒催生更多的校外IT培训机构,这会给学生和家长产生对高等教育的认知错觉。

其次,高等教育市场正快速洗牌。当前,一本院校面临的是生源质量的竞争,二三本院校和高职院校面临的是更为严酷的生源数量的竞争。部分高校倒闭是我国高等教育改革转型中必经的阵痛,高教领域引入市场机制中的优胜劣汰、公平竞争是大势所趋。但大学的班级规模在变,学生的学习需求在变,社会对学生的需求在变,家长的期望在变,专业和学科发展需求在变,教师的需求也在变,大学的功能与职能都在变。但是,受制于高等教育现状,大学的课程体系和教学模式改变速度慢,这很难迎接市场快速洗牌的挑战。

最后,

(1)、大数据已经成为一种战略资源,具有广阔的应用前景。目前我国大数据技术人才缺口巨大,尤其是兼具技术能力与行业经验的复合型人才,更加缺乏。为此,高校相继开设数据科学与大数据技术、大数据技术与应用、大数据管理与应用等专业,其中前两个专业方向培养大数据研究与应用型工科人才,大数据管理与应用专业不仅涉及到大数据技术和大数据应用两个课程模块,还涉及商科、管理学、经济学、社会学、财务等其他交叉学科,为大数据时代经济社会发展需要培养更多更高层次的应用复合型人才。

(2)、人工智能(Artificial Intelligence,AI)是一门涉及计算机科学、统计学、数学、心理学、神经脑科学等多个领域的交叉学科,随着生成式AI(AIGC)的巨大成功,人工智能与人类的融合将变革社会的方方面面,而人工智能与其他学科的交叉复合将会推动全领域的科技新一轮革命,这也是各大厂推出"All In AI"战略的时代背景;不仅如此,人工智能已经上升到国家战略的层面,成为民族复兴的科技保障与推手。作为高等教育工作者需要尽早拥抱AI、并用AI及其发展的眼光培育莘莘学子,作为各领域从业者需要以开放的心态接纳AI时代已经到来的现实、并积极更新迭代自己的知识库以在职场立于不败之地。

为此,松鼠学苑联合知名互联网科技公司的大数据人工智能领域科学家,提出“1+n”的IT信息类人才培养模式改革实施方案,即一套精心打磨、以来源于产业而非纯工业应用为目标的学科平台,加上n年持续技术更新迭代的课程内容。

为了满足高校师资(企业高级技术人员)技能快速便捷提升的需求,松鼠学苑开展大数据、人工智能师资培训专场,松鼠学苑讲师受邀到高校(企业),开展定制化培训服务。

1、课程内容

以下内容可根据学校(企业)的需求调整。

在这里插入图片描述

项目1:PB级数据处理

项目背景与研究内容:C、Shell、Python、Scala的大规模数据处理程序的执行效率对比分析,引出大规模数据处理方法论变革的软硬件动因,并反向实证大数据变革的技术驱动;大数据底层编程语言MapReduce的设计思想;以需求为导向阐述大数据集群结构与大数据生态体系。

在这里插入图片描述

在这里插入图片描述

项目2:复杂社会网络的研究

项目概要:大数据存储与大数据处理技术的推动,人类个体的选择愈发依赖于数据所揭示的成功道路的指引。从事科研,借助于论文大数据,通过相互之间的引用关系网络,我们能透析研究方向和进入时间点与成功之间的内在关系;借助于六度分隔理论,我们可以理性认知“世界真小”、尚未成功并不是因为缺少关系网;通过股票市场指标的变化,我们可以建模反推个体的决策偏好,降低盲从的代价。

我们以Flink/Hive/Hadoop集群作为数据处理的工具,以计算图作为程序设计理论,以实际计算的结果印证复杂社会网络的研究结论,而不是一系列美妙的心灵鸡汤。

在这里插入图片描述

在这里插入图片描述

2. 组织形式

(1)、开班日期:学校(企业)指定。

(2)、开班时长:根据课程推进情况确定,通常为2-5天。

(3)、开班地点:学校(企业)指定。

(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。

(5)、参加人数:人数不限,小班、一对一教学效果最佳。

(6)、联系方式:

电话/微信:13212212963

邮箱: training@kinginsai.com

(7)、关于证书

我们证书有两类:

  1. 一类是以松鼠学苑为发证单位的学术型证书。

  2. 一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。

3. 专业体系建设交付内容

(1)、She(Squirrel technology higher extensible platform)基础平台+大数据实训平台HFS,解决大数据领域教学、科研基础环境底座问题。

(2)、覆盖主流大数据生态体系框架的一套全栈课程。

(3)、大数据项目不少于10个。

(4)、数据集不少100G Byte。

4. 讲师团队

余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,松鼠学苑大数据与人工智能首席科学家;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构特邀讲师、高校客座教授。 所有课程素材均来自松鼠学苑教研团队,此团队由来自百度、阿里、华为、头条、小米、新浪、58同城等科技企业资深架构师、科学家组成。

5. 典型问题集

以下问题是从之前专场培训中整理出来的、有深度的典型问题(持续更新)。

编号问题领域提出问题时的进度(课程案例)是否需要解释性演示子案例
1BP算法如何保证一致性人工智能项目2:基于深度网络的图像识别
2BP算法学习速率选择方法与交叉影响因素人工智能项目2:基于深度网络的图像识别
3为什么不适用泛函等数学工具给出一个适当的解、而是用MLP的训练方式给出模型结果人工智能项目2:基于深度网络的图像识别
4人脑神经元是分区域的,为什么您的课程里总是强调模型的架构设计人工智能项目2:基于深度网络的图像识别;项目3:大模型的架构原理
5为什么仅仅对MLP权重做正则化人工智能项目2:基于深度网络的图像识别
6使用卷积网络和使用openCV图像处理算法本质上是相同的吗人工智能项目2:基于深度网络的图像识别
7BERT、GPT-3、XLNet的本质区别是什么人工智能项目3:大模型的架构原理
8注意力机制V、K、Q在现实中代表什么,能用案例说明吗人工智能项目3:大模型的架构原理
9注意力机制中位置编码为什么选择sin/cos函数人工智能项目3:大模型的架构原理
10TensorVisual中的可视化预测计算和训练计算在什么时间点进行的,需要多大的运算量人工智能项目2:基于深度网络的图像识别
11AIGC应用本地端的算力需求人工智能项目1:AIGC大模型的API调用与应用
12数据融合怎么通过大数据技术实现大数据根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案
13我用分布式编程或者并行编程方式也能处理大数据,为什么需要引入一套全新的大数据理论大数据基于传统编程语言的数据分析处理程序的设计与实现(C、Shell、Python、Scala)
14机房网络受限怎么加载离线大数据资源,如数据、源码包大数据在三台Linux主机上搭建高可用Hadoop集群
15大数据集群的架构优势、高可用怎么验证大数据在三台Linux主机上搭建高可用Hadoop集群
16如何从应用角度看大数据生态圈中的组件的功能和作用大数据根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案
17数据仓库建模理论是什么、ODS/DWD/DWS/DWT/ADS层的实际意义是什么大数据基于电商大数据集的数据仓库建设
18在小数据集时很容易得到六度理论的最终结果、但在您的Flink程序中却只得出了单个节点的结果大数据基于Spark/Flink的社交网络数据分析
19数据和计算都是分布式的,为什么您强调先数据后计算大数据基于Spark/Flink的社交网络数据分析

6. 关于松鼠学苑

早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。

以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。

经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。

为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。

7. 关于She平台

依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。

在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。

以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。

在这里插入图片描述

此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。