一、松鼠学苑假期(集中式)师资培训
1. 松鼠学苑假期(集中式)师资培训邀请函
二、松鼠学苑大数据人工智能高端专场培训体系
2. 松鼠学苑人工智能专场培训邀请函
3. 松鼠学苑大数据专场培训邀请函
三、松鼠学苑发展历程
四、主营业务
五、She教研解决方案
1、远端浏览器,从Google、GitHub、Maven等获取技术资源不再有羁绊。
2、基于Devfile的、一键式、无差别构建,基于账号的隔离独享环境,基于浏览器的全新开发模式,让你和你的 小伙伴的软件工程环境精准的一致,而且能随心所欲的创建一个新的属于你的环境。
3、全系列、分步骤镜像,让你的大数据能够从任一成功阶段继续,从裸Linux到Zookeeper、Hadoop、Tez、 Hive、Spark、Oozie、HBase,到Kafka、Flink、Ambari,All in One的Jupyter,最新版本的TensorFlow, 使用你擅长的任一语言,Python、Java、Scala、R、Julia。
4、无需任何配置,只要bind任一端口,你的应用便自动地expose出去,自动配置域名。
六、She平台架构
She是构建在docker/k8s之上、用于软件开发调试的大数据平台,平 台本身是架构在大数据集群之上的分布式系统,包括三层:计算资源管 理层、She核心调度层、应用层,应用层集合了所有课程环境,Devfile 和Workspace是其中两个核心概念:
1.Devfile是开展某项软件类开发任务所需环境的定义,那么将这个草稿 建设起来的就是Workspace,即Workspace是物理的、而Devfile是逻辑 的、是静态的:Workspace包括了物理上运行的各容器或物理机实体、端 口、命名等一干看得见摸得着的资源,所以Devfile定义了某个实训任务 的资源需求情况,如CPU、GPU、Memory、Disk等,而运行中的Work space的则实际占有了这些资源,因此,从这个意义上看,具体的实训 任务决定了She平台的硬件配置需求。
2.Devfile是She平台的预置环境,即其对应的Workspace中已经安装了 一系列版本号确定的工具,这些工具集的选择是根据这项开发任务的通 用需求而定的,是通用的;但是我们可以根据需要卸载、升级、安装相 应工具。
七、HFS三节点集群拓扑结构
为了降低实训成本,我们以三节点为例搭建HFS集群,但这个集群理论上可以水平扩展到10万点的规模。
松鼠学苑人工智能(多模态大模型)专场培训邀请函
Table of Contents
项目背景
软件行业的发展关系到一个国家的未来,软件产业已成为21世纪拥有最大产业规模和最具广阔前景的新兴产业之一,甚至于上升到软件定义世界的高度。然而,传统的“以纲为本”的人才培养模式不适应高速的技术更新推动的市场需求、教学内容陈旧导致应届毕业生不能立刻胜任工作等问题严重影响了我国IT信息类专业人才的培养,展开分析如下:
首先,IT信息技术的更新周期太快了,平均以周为更新周期、有的技术框架甚至以天为更新周期。高跳槽率和严酷的市场竞争环境造就了大部分IT企业是“功利”的,没有勇气和耐心来慢慢培养人才,他们需要的是“来之能战”的技术工程师。世界经济论坛(World Economic Forum)统计,美国81%的IT专业毕业生可以立刻胜任工作,而只有25%的印度毕业生做得到这一点,中国的这个比例只有10%。传统“以纲为本”的人才培养模式以及过于陈旧的教学内容对于一些知识更新率低的传统专业(例如地球物理)并无不妥,但是对于高知识更新率的信息类专业来说则问题较多,反倒催生更多的校外IT培训机构,这会给学生和家长产生对高等教育的认知错觉。
其次,高等教育市场正快速洗牌。当前,一本院校面临的是生源质量的竞争,二三本院校和高职院校面临的是更为严酷的生源数量的竞争。部分高校倒闭是我国高等教育改革转型中必经的阵痛,高教领域引入市场机制中的优胜劣汰、公平竞争是大势所趋。但大学的班级规模在变,学生的学习需求在变,社会对学生的需求在变,家长的期望在变,专业和学科发展需求在变,教师的需求也在变,大学的功能与职能都在变。但是,受制于高等教育现状,大学的课程体系和教学模式改变速度慢,这很难迎接市场快速洗牌的挑战。
最后,
(1)、大数据已经成为一种战略资源,具有广阔的应用前景。目前我国大数据技术人才缺口巨大,尤其是兼具技术能力与行业经验的复合型人才,更加缺乏。为此,高校相继开设数据科学与大数据技术、大数据技术与应用、大数据管理与应用等专业,其中前两个专业方向培养大数据研究与应用型工科人才,大数据管理与应用专业不仅涉及到大数据技术和大数据应用两个课程模块,还涉及商科、管理学、经济学、社会学、财务等其他交叉学科,为大数据时代经济社会发展需要培养更多更高层次的应用复合型人才。
(2)、人工智能(Artificial Intelligence,AI)是一门涉及计算机科学、统计学、数学、心理学、神经脑科学等多个领域的交叉学科,随着生成式AI(AIGC)的巨大成功,人工智能与人类的融合将变革社会的方方面面,而人工智能与其他学科的交叉复合将会推动全领域的科技新一轮革命,这也是各大厂推出"All In AI"战略的时代背景;不仅如此,人工智能已经上升到国家战略的层面,成为民族复兴的科技保障与推手。作为高等教育工作者需要尽早拥抱AI、并用AI及其发展的眼光培育莘莘学子,作为各领域从业者需要以开放的心态接纳AI时代已经到来的现实、并积极更新迭代自己的知识库以在职场立于不败之地。
为此,松鼠学苑联合知名互联网科技公司的大数据人工智能领域科学家,提出“1+n”的IT信息类人才培养模式改革实施方案,即一套精心打磨、以来源于产业而非纯工业应用为目标的学科平台,加上n年持续技术更新迭代的课程内容。
为了满足高校师资(企业高级技术人员)技能快速便捷提升的需求,松鼠学苑开展大数据、人工智能师资培训专场,松鼠学苑讲师受邀到高校(企业),开展定制化培训服务。
1、课程内容
以下内容可根据学校(企业)的需求调整。
项目1:AIGC大模型的API调用与应用
ChatGPT的出现,加速了AIGC(人工智能生成内容技术,Artificial Intelligence Generated Content,简称AIGC)技术和应用的发展。为此,为了应对AIGC的快速发展,国家网信办、国家发改委、教育部等七部门于2023年7月10日正式发布《生成式人工智能服务管理暂行办法》,这也是全球首部AIGC领域的监管法规。那到底什么是AIGC?AIGC能用来做什么?AIGC可以替代我们的工作吗?
- 基于大模型的代码自动生成。
- 基于大模型的文案生成。
- 基于大模型的Presentation(ppt)生成。
项目2:基于深度网络的图像识别
项目概要:谈起人工智能,广场舞大妈都能说出一系列人工智能对社会的推动案例、并能谆谆教导年轻一代好好学习科学知识;但人工智能的原理,特别是深度神经网络的原理是不是那么高不可攀,很多人未必能够厘清。
我们以TensorFlow为深度神经网络训练工具,以各类可视化图像为基础,抽丝剥茧,感性认知人工智能,并基于此做出对人工智能发展方向的准确判断。
本项目将涉及深度神经网络的架构、数据的表示、BP算法、正则化、模型优化、卷积网络。






项目3:大模型的架构原理
- 注意力机制(Attention Is All You Need)。
- GPT-4。
- ChatGPT及其竞品分析。
2. 组织形式
(1)、开班日期:学校(企业)指定。
(2)、开班时长:根据课程推进情况确定,通常为2-5天。
(3)、开班地点:学校(企业)指定。
(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。
(5)、参加人数:人数不限,小班、一对一教学效果最佳。
(6)、联系方式:
电话/微信:13212212963
邮箱: training@kinginsai.com
(7)、关于证书
我们证书有两类:
-
一类是以松鼠学苑为发证单位的学术型证书。
-
一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。
3. 专业体系建设交付内容
(1)、She(Squirrel technology higher extensible platform)基础平台+人工智能实训平台AFS,解决人工智能领域教学、科研基础环境底座问题。
(2)、深度学习算法类项目不少于5个。
(3)、深度学习可视化项目不少于6个。
(4)、辅助资源不少于1G Byte。
4. 讲师团队
余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,松鼠学苑大数据与人工智能首席科学家;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构特邀讲师、高校客座教授。 所有课程素材均来自松鼠学苑教研团队,此团队由来自百度、阿里、华为、头条、小米、新浪、58同城等科技企业资深架构师、科学家组成。
5. 典型问题集
以下问题是从之前专场培训中整理出来的、有深度的典型问题(持续更新)。
编号 | 问题 | 领域 | 提出问题时的进度(课程案例) | 是否需要解释性演示子案例 |
---|---|---|---|---|
1 | BP算法如何保证一致性 | 人工智能 | 项目2:基于深度网络的图像识别 | 否 |
2 | BP算法学习速率选择方法与交叉影响因素 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
3 | 为什么不适用泛函等数学工具给出一个适当的解、而是用MLP的训练方式给出模型结果 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
4 | 人脑神经元是分区域的,为什么您的课程里总是强调模型的架构设计 | 人工智能 | 项目2:基于深度网络的图像识别;项目3:大模型的架构原理 | 是 |
5 | 为什么仅仅对MLP权重做正则化 | 人工智能 | 项目2:基于深度网络的图像识别 | 否 |
6 | 使用卷积网络和使用openCV图像处理算法本质上是相同的吗 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
7 | BERT、GPT-3、XLNet的本质区别是什么 | 人工智能 | 项目3:大模型的架构原理 | 是 |
8 | 注意力机制V、K、Q在现实中代表什么,能用案例说明吗 | 人工智能 | 项目3:大模型的架构原理 | 是 |
9 | 注意力机制中位置编码为什么选择sin/cos函数 | 人工智能 | 项目3:大模型的架构原理 | 否 |
10 | TensorVisual中的可视化预测计算和训练计算在什么时间点进行的,需要多大的运算量 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
11 | AIGC应用本地端的算力需求 | 人工智能 | 项目1:AIGC大模型的API调用与应用 | 否 |
12 | 数据融合怎么通过大数据技术实现 | 大数据 | 根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案 | 是 |
13 | 我用分布式编程或者并行编程方式也能处理大数据,为什么需要引入一套全新的大数据理论 | 大数据 | 基于传统编程语言的数据分析处理程序的设计与实现(C、Shell、Python、Scala) | 是 |
14 | 机房网络受限怎么加载离线大数据资源,如数据、源码包 | 大数据 | 在三台Linux主机上搭建高可用Hadoop集群 | 是 |
15 | 大数据集群的架构优势、高可用怎么验证 | 大数据 | 在三台Linux主机上搭建高可用Hadoop集群 | 是 |
16 | 如何从应用角度看大数据生态圈中的组件的功能和作用 | 大数据 | 根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案 | 否 |
17 | 数据仓库建模理论是什么、ODS/DWD/DWS/DWT/ADS层的实际意义是什么 | 大数据 | 基于电商大数据集的数据仓库建设 | 是 |
18 | 在小数据集时很容易得到六度理论的最终结果、但在您的Flink程序中却只得出了单个节点的结果 | 大数据 | 基于Spark/Flink的社交网络数据分析 | 否 |
19 | 数据和计算都是分布式的,为什么您强调先数据后计算 | 大数据 | 基于Spark/Flink的社交网络数据分析 | 是 |
6. 关于松鼠学苑
早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。
以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。
经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。
为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。
7. 关于She平台
依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。
在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。
以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。
此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。
松鼠学苑大数据专场培训邀请函
Table of Contents
项目背景
软件行业的发展关系到一个国家的未来,软件产业已成为21世纪拥有最大产业规模和最具广阔前景的新兴产业之一,甚至于上升到软件定义世界的高度。然而,传统的“以纲为本”的人才培养模式不适应高速的技术更新推动的市场需求、教学内容陈旧导致应届毕业生不能立刻胜任工作等问题严重影响了我国IT信息类专业人才的培养,展开分析如下:
首先,IT信息技术的更新周期太快了,平均以周为更新周期、有的技术框架甚至以天为更新周期。高跳槽率和严酷的市场竞争环境造就了大部分IT企业是“功利”的,没有勇气和耐心来慢慢培养人才,他们需要的是“来之能战”的技术工程师。世界经济论坛(World Economic Forum)统计,美国81%的IT专业毕业生可以立刻胜任工作,而只有25%的印度毕业生做得到这一点,中国的这个比例只有10%。传统“以纲为本”的人才培养模式以及过于陈旧的教学内容对于一些知识更新率低的传统专业(例如地球物理)并无不妥,但是对于高知识更新率的信息类专业来说则问题较多,反倒催生更多的校外IT培训机构,这会给学生和家长产生对高等教育的认知错觉。
其次,高等教育市场正快速洗牌。当前,一本院校面临的是生源质量的竞争,二三本院校和高职院校面临的是更为严酷的生源数量的竞争。部分高校倒闭是我国高等教育改革转型中必经的阵痛,高教领域引入市场机制中的优胜劣汰、公平竞争是大势所趋。但大学的班级规模在变,学生的学习需求在变,社会对学生的需求在变,家长的期望在变,专业和学科发展需求在变,教师的需求也在变,大学的功能与职能都在变。但是,受制于高等教育现状,大学的课程体系和教学模式改变速度慢,这很难迎接市场快速洗牌的挑战。
最后,
(1)、大数据已经成为一种战略资源,具有广阔的应用前景。目前我国大数据技术人才缺口巨大,尤其是兼具技术能力与行业经验的复合型人才,更加缺乏。为此,高校相继开设数据科学与大数据技术、大数据技术与应用、大数据管理与应用等专业,其中前两个专业方向培养大数据研究与应用型工科人才,大数据管理与应用专业不仅涉及到大数据技术和大数据应用两个课程模块,还涉及商科、管理学、经济学、社会学、财务等其他交叉学科,为大数据时代经济社会发展需要培养更多更高层次的应用复合型人才。
(2)、人工智能(Artificial Intelligence,AI)是一门涉及计算机科学、统计学、数学、心理学、神经脑科学等多个领域的交叉学科,随着生成式AI(AIGC)的巨大成功,人工智能与人类的融合将变革社会的方方面面,而人工智能与其他学科的交叉复合将会推动全领域的科技新一轮革命,这也是各大厂推出"All In AI"战略的时代背景;不仅如此,人工智能已经上升到国家战略的层面,成为民族复兴的科技保障与推手。作为高等教育工作者需要尽早拥抱AI、并用AI及其发展的眼光培育莘莘学子,作为各领域从业者需要以开放的心态接纳AI时代已经到来的现实、并积极更新迭代自己的知识库以在职场立于不败之地。
为此,松鼠学苑联合知名互联网科技公司的大数据人工智能领域科学家,提出“1+n”的IT信息类人才培养模式改革实施方案,即一套精心打磨、以来源于产业而非纯工业应用为目标的学科平台,加上n年持续技术更新迭代的课程内容。
为了满足高校师资(企业高级技术人员)技能快速便捷提升的需求,松鼠学苑开展大数据、人工智能师资培训专场,松鼠学苑讲师受邀到高校(企业),开展定制化培训服务。
1、课程内容
以下内容可根据学校(企业)的需求调整。
项目1:PB级数据处理
项目背景与研究内容:C、Shell、Python、Scala的大规模数据处理程序的执行效率对比分析,引出大规模数据处理方法论变革的软硬件动因,并反向实证大数据变革的技术驱动;大数据底层编程语言MapReduce的设计思想;以需求为导向阐述大数据集群结构与大数据生态体系。
项目2:复杂社会网络的研究
项目概要:大数据存储与大数据处理技术的推动,人类个体的选择愈发依赖于数据所揭示的成功道路的指引。从事科研,借助于论文大数据,通过相互之间的引用关系网络,我们能透析研究方向和进入时间点与成功之间的内在关系;借助于六度分隔理论,我们可以理性认知“世界真小”、尚未成功并不是因为缺少关系网;通过股票市场指标的变化,我们可以建模反推个体的决策偏好,降低盲从的代价。
我们以Flink/Hive/Hadoop集群作为数据处理的工具,以计算图作为程序设计理论,以实际计算的结果印证复杂社会网络的研究结论,而不是一系列美妙的心灵鸡汤。
2. 组织形式
(1)、开班日期:学校(企业)指定。
(2)、开班时长:根据课程推进情况确定,通常为2-5天。
(3)、开班地点:学校(企业)指定。
(4)、参加人员:高校教师(企业高级技术人员),专业基础不限。
(5)、参加人数:人数不限,小班、一对一教学效果最佳。
(6)、联系方式:
电话/微信:13212212963
邮箱: training@kinginsai.com
(7)、关于证书
我们证书有两类:
-
一类是以松鼠学苑为发证单位的学术型证书。
-
一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。
3. 专业体系建设交付内容
(1)、She(Squirrel technology higher extensible platform)基础平台+大数据实训平台HFS,解决大数据领域教学、科研基础环境底座问题。
(2)、覆盖主流大数据生态体系框架的一套全栈课程。
(3)、大数据项目不少于10个。
(4)、数据集不少100G Byte。
4. 讲师团队
余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,松鼠学苑大数据与人工智能首席科学家;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构特邀讲师、高校客座教授。 所有课程素材均来自松鼠学苑教研团队,此团队由来自百度、阿里、华为、头条、小米、新浪、58同城等科技企业资深架构师、科学家组成。
5. 典型问题集
以下问题是从之前专场培训中整理出来的、有深度的典型问题(持续更新)。
编号 | 问题 | 领域 | 提出问题时的进度(课程案例) | 是否需要解释性演示子案例 |
---|---|---|---|---|
1 | BP算法如何保证一致性 | 人工智能 | 项目2:基于深度网络的图像识别 | 否 |
2 | BP算法学习速率选择方法与交叉影响因素 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
3 | 为什么不适用泛函等数学工具给出一个适当的解、而是用MLP的训练方式给出模型结果 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
4 | 人脑神经元是分区域的,为什么您的课程里总是强调模型的架构设计 | 人工智能 | 项目2:基于深度网络的图像识别;项目3:大模型的架构原理 | 是 |
5 | 为什么仅仅对MLP权重做正则化 | 人工智能 | 项目2:基于深度网络的图像识别 | 否 |
6 | 使用卷积网络和使用openCV图像处理算法本质上是相同的吗 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
7 | BERT、GPT-3、XLNet的本质区别是什么 | 人工智能 | 项目3:大模型的架构原理 | 是 |
8 | 注意力机制V、K、Q在现实中代表什么,能用案例说明吗 | 人工智能 | 项目3:大模型的架构原理 | 是 |
9 | 注意力机制中位置编码为什么选择sin/cos函数 | 人工智能 | 项目3:大模型的架构原理 | 否 |
10 | TensorVisual中的可视化预测计算和训练计算在什么时间点进行的,需要多大的运算量 | 人工智能 | 项目2:基于深度网络的图像识别 | 是 |
11 | AIGC应用本地端的算力需求 | 人工智能 | 项目1:AIGC大模型的API调用与应用 | 否 |
12 | 数据融合怎么通过大数据技术实现 | 大数据 | 根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案 | 是 |
13 | 我用分布式编程或者并行编程方式也能处理大数据,为什么需要引入一套全新的大数据理论 | 大数据 | 基于传统编程语言的数据分析处理程序的设计与实现(C、Shell、Python、Scala) | 是 |
14 | 机房网络受限怎么加载离线大数据资源,如数据、源码包 | 大数据 | 在三台Linux主机上搭建高可用Hadoop集群 | 是 |
15 | 大数据集群的架构优势、高可用怎么验证 | 大数据 | 在三台Linux主机上搭建高可用Hadoop集群 | 是 |
16 | 如何从应用角度看大数据生态圈中的组件的功能和作用 | 大数据 | 根据开源大数据生态圈选配部分组件框架设计大数据学科课程体系的方案 | 否 |
17 | 数据仓库建模理论是什么、ODS/DWD/DWS/DWT/ADS层的实际意义是什么 | 大数据 | 基于电商大数据集的数据仓库建设 | 是 |
18 | 在小数据集时很容易得到六度理论的最终结果、但在您的Flink程序中却只得出了单个节点的结果 | 大数据 | 基于Spark/Flink的社交网络数据分析 | 否 |
19 | 数据和计算都是分布式的,为什么您强调先数据后计算 | 大数据 | 基于Spark/Flink的社交网络数据分析 | 是 |
6. 关于松鼠学苑
早年在南开大学求学时接触开源软件项目并深受开源文化的影响,硕士毕业后的第一份工作主要从事Linux驱动、内核、Boot的开发与裁剪并由此深受开源软件精妙架构的启发,2016年,余海峰先生以个人的名义联合就职于百度、阿里、华为、头条、新浪、58同城等一二线互联网企业以及大型金融机构的资深大数据人工智能资深工程师组建了学术组织松鼠学苑,其目标是推广前沿科技以加快我国的软件科技发展。
以此为契机,松鼠学苑开展了一系列有深度的技术研究工作,如承接基于电信数据的智能语义分析项目、研发HFS(Hadoop From Scratch)平台、开展高端培训与职业教育培训。 在组织大数据人工智能培训班的过程中,松鼠学苑会将近40%的精力投入到实训环境的维护上。当时松鼠学苑给每名学员租用三台云服务器,在学习某个模块(如Hadoop、Tensorflow)之前松鼠学苑会使用Linux脚本将这三台服务器初始化,后来松鼠学苑使用预先编译好的镜像进行初始化以提高效率,但是都会遇到诸多痛点。
经过全面调研,市场上并没有这类问题的成熟解决方案;这期间,微软公司在大力发展Visual Studio Code以替代自家成功占领市场的开发工具Visual Studio XX(如Visual Studio C++),而且有开源团队也在研发网页版的Visual Studio Code,这给解决这类痛点带来了曙光。 于是,2018年,松鼠学苑创始人投入到解决这类痛点的工作之中,经过多次迭代和培训试用检验,松鼠学苑创始人终于研发出了对应的软件平台架构,即She(Squirrel technology higher extensible platform)平台架构。这种松耦合的架构设计规避了培训课程平台与底层平台的相互依赖。
为了方便开展校企合作业务,2019年,余海峰先生在天津注册成立天津精赛科技有限公司。此后,松鼠学苑这个品牌由天津精赛科技有限公司运营。
7. 关于She平台
依托松鼠学苑的开放组织架构,天津精赛科技有限公司组建了一只强大的研发队伍。这只队伍用三年时间的打磨,完成She平台核心代码16000万行、周边代码68900万行、65个核心子系统、5篇核心设计方案、2篇深度研究报告,不仅支撑起She平台C端版本(She平台包括两个版本,C端版本部署在松鼠学苑的公有云上、面向相关领域从业者提供学习培训任务,高校版本通常部署在高校机房、为大中专院校提供学科教研实训)的高并发运行。快速响应能力、无缝升级能力、一键式部署能力、多种学习环境架构需求响应能力,都成为C端版本取得成功的核心因素。
在2021年上半年,松鼠学苑加大投入,为众多高等院校开放C端版本,解决了这些高校经费紧张的难题。在天津,与中国天津职业技能公共实训中心合作,松鼠学苑承担了天津市高校大四年级学生的计算机类学科实训任务;与多所高校合作,部署She平台、导入大数据人工智能课程、本科硕士毕业学生论文指导、客座教授、共同承担项目。在云南、山东、浙江、广东,松鼠学苑和50所高校开展大数据人工智能学科建设合作,She平台的强大功能和优秀的易用性取得了高校的一致认可。
以计算机学科培训和教研平台为主营业务,松鼠学苑积淀了丰富的计算机类学科建设和教学经验。截至2023年8月份,松鼠学苑共开展大数据集训营79期、 JavaEE集训营65期、NLP与深度学习集训营22期、大学生实训450期、高端企业培训32场、线下师资培训62期、线上师资培训10期。这些经验是松鼠学苑能够从容从事计算类学科建设的核心资产,也是松鼠学苑能够和体量庞大企业竞争的底气。
此外,借助于全球首创的大数据人工智能教研平台She,松鼠学苑解决了计算机类学科、特别是大数据人工智能学科教学实训的诸多痛点,这些经验和原创可以提升学科实验室的学术高度、打造专属的学科特色。
松鼠学苑假期(集中式)师资培训邀请函
一、 学习收获
1.掌握大数据+、云计算、智能+方向学科课程设计方案,以快速启动这类学科的教研任务落地。
2.收获大数据+、云计算、智能+方向学科实验实训案例。
3.洞悉大数据+、云计算、智能+方向教研平台的类型、特点及其选用的方法。
二、 开课信息
1、开班时间及费用
开课时间:2023年8月2日-2023年8月6日。
费用:培训费、资料费、环境使用费:5800元/人。
2、付款方式
方式1:点击链接微信支付到企业账户(请在备注中注明姓名和手机号),关注公众号“松鼠学苑”,点击右下角“关于我们”,找到并点击“微信支付”付费。请注意,商户名称为“松鼠学苑”。
方式2:对公账户转账,账户信息如下,
3、教学助理联系方式:
4、注意事项:
参加培训老师仅需配备一台安装最新版本Chrome浏览器的计算机即可,对计算机的性能没有要求(使用我们的云资源完成所有操作)。
5、正式邀请函(盖章版):
6、师资培训回执表(集体报名):
7、关于证书
我们证书有两类:
-
一类是以松鼠学苑为发证单位的学术型证书。
-
一类是工信人社为发证单位的认证型证书,这类证书需要较高的费用(不包含在培训费内)。
三、 课程内容
四、 师资团队
余海峰,近20年IT行业工作经验,松鼠学苑创始人、天津精赛科技有限公司CEO&CTO,大数据与人工智能领域高级研究员;主持建设松鼠学苑大数据平台HFS,主持开发大数据人工智能教研平台She,国内外首创Docker容器化大数据人工智能教研集群,首创非侵入式数据共享技术;主持建设央行应收账款系统,主持架构个人征信大数据分析与建模系统;著有《深入理解Flink: 实时大数据处理实践》一书、CSDN热销技术课程《Spark快速大数据处理》;多家培训机构和高校特邀讲师。
所有课程素材均来自松鼠学苑大数据与云计算教研组,其中松鼠学苑教研组由来自百度、阿里、华为、头条、新浪、58同城等一二线互联网企业资深架构师组成。
五、 项目简介
项目1:PB级数据处理
项目背景与研究内容:C、Shell、Python、Scala的大规模数据处理程序的执行效率对比分析,引出大规模数据处理方法论变革的软硬件动因,并反向实证大数据变革的技术驱动;大数据底层编程语言MapReduce的设计思想;以需求为导向阐述大数据集群结构与大数据生态体系。
项目2:复杂社会网络的研究
项目概要:大数据存储与大数据处理技术的推动,人类个体的选择愈发依赖于数据所揭示的成功道路的指引。从事科研,借助于论文大数据,通过相互之间的引用关系网络,我们能透析研究方向和进入时间点与成功之间的内在关系;借助于六度分隔理论,我们可以理性认知“世界真小”、尚未成功并不是因为缺少关系网;通过股票市场指标的变化,我们可以建模反推个体的决策偏好,降低盲从的代价。
我们以Flink/Hive/Hadoop集群作为数据处理的工具,以计算图作为程序设计理论,以实际计算的结果印证复杂社会网络的研究结论,而不是一系列美妙的心灵鸡汤。
项目3:基于深度网络的图像识别
项目概要:谈起人工智能,广场舞大妈都能说出一系列人工智能对社会的推动案例、并能谆谆教导年轻一代好好学习科学知识;但人工智能的原理,特别是深度神经网络的原理是不是那么高不可攀,很多人未必能够厘清。
我们以TensorFlow为深度神经网络训练工具,以各类可视化图像为基础,抽丝剥茧,感性认知人工智能,并基于此做出对人工智能发展方向的准确判断。





