讲座内容整理:应用驱动的数据科学与工程研究与人才培养

算法模型与底层的基础设施(计算平台)是相对应的,一个好的算法模型需要有好的基础设施支撑

1、背景:传统的IT企业——以IBMRACLEEMC(简称IOE)为代表;卖硬件;卖软件;卖服务;   IT产业萧条——2007-2008年经济危机;‘斯诺登事件’;去IOE;“甲方乙方”方式的变革;效率低;沟通成本高;     互联网产业——云计算(eg.Salesforce);开源系统(eg. MySQL, Hadoop...);免费服务(“羊毛出在猪身上狗来买单”);“垂直型”应用;

信息技术的浪潮都联系着国家政策

2、案例:社交媒体数据分析——Web数据研究集群行为;数据爬取;热点分析;传播分析;营销和水军分析

知识图谱及其应用——社交媒体用户画像;在线集群行为资源库;企业知识图谱(分析企业与企业、企业与个人之间的数据);Talent Net

位置服务————通过位置的定位,去除不必要的路线,点化人员的位置,可用于交通人流疏导、公共服务设置(比如确定公共厕所的位置)、商店选址

智慧物流——物联网状态感知/物流要素数字化;互联网数据互联互通/物流环节有序互通;大数据驱动智能化应用/调度运营数据驱动;多系统对接、联通、整合;7*24服务;了解用户结构的变化;体验差异化;将用户需求碎片化;如车辆线路大数据分析;平台司机在线评分系统;平台货源实时分析;平台司机驾驶行为习惯分析系统;

在线教育——如计算机科学实训云平台

区块链与分享型数据库——智能仓单区块链平台,数据实时同步节点分布式接入

支持互联网级关键任务的分布式数据库——运用于商业银行,建立历史库系统(海量数据存储,大规模高并发查询系统)、供应链系统(复杂交易的流程类应用)、网银&贷记卡授权系统(有效应对双十一等现象级核心交易负载冲击)

3、趋势:科学研究的第四范式——实证范式(Empirical Paradigm——describing natural phenomena)、理论范式(Theoretical Paradigm——using models,generalizations)、计算范式(Computational Paradigm——simulating complex phenomena)、数据范式(Data-Intensive Paragigm)

4、人才培养:培养目标——造车人|高端网信人才(系统架构师、数据科学家、算法和系统工程师)                                                                                                                          知识结构——化学|生物融合的交叉学科(计算机+应用数学/统计+信息系统(领域应用))                                                                                                                课程设计——实践驱动|螺旋式上升(加强应用数学训练,精简计算机课程,注重系统理念培养)                                                                                                        教学特色——站在用户角度,要有Design Thinking(设计思维) 的理念,注重应用

5、数据是最基本的,数据科学与工程的在各行业的诸多应用都是基于大量数据的分析研究,数据与工程是密不可分的,大量的数据只有通过模型算法运用到基础设施(计算平台)上才是有意义的。

相关推荐