数据科学与大数据技术本科专业人才培养方案


    一、专业介绍

    数据科学与大数据技术专业设立于2018年,是涉及计算机、数学、统计学等多学科,服务于自然科学、人文科学融合的交叉学科,主要研究社会数字化转型与升级建设中信息的采集、预处理、存储、挖掘、分析、可视化等问题,授工学学士学位。现有专职教师23名,其中教授2名,副教授10名,占比52%;博士8人,占比35%;在读博士4人,占比17%。本专业拥有的实验条件包括数据科学与大数据技术实验室、网络工程实验室、计算机软件技术实验室等,实践课程开出率100%。

    二、培养目标

    (一)培养目标

    本专业培养面向国家、行业和区域经济发展需求,具备人与自然和谐共生理念、扎实的基础理论和专业知识、良好的政治素质、道德修养与社会责任感,德、智、体、美、劳全面发展,掌握数据科学全生命周期所涉及的各种基础理论和工具,具备大数据应用研究与开发技能,具备深度数据分析和数据挖掘算法设计与工程化能力,能够在互联网、经济、金融、地质等相关行业从事大数据系统的研究、开发、部署与应用等工作的高级复合型人才。

    (二)培养要求

    本专业毕业生在知识、能力和素质等方面应达到如下要求:

    1.知识要求

    ① 具备数学、自然科学、计算机科学基础知识、以及大数据工程专业知识,用于描述和分析大数据系统、大数据应用工程、大数据科学研究等相关复杂问题;

    ② 了解国家发展战略规划、产业政策、法律法规,正确认识、理解、评价大数据工程对经济、社会、环境、健康、安全、文化的影响,保持经济增长、社会和谐、环境友好的协调发展。

    2.能力要求

    ① 具有对大数据系统、大数据应用及相关复杂工程问题进行建模、设计、分析、研究、验证等工程综合知识和实践能力,并表现出创新意识;

    ② 熟练运用主流大数据平台(如Hadoop 或Spark)、典型深度学习系统(如TensorFlow),设计、开发、生产面向特定行业的大数据产品;

    ③ 具有分享包容的心态、沟通与协作的愿望、规范化组织与管理意识,能熟练运用一门以上外语进行国际交流,具有较强的口头和书面表达能力。

    3.素质要求

    ① 具有先进中国特色社会主义思想水平、政治觉悟、道德品质,以及科学人文素养、强烈的社会责任感、高尚的社会主义职业伦理观;

    ② 了解信息学科前沿发展趋势,关注本专业与其他学科交叉融合的新理论、新方法和新技术,具有开放意识和全球视野;

    ③ 具有探索新事物的兴趣,能保持上进心、自主学习和持续更新核心知识以适应专业或职业发展的能力。

    预期毕业五年后能够达到以下目标:

    培养目标1:能够适应大数据应用的发展需要,融会贯通数学与自然科学基础知识、计算机科学基础知识、大数据科学与工程专业知识,具备数据思维、数据处理与分析技能、业务驱动能力,对于复杂大数据工程项目能够给出系统性解决方案。

    培养目标2:能够跟踪大数据科学与工程领域的前沿技术,具备一定的大数据工程创新能力、大数据分析与价值挖掘能力,能够从事应用驱动的大数据产品的设计、维护、开发和生产,能够胜任数据工程师、数据分析师或数据科学家的工作。

    培养目标3:具备健康的身心,拥有科学的人文精神、创新创业精神、团队精神,具备良好的人际沟通与协调能力、有效的工程项目管理能力,能够胜任项目经理及企业的中层管理者的工作。

    培养目标4:具备良好的职业道德精神、社会责任感,理解法律、环境、发展的相互关系,在工程项目实施中坚持绿色发展理念,富有山水情怀,能够注重经济与社会效益的协调。

    培养目标5:具有一定的创新意识和国际视野,能够从全局视野思考问题,主动应对不断变化的国内外形势,具备自主学习能力、批判思维能力和职业可持续发展的潜能。

    三、毕业要求

    通过本科阶段学习,毕业生应达到如下的毕业要求:

    毕业要求1:工程知识。能够将数学、自然科学、数据科学基础和专业知识用于解决大数据技术和大数据应用的复杂工程问题。

    1.1掌握数学、自然科学和大数据基础知识,能够正确表述大数据工程领域复杂工程问题。

    1.2掌握数据科学与大数据技术基础知识和专业知识,能够对复杂大数据工程问题进行分析并建模。

    1.3掌握数学、自然科学和大数据专业知识,能够对复杂大数据工程问题进行求解。

    1.4能够运用数学、自然科学、大数据基础知识和专业知识对复杂大数据工程问题的解决方案进行评价与改进。

    毕业要求2:问题分析。能够应用数学、自然科学和工程科学的基本原理,进行抽象、识别、建模、表达,并通过文献研究分析复杂大数据工程问题,以获得有效结论。着重培养学生数据思维能力,即从数据的角度分析问题。

    2.1能够应用数学、自然科学和工程科学基本原理,识别和判断复杂大数据工程问题的关键环节和参数。

    2.2 能够针对大数据工程问题建立合适的模型,清晰地表达和描述复杂大数据工程问题。

    2.3 能够认识到解决问题有多种方案可以选择,并通过相关文献研究分析方案优劣,确定问题的解决方案。

    2.4 能够证实解决方案的合理性,获得有效结论。

    毕业要求3:设计/开发。具备一定的大数据工程创新能力、大数据分析与价值挖掘能力,能够从事应用驱动的大数据产品的设计、开发和生产。

    3.1 针对大数据相关领域的复杂工程问题,能够根据用户需求确定设计目标和可行性解决方案,并形成规范文档。

    3.2 能够按照设计方案要求搭建系统集群开发、运行环境,并能根据系统要求对环境进行系统调优。

    3.3 能够按照设计方案要求开发满足特定需求的软件系统,并能够分析系统的主要功能、性能、存在问题以及给出进一步优化的方案。

    3.4 能够在软件系统设计和开发过程中具有创新态度和意识。

    3.5 能够在软件系统设计和开发过程中综合考虑经济、社会、健康、安全、法律、文化、环境等因素。

    毕业要求4:研究。能够融会贯通数学与自然科学基础知识、计算机科学基础知识、大数据科学与工程专业知识,对于复杂大数据工程项目能够进行合理研究,包括设计实验、采集、清洗、分析、挖掘和可视化数据,并通过信息综合给出有效结论和系统性解决方案。

    4.1 掌握计算机软硬件、计算网络、大数据科学与工程专业知识,能够基于数据科学与大数据技术知识和方法对复杂工程问题进行研究和分析。

    4.2 能够运用数据科学与大数据技术学科相关原理和专业知识建立模型,设计可行的方案并实施。

    4.3 能够利用合理的数据采集、数据清洗、数据分析、数据挖掘、数据可视化方法和工具,对采集到的数据进行存储、清洗、处理、分析、挖掘和可视化,并能通过信息综合得到有效结论,指导业务的持续改进。

    毕业要求5:使用现代工具。能够针对工程领域复杂工程问题,使用、选择与开发恰当的计算机技术、资源、现代工程工具和信息技术工具,包括对复杂工程问题的预测与模拟,并能够理解其局限性。

    5.1 能够针对复杂大数据工程问题,掌握获取技术、资源、平台环境和开发工具的能力。

    5.2 能够根据大数据工程问题的应用场景,选择和使用恰当的技术、资源、开发环境和工具,解决复杂大数据工程问题。

    5.3 针对复杂大数据工程问题,能够选择和利用恰当的工具,对问题进行建模、分析、预测和模拟,并理解其局限性。

    毕业要求6:工程与社会。利用数据科学与大数据技术工程领域相关背景知识,合理分析和评价专业工程实践和复杂工程问题的解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。

    6.1 具有大数据工程实习和社会实践的经历。

    6.2 了解数据科学与大数据技术工程专业领域相关的技术标准、知识产权、产业政策、法律法规。

    6.3 能够客观分析和评价复杂大数据工程问题解决方案的实施对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。

    毕业要求7:环境与可持续发展。在工程项目实施中坚持绿色发展理念,能够注重经济与社会效益的协调。能正确理解和评价针对复杂工程问题的工程实践对环境和社会可持续发展的影响。

    7.1 具有人与环境资源和谐发展理念。

    7.2 能够理解环境保护和社会可持续发展的必要性和现实意义,理解和评价大数据实践对环境和社会可持续发展的影响。

    毕业要求8:职业规范。具备良好的职业道德精神、人文社会科学素养、社会责任感,富有山水情怀,能够在工程实践中理解并遵守工程职业道德和规范,履行责任。

    8.1 具备良好的人文社会科学素养,能够树立正确的世界观、人生观、价值观。

    8.2 富有山水情怀,具有推动民族复兴和社会进步的责任感,理解社会主义核心价值观。

    8.3 理解数据科学与大数据技术领域相关的方针政策和法律法规,并能够在工程实践中遵守职业道德和规范,履行责任。

    毕业要求9:个人和团队。能够在多学科背景下的项目团队中承担个体、团队成员以及负责人的角色,拥有良好的团队协作精神。

    9.1 能够在团队中发挥作用,独立完成团队分配的工作。

    9.2 具有一定的沟通、交流与表达能力,主动与其他学科的成员合作开展工作。

    9.3 具有一定的组织、协调和管理能力,能组织团队成员开展工作。

    毕业要求10:沟通。能够就工程领域复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文档、陈述发言、清晰表达或回应指令,并具备一定的国际视野,能够在跨文化背景下进行沟通和交流。

    10.1 能够就复杂大数据工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文档、陈述发言、清晰表达或回应指令,正确表达自己的观点和工作成果。

    10.2 具备一定的国际视野,能够了解和跟踪数据科学与大数据技术专业的最新发展趋势。

    10.3掌握一门外语,能够在跨文化背景下进行沟通和交流。

    毕业要求11:项目管理。理解并掌握工程项目管理的理论、方法、工具的使用,具有一定的项目管理能力。

    11.1 能够理解和掌握复杂大数据工程项目管理原理和经济决策方法。

    11.2能够在多学科环境中根据复杂大数据工程项目特征选择恰当的项目管理方法和经济决策方法。

    11.3 能够选择恰当的软件项目管理工具、工程模型,对复杂大数据工程项目进行管理并实践。

    毕业要求12:终身学习。具有自主学习和终身学习的意识和能力,具有不断学习和适应发展的能力。

    12.1 拥有健康的体魄,能够认识自我探索和持续学习的重要性和必要性,具有自主学习和终身学习的意识。

    12.2 能够掌握自主学习和终身学习的方法和技能,了解拓展知识和能力的途径。

    12.3 能够跟踪和了解专业领域的国内外发展趋势,采用合适方法自主学习,主动适应社会发展需要。

    四、毕业要求对培养目标支撑关系表

    1  毕业要求对培养目标支撑关系表

    培养目标1

    培养目标2

    培养目标3

    培养目标4

    培养目标5

    毕业要求1

    毕业要求2

    毕业要求3

    毕业要求4

    毕业要求5

    毕业要求6

    毕业要求7

    毕业要求8

    毕业要求9

    毕业要求10

    毕业要求11

    毕业要求12

    说明:请在对应的表格处打√。

    五、毕业和学位授予条件

    (一)毕业条件

    学生在规定年限内,修完培养方案规定内容,修满第一课堂学分 170 、第二课堂学分 8  ,成绩合格,方可准予毕业。

    (二)学位授予条件

    1.必修课程(不包括信息技术基础、军事理论、军事技能课程)为学位课程。

    2.学位课程( 139 学分)、核心课程( 37.5 学分)成绩及其他条件等达到学校授予学位要求,方可授予学位。

    六、学制、学历与学位

    基本学制:4年,学习年限:3-6年

    学历:本科

    授予学位:工学学士

    七、课程设置

    课程设置见课程和实践教学结构与学分要求表和教学进程计划表。

    课程和实践教学结构与学分要求

     

    (二)教学进程计划



     

    (三)核心课程

    计算机语言程序设计,数据组织与管理Linux系统与应用,当代数据管理系统,python语言程序设计,数据科学与工程的数学基础,数据科学与工程的算法基础,统计方法与机器学习,分布式计算系统,云计算系统

    计算机语言程序设计

    课程代码:        学时:48+24     学分: 4.5

    内容介绍:本课程主要讲授基本数据类型、各种构造数据类型及运算、程序的三大结构、结构化程序设计方法和函数、指针与链表、文件等主要内容,另外从发展角度介绍C++语言,最后介绍程序设计语言的应用。

    实验内容:本实验课程的目的是帮助学生深入理解高级语言程序设计课程中的有关概念;掌握C语言的基本语法知识、程序结构和程序设计方法,提高学生使用高级程序设计语言进行程序设计的能力。实验内容包括顺序程序设计、选择程序设计、循环程序设计、函数的应用、数组的应用、指针的应用、结构体的应用、链表的应用、文件的应用。

    数据组织与管理

    课程代码:        学时:48+24     学分: 4.5    

    内容介绍:本课程要求学生理解数据结构的基本概念及用途。主讲内容:线性表、栈和队列、树和二叉树、哈希、图等常用的基本数据结构的抽象数据类型及其应用,以及查找、内部排序等常用算法。

    实验内容:上机实验分为6个专题,包括:线性表、栈和队列、树与二叉树、图、查找和内部排序。每个专题提供难度不等的实验题目,供学生选择完成。

    Linux系统与应用

    课程代码:        学时:40+24     学分: 4  

    内容介绍:主讲内容包括通信协议基础知识、操作系统基础知识、Linux操作系统应用3个模块。该课程以操作系统管理为主线,围绕网络通信、进程(线程)管理、文件系统、设备管理等管理任务展开,其中通信协议基础知识和操作系统基础知识模块,侧重从概念、原理的角度讲授计算机网络基础及TCP/IP协议、操作系统管理的原理和核心算法,帮助学生理解并掌握操作系统及网络通信的工作原理及相关概念和技术; Linux操作系统应用模块侧重于系统应用及管理,通过讲授Linux常用命令,shell脚本编程,系统服务的配置与管理等内容,帮助学生掌握Linux操作系统管理的应用技术,增强实践动手能力及解决实际问题的能力。

    实验内容:包括Linux命令应用、Linux shell脚本编程、Linux系统编程和Linux服务配置与管理四个部分,其中Linux命令应用主要包括文件管理、账户权限管理、进程管理、软件打包安装、系统日志等内容;Linux shell脚本编程主要包括shell变量、表达式、控制结构、函数及实际应用;Linux系统编程主要利用Linux系统调用进行进程及线程并发程序设计;Linux 服务配置与管理:网络配置、DHCP、DNS、FTP服务配置与管理。

    当代数据管理系统

    课程代码:        学时:48+24     学分: 4.5

    内容介绍:主讲内容包括关系型数据库基础理论知识、关系数据库系统、关系数据库设计、事务处理、数据管理系统的性能扩展(数据库的分库分表、分布式事务、消息队列机制)、文档数据库、键值数据库、图数据库。

    实验内容: 创建数据库及单表查询实验,多表连接查询及嵌套查询实验,排序、数据聚合及分组查询实验,建表、数据插入、数据更新、数据删除实验,索引、视图、存储过程的实验,事务并发控制实验,数据库设计实验、文档数据实验、键值数据库实验等。

    python语言程序设计

    课程代码:        学时:32+24     学分: 3.5

    内容介绍:python是后续课程数据分析与挖掘、统计方法与机器学习与当代人工智能的基础课程。本课程首先介绍 Python的基础知识、基本语法,重点介绍组合数据类型的应用和文件的操作,然后介绍Python的高级应用,包括科学计算基础库NumPy、数据分析库Pandas、数据绘图库matplotlib、文本分词和词频统计、爬虫工具库Requests和Beautifulsoup的使用。

    实验内容:Python三大结构及函数的应用、Python的组合数据类型应用和文件操作、使用NumPy库和Pandas库进行数据处理和统计、使用matplotlib库进行数据可视化、网络爬虫及文本分析。

    数据科学与工程的数学基础

    课程代码:        学时:32+8     学分: 2.5

    内容介绍:通过本课程的学习,使学生在已掌握工科线性代数和概率论与数理统计知识的基础上,进一步深化和提高矩阵理论、概率与信息论的相关知识,掌握优化理论的基础知识,从而培养逻辑思维能力,并着重培养将所学的理论知识应用于数据科学与工程的实际问题建模并解决实际问题的能力。具体的,使学生掌握数据科学与工程中所涉及的向量与矩阵基础、矩阵分解、矩阵计算、向量和矩阵微分、概率基础、信息论基础、概率模型和参数估计、凸优化基础、最优化条件和对偶理论、优化算法等。

    实验内容:利用LU分解求解方程组、利用Cholesky分解方程组的最小二乘解、利用QR分解方法求解方程组的最小二乘解、朴素贝叶斯分类、最速下降法和牛顿法。

    数据科学与工程的算法基础

    课程代码:        学时:24+16     学分: 2.5

    内容介绍:本课程主要介绍数据获取、清洗、管理、分析挖掘和可视化过程中频繁用到的算法,主要涉及流数据处理、图数据处理、高维数据处理算法,特别与算法有关的优化问题求解等。具体的,包括抽样算法、尾概率不等式及其应用、哈希算法、数据流算法、特征值计算、SVD和PCA、矩阵分解、随机游走、EM算法等。

    实验内容:支持网页内容重复检测的爬虫工具(布隆过滤器、局部敏感哈希)、基于Eigenface的人脸识别(特征值计算、奇异值分解、主成分分析)、谁是全球最佳的乒乓球员(哈希算法和随机游走)

    统计方法与机器学习

    课程代码:        学时:40+16     学分: 3.5

    内容介绍:本课程融合常用的统计方法和经典的机器学习方法,从数据科学的角度,系统介绍如何根据不同的数据类型构造合适的模型,并以此获得正确结论。课程内容主要包括方差分析、回归分析、变量选择、聚类方法、判别与分类方法、支持向量机、人工神经网络、决策树与集成学习。

    实验内容:线性回归分析实验、Fisherface实验、数字辨识实验

    分布式计算系统

    课程代码:        学时:56+24     学分: 5

    内容介绍:本课程处于核心数据处理引擎的地位,将注重培养学生“系统架构师”的素养。课程主要致力于帮助学生理解分布式系统的体系结构和核心原理,从而合理地使用这些系统编写基本的应用程序。课程开设的主要内容包括分布式计算系统简介、分布式文件系统HDFS、批处理系统MapReduce、批处理系统Spark、资源管理系统Yarn、协调服务系统ZooKeeper、流计算系统Storm、流计算系统Spark Streaming、批流融合系统Flink、机器学习系统SystemML。

    实验内容:Hadoop部署与HDFS编程、MapReduce编程、Spark部署与编程、Yarn部署使用、Storm部署与编程、Spark Streaming编程、Flink部署与编程。

    云计算系统

    课程代码:        学时:32+16     学分: 3

    内容介绍:云计算糅合了各种技术,针对“大用户”、“大数据”、“大系统”以及“大智能”发展出来的一种新的实现机制,已成为大数据处理与人工智能实现的主要基础设施。云计算既是一种商业模式,也是一种计算范式,还是一种实现方式。学习云计算系统的原理,利用云计算平台解决实际问题是数据专业人才培养的重要环节。本课程从云计算的三大认识角度(商业模式、计算范式、实现方式)、四大关键技术(计算、存储、网络、安全)、四大开发维度(云服务开发流程、云服务基础设施、云服务编排与管理、云服务运维),特别是从云开发的角度,全方位介绍云计算的核心原理与实践方式。课程内容主要包括云计算基础、云计算核心技术、云服务的整体开发流程、云服务的基础设施、云服务的编排与管理、云服务的运维以及云计算进阶技术。

    实验内容:云计算架构实验、Docker容器实践、容器系统的管理与编排实验、容器系统的监控与运维。

    八、课程体系配置流程图

     

    1   数据科学与大数据技术本科专业课程体系配置流程图


    九、课程支撑毕业要求的对应关系表

    4  课程与毕业要求的对应关系表

    课程

    类别

    课程名称

    毕业要求

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    通识教育课程

    马克思主义基本原理

    L

    L

    H

    毛泽东思想和中国特色社会主义理论体系概论

    L

    M

    H

    中国近现代史纲要

    L

    H

    思想道德与法治

    M

    H

    形势与政策

    H

    L

    L

    大学英语

    L

    H

    L

    体育

    H

    大学生职业指导

    L

    M

    H

    创业基础

    L

    H

    M

    环境保护与生态文明/地球科学概论

    L

    H

    自然资源管理概论/环境保护与可持续发展

    L

    H

    军事理论

    L

    M

    H

    专业(大类)基础课程

    新生导论

    H

    L

    L

    高等数学

    H

    M

    L

    线性代数

    H

    M

    L

    概率论与数理统计

    H

    M

    L

    离散数学

    H

    M

    L

    计算机语言程序设计

    L

    M

    H

    数据组织与管理

    M

    L

    H

    M

    算法设计与分析

    M

    L

    H

    M

    Linux系统及应用

    L

    L

    M

    H

    当代数据管理系统

    M

    L

    H

    L

    M

    数据科学与工程导论

    H

    L

    L

    软件工程

    M

    L

    H

    python程序设计

    L

    M

    H

    专业必修课程

    数据采集与预处理

    L

    L

    H

    L

    M

    数据科学与工程的数学基础

    L

    M

    H

    数据科学与工程的算法基础★

    L

    M

    H

    统计方法与机器学习

    L

    M

    M

    H

    分布式计算系统

    L

    L

    H

    L

    M

    当代人工智能

    L

    L

    L

    H

    M

    云计算系统

    L

    L

    M

    H

    Hadoop平台与数据仓库

    L

    L

    M

    L

    H

    深度学习

    L

    L

    M

    H

    专业选修课程

    web前端

    L

    L

    H

    M

    面向对象程序设计

    L

    L

    H

    M

    软件项目开发

    L

    L

    H

    M

    社会计算

    L

    L

    M

    H

    计算机视觉

    L

    L

    M

    H

    自然语言处理

    L

    L

    M

    H

    大数据挖掘与数据分析

    L

    L

    H

    M

    L

    数据治理

    L

    H

    L

    大数据可视化技术

    L

    L

    H

    M

    交叉融合课程

    多元统计学

    M

    H

    L

    M

    金融大数据分析

    L

    H

    M

    L

    统计学

    M

    H

    L

    M

    客户关系管理

    M

    L

    H

    商业分析

    L

    H

    L

    M

    素质平台课程

    革命文化类

    L

    H

    L

    地质科技类

    L

    L

    H

    信息技术类

    L

    H

    M

    外国语言类

    L

    H

    L

    传统文化类

    H

    L

    美学鉴赏类

    H

    L

    身心健康类

    H

    L

    法治法律类

    H

    H

    经济管理类

    L

    H

    创新创业类

    M

    L

    M

    H

    集中实践

    入学教育(军事技能)

    M

    H

    数据结构课程实习

    L

    H

    M

    数据库管理系统课程实习

    L

    H

    M

    M

    分布式计算课程实习

    L

    H

    L

    M

    L

    M

    方向课课程实习

    L

    H

    M

    M

    L

    M

    大数据综合应用实践

    L

    H

    M

    L

    M

    L

    M

    毕业实习

    L

    M

    H

    H

    M

    H

    毕业设计(论文)

    L

    H

    L

    M

    H

    说明:H表示支撑度高,M表示支撑度中,L表示支撑度低。

     

相关信息

  • 导师风采
  • 陈皓天
  • 刘永军
  • 李晰
  • 刘薇
  • 刘雪静
  • 贾楠
  • 邹惠
  • 刘明