2016年,教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办了“中国高校计算机大赛”(China Collegiate Computing Contest,简称C4),目前“中国高校计算机大赛”继续由全国高等学校计算机教育研究会主办。大数据挑战赛是其中的一项重要赛事,在2018-2024年期间均入选全国普通高校学科竞赛排行榜,是国内高校A类赛事,获得社会各界的高度关注和广泛好评。
2025中国高校计算机大赛——大数据挑战赛(以下简称“大赛”)由清华大学、大数据系统软件国家工程研究中心主办。由上海和今信息科技有限公司提供竞赛平台支持。大赛是以实际数据为基础、面向全球开放的高端算法竞赛。大赛旨在通过竞技的方式,提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。
本次大赛聚焦于时间序列数据的建模与预测,通过构建基于真实金融市场数据的任务场景,旨在推动前沿算法在实际复杂环境中的落地应用。时间序列数据广泛存在于金融、交通、能源、医疗等领域,具有强烈的时序依赖性和动态变化特征。股价作为典型的时间序列对象,表现出高波动性、高频率、强非线性和多因素驱动等复杂特性,对建模技术提出了严峻挑战。
本次竞赛选择中国A股市场的股价数据作为研究对象,是基于其高度代表性和数据质量的综合考量。A股市场是中国资本市场的核心组成部分,包含上千家上市公司,涵盖多个行业和市值层级,拥有丰富的历史数据与活跃的交易行为。其股价受宏观经济政策、行业发展、企业基本面、市场情绪等多重因素影响,为时间序列预测模型的特征提取、机制建模、异常识别与动态调整提供了良好的实践平台。同时,A股股价数据在时间维度上既具备微观的高频波动,也蕴含中长期的趋势变化,有助于推动参赛者设计多尺度、分层次的预测方法,提升模型的综合表现。
从更宏观的视角来看,A股市场在中国经济发展与全球资本格局中的地位日益重要。近年来,随着注册制改革的全面推进、新兴科技企业的持续上市、以及资本市场对外开放步伐的加快,A股正逐步从融资市场向资源配置市场转变,承担起更为核心的经济调节与资源优化职能。在国家大力发展数字经济、推动金融科技融合创新的背景下,围绕A股市场构建智能化分析与预测工具,不仅能够服务于投资决策与风险控制,也具有提升金融体系智能化水平、促进技术成果转化的现实意义。
赛题设置
本次大赛题为:基于历史数据预测未来股价涨跌,具体说明详见附件“赛题描述”。
本次竞赛的目标是基于沪深300指数成分股的历史股价数据,通过建立机器学习模型来预测未来股价涨跌幅最大和最小的股票。选手需通过构建模型、训练和调优,预测并输出给定数据后一个交易日沪深300指数成分股的涨跌幅最大和最小各10支股票,以此进行排名。
参赛对象
本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科、研究生)以及科研机构和企业从业人员均可参赛。具体要求如下:
可以自由组队参赛,具体组队要求见后文相关说明;参赛选手应保证报名信息准确有效,如队伍中的选手信息不符合要求,组委会有权取消整个队伍的参赛资格及奖励。
赛制说明
本次大赛分为报名&组队、线上赛和决赛等三个阶段,其中线上赛均由参赛队伍下载数据在本地进行算法设计和调试,并通过大赛报名官网提交结果文件及模型代码;决赛要求参赛者进行现场演示和答辩。
1、报名&组队(5月20日–7月15日)
参赛选手须在竞赛平台报名并且组队参赛(即使单人参赛也要组建单人队伍),大赛不收取任何报名费用。大赛报名系统开放时间为北京时间2025年5月20日10:00,截止时间为北京时间2025年7月15日中午12:00。
报名方式:登录竞赛平台,完成个人信息注册,即可报名参赛;每个选手可单人成队或2-3人组队参赛;参赛队伍(包括队长及全体队伍成员)需要在竞赛平台完成实名认证,未完成认证的队伍将无法参加正式比赛。
大赛官方渠道主要包括:
大赛官网:https://nercbds.tsinghua.edu.cn/bdc.html
报名链接:https://www.heywhale.com/u/2025BDC
大赛邮箱:data@tsinghua.edu.cn
大赛QQ群:762146461 / 901317172
报名截止之后,不再允许添加或更改任何队伍成员。如有中途退出情况,只允许在参赛队伍内部更换队长或删除队员。参赛队伍须应在决赛开始前向大赛组委会提交成员更换申请,由参赛队伍全部成员亲笔签名,经由大赛组委会审核后变更生效。
2、线上赛(5月20日–7月20日)
参赛队伍可从竞赛平台下载数据,在本地进行算法调试,并在线提交结果及模型代码。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。
线上赛A阶段:5月20日10:00 – 7月18日20:00,每个参赛队伍每天可以进行2次结果提交,系统立即进行评测并返回成绩。排行榜实时进行更新,将选择参赛队伍在本阶段的历史最优成绩进行排名展示。请确保结果可复现。线上赛B阶段:7月19日 – 7月20日23:59,每个参赛队伍提交整理好的模型代码,要求详见“代码规范”文档。线上赛C阶段:7月28日开始,系统将在7月28日20:00更换训练数据和推理数据,并运行选手模型代码获得结果文件进行计算排名展示。
线上赛结束后,排名前70名的参赛队伍以及排名在71-110之间前30支学生队伍将进行代码审核。组委会将审核并剔除没有机器学习算法贡献的队伍,并取消存在违反比赛规定队伍的比赛资格,空缺名额不再替补。所有通过审核的队伍将获得线上赛名次证书。
3、决赛(8月中下旬)
决赛将以现场答辩会的形式进行,具体要求和安排另行通知。受邀参加决赛的选手在决赛期间的食宿由大赛组委会负责,其他费用自理。
奖项设置
大赛的奖金池总额为5万元人民币,所有奖金均为税前金额。
1、线上赛奖项(以大赛官网线上赛最终排行榜为准)
线上赛通过代码审核的100支队伍将颁发线上赛名次证书。
2、决赛奖项(以大赛官网决赛结果为准)
3、在校学生队伍奖项
在校学生队伍要求所有参赛队员必须全部为在校学生,如果队伍中有一名在职人员,则整个队伍视为在职人员队伍。其中中国大陆在校学生提供学信网的教育部学籍在线验证报告编号进行身份验证,其余学生提供相关在读证明进行身份验证,在校学籍以2025年5月30日为准。
此奖项仅颁发给在校学生队伍,要求队伍通过代码审核,并根据在校学生队伍成绩的单独排名结果进行颁发。
附件:
① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。