大数据与计算智能赛事汇集

大赛介绍

CCF大数据与计算智能大赛(CCF Computing Intelligence Contest,简称CCF BDCI)是由中国计算机学会于2013年创办的国际化智能算法、创新应用和大数据系统大型挑战赛事,是全球大数据与人工智能领域最具影响力的活动之一。

经连续六届成功举办,共吸引了来自全球25个国家,1500余所高校及科研院所,1800余所企事业单位的60000余人参加。CCF BDCI大赛权威度高,专业性强,创新成果突出,产学研结合紧密,已经成为中国大数据及人工智能赛事旗帜。

2019年,第七届CCF BDCI大赛不忘初心,锐意创新,以“数据驱动,智创未来”为主题,以前沿技术与应用问题为导向,立足国际化、规模化,致力提升技术应用水平,为社会发现和培养高质量数据人才,推动大数据产学研生态发展。

赛题发布

/ 可同时选择多道赛题参赛 /

A. 算法赛道

针对某场景或行为,对特定指标优化

01

赛题名称:《基于OCR的身份证要素提取》

出题单位:兴业银行

赛题奖金:¥10万

技术方向:分类预测, 数据挖掘

赛题背景:市面上的身份证识别模型,尚不能满足银行质量参差的影像识别需求,一个具备强抗噪声干扰能力的OCR模型有着极高的商业价值。

任务描述:根据训练数据,设计针对商业银行身份证识别的OCR系统,识别身份证中姓名、地址、身份证号码和身份证有效日期等信息。

02

赛题名称:《离散制造过程中典型工件的质量符合率预测》

出题单位:西门子

赛题奖金:¥10万

技术方向:分类预测, 数据挖掘

赛题背景:生产质量管理中,通常基于对潜在的相关参数及历史生产数据的分析,完成质量相关因素的确认和最终质量符合率的预测。

任务描述:要求参赛者对给定的工艺参数组合,所生产工件的质检标准符合率进行预测。

03

赛题名称:《乘用车细分市场销量预测》

出题单位:深瞳云涂

赛题奖金:¥10万

技术方向:预测回归, 数据挖掘

赛题背景:消费者购车决策的过程正从线下向线上转移,找到消费者在互联网上的行为数据与销量之间的相关性,可为汽车行业带来更准确有效的销量趋势预测。

任务描述:要求参赛者根据给出的32款车型,在15个细分市场的24个月销量数据,建立销量预测模型,预测同一款车型和相同细分市场在接下来连续4个月份的销量。

04

赛题名称:《金融信息负面及主体判定》

出题单位:国家互联网应急中心

赛题奖金:¥5万

技术方向:情感识别, 自然语言处理

赛题背景:如何从海量的金融文本中快速准确地挖掘出关键信息,成为了投资者和决策者重点考虑的问题之一,在风控和舆情分析等领域有很大现实意义。

任务描述:要求参赛者根据数据训练模型,判定金融文本中是否包含金融实体的负面信息,若包含,判断负面信息的主体对象是实体列表中的哪些实体。

05

赛题名称:《互联网金融新实体发现》

出题单位:国家互联网应急中心

赛题奖金:¥5万

技术方向:命名实体识别, 自然语言处理

赛题背景:金融实体识别方案的建立,将极大提高金融信息获取效率,从而更好的为金融领域相关机构和个人提供信息支撑。

任务描述:要求参赛者从提供的金融文本中识别出现的未知金融实体,包括金融平台名、企业名、项目名称及产品名称。

06

赛题名称:《视频版权检测算法》

出题单位:爱奇艺

赛题奖金:¥5万

技术方向:目标识别, 图像处理

赛题背景:当前的侵权行为出现多样化及规模化特点,侵权视频多经过复合变换,为保护视频制作公司及原创者权益,需要通过自动化方式进行针对短视频的侵权行为检测。

任务描述:要求参赛者找到短视频的原始长视频,计算出对应的时间段,过程中可能包括视频解码抽帧、视频或图像特征及指纹、视频相似检索等相关算法及技术方案。

07

赛题名称:《“技术需求”与“技术成果”项目之间关联度计算模型》

出题单位:八六三软件

赛题奖金:¥5万

技术方向:关系挖掘,自然语言处理

赛题背景:根据项目信息的文本含义,为供需双方提供关联度较高的对应信息,是中国·河南开放创新平台的一项功能需求。

任务描述:要求参赛者发现好的方法、算法或模型,应用于平台模拟人工,实现“需求——成果智能匹配服务”。

08

赛题名称:《互联网新闻情感分析》

出题单位:中移软件

赛题奖金:¥2万

技术方向:自然语言处理,机器学习

赛题背景:面对浩如烟海的新闻信息,精确识别蕴藏其中的情感倾向,对舆情有效监控、预警及疏导,对舆情生态系统的良性发展意义重大。

任务描述:要求参赛者在庞大的数据集中,精准的区分文本的情感极性,情感分为正中负三类。

B. 系统赛道

针对制定数据或环境,提升系统优化能力

09

赛题名称:《基于大数据的查询优化》

出题单位:阿里云

赛题奖金:¥21万

技术方向:性能优化, 数据库

赛题背景:在查询分析系统中,IO和执行是两个最大的性能瓶颈,随着新硬件近几年的蓬勃发展,使用新硬件解决这两个问题逐渐引起重视。

任务描述:给定数据集,三张表 customer、lineitem和orders,分别行数为150000,600037902和150000000。输入参数为多个变参组合,要求对每个组合,都能给出正确的结果。

10

赛题名称:《多人种人脸识别》

出题单位:蚂蚁金服

赛题奖金:¥5万

技术方向:性能优化, 人脸识别

赛题背景:人脸识别技术在实际应用中在不同人种的性能有差异。如何快速的提升人脸识别系统在不同人种的性能, 是一个实用的人脸识别算法应该考虑的问题。

任务描述:要求结合一个给定的模型 (InsightFace), 提高该模型在一个给定人种上面的人脸识别性能。

11

赛题名称:《三角形图计算算法设计及性能优化》

出题单位:服务计算技术与系统教育部重点实验室 & 费马科技

赛题奖金:¥5万

技术方向:性能优化, 图计算

赛题背景:大数据时代,对关联(图)数据的处理被广泛应用于社交网络、智能交通、移动网络等领域。对图数据的三角形计数被广泛应用于图数据的特征描绘、社区结构检索、子图匹配、生物网络等应用。

任务描述:在给定服务器平台,以及数据集上实现三角形计数(Triangle Counting,TC)算法,调试并获得最高的性能。三角形的定义是一个包含三个顶点的子图,其中顶点两两相连。

C. 方案赛道

自由发挥创意,考察应用价值

12

赛题名称:《海口市-交通流量时空演变特征可视分析》

出题单位:滴滴出行

赛题奖金:¥2万+资助参与国际会议

技术方向:数据可视化, 数据挖掘

赛题背景:海口是一座拥有旖旎风光的南方滨海城市。作为国内重要的旅游城市,无论是市内通勤还是前往三亚及周边,海口城市交通主要依赖于四通八达的路面交通。

任务描述:分析2017年5月1日-10月31日海口市的交通需求演化情况及出行变化最显著的3个特征。并根据上述数据分析,为市民或城市交通管理部门提供建议。

13

赛题名称:《企业网络资产及安全事件分析与可视化》

出题单位:奇安信

赛题奖金:¥2万+资助参与国际会议

技术方向:数据可视化, 数据挖掘

赛题背景:在企业的高速发展过程中,信息化建设起着非常重要的支撑作用,网络是任何信息化建设的基础,必须要保证企业网络的安全与稳定。

任务描述:近期某企业重要系统被攻击,导致重要数据发生泄漏,请基于该企业内部正常网络日志数据,给出可视分析方案,对企业内部的网络资产进行发现和分类,并给出资产之间的通信模式,对该网络安全事件的攻击过程进行描述。

D. 训练赛道

锻炼基础能力,辅助高校教学实践

14-20

赛题一:中国人民大学,《时间序列多步预测》

赛题二:中国人民大学,《GPU连接优化技术》

赛题三:中科院计算所,《文本实体识别及关系抽取》

赛题四:太原理工大学,《新闻文本中的事件检测》

赛题五:重庆邮电大学,《阿尔茨海默症的识别》

赛题六:重庆邮电大学,《O2O商铺食品安全相关评论发现》

赛题七:基金会中心网,《慈善领域舆情情感分析》

赛程赛制

/ 不要等到下一秒再开始 /

【初赛】可持续报名,下载数据并评测

赛题发布:8月17日

数据发布:8月23日

报名截止:10月22日

大赛初赛:8月17日-10月25日,

每天每队可评测3次

复赛晋级审核:10月26日-10月29日,

以最后一天排行榜为准

【复赛】初赛每道赛题Top50团队晋级复赛

大赛复赛:10月30日-11月11日,

每天每队可评测3次

决赛晋级审核:11月12日-11月22日,

以最后一天排行榜为准

【决赛】复赛每道赛题Top5团队晋级决赛

中国·郑州,11月23日-11月24日

赛题评审、综合大奖评审、数据科学家之夜、

高峰论坛、项目人才交流会、颁奖典礼

奖金福利

/ 热血的数据之战不可辜负 /

参赛即送:

凡成功报名大赛任意赛题,且身份为在校学生,

每人即送价值125美元的AWS云计算资源;

初赛激励:

优质代码开源、社区分享将瓜分数万元奖池;

每道赛题每周评选周冠军、幸运团队,kindle等奖品送不停;

大赛积极推荐人可获得iPad Pro;

复赛入围:

任意一道赛题进复赛即获得合作单位招聘绿色通道,

复赛入围团队可获纪念品礼包;

复赛入围即可领权威认证的电子证书;

决赛入围:

总奖金100万元,除单赛题奖金外,另有CCF大奖;

证书由教育部教指委、CCF共同颁发,大赛主席院士签名;

有意向创业的团队,由郑州、知名投资机构等孵化扶持;

优秀组织单位及指导老师,将特别激励;

注意:大赛期间有持续追加奖金激励。

组织单位

/ 政产学研媒强强联合 /

指导单位:教育部高等学校计算机类专业教学指导委员会、国家自然科学基金委员会信息科学部、郑州市人民政府

主办单位:中国计算机学会(CCF)

承办单位:郑州市郑东新区管理委员会、教育部易班发展中心、CCF大数据专家委员会、大洋洲计算机研究与教育协会、数联众创

独家战略合作:中原银行

赛题合作:兴业银行、西门子、阿里云、深瞳云涂、国家互联网应急中心、爱奇艺、八六三软件、虹软、蚂蚁金服、费马科技、中移软件、滴滴出行、奇安信、基金会中心网

协办单位:信息技术新工科产学研联盟、CSIAM大数据与人工智能专委会、CCF中文信息技术专业委员会、 CCF数据库专业委员会、CCF高性能计算专业委员会、CCF人工智能与模式识别专业委员会、CCF区块链专业委员会、中科院计算所大数据研究院、中关村大数据产业联盟、深脑链

合作媒体:中央广播电视总台、人民日报、新华社、中新社、科技日报、凤凰网、香港卫视、中国国际教育电视台、郑州日报、腾讯媒体、搜狐媒体、网易媒体、Datawhale

官方竞赛平台:DataFountain

评审专家

/ 顶尖大咖助力参赛 /

大赛指导委员会主席

梅 宏,中国科学院院士、中国人民解放军军事科学院副院长

李国杰,中国工程院院士、中科院计算所研究员

倪光南,中国工程院院士、中科院计算所研究员

徐宗本 中国科学院院士、西安交通大学教授

吴建平,中国工程院院士、清华大学教授

管晓宏 中国科学院院士、西安交通大学教授

大赛工作委员会

赛题委员会

朱文武,清华大学计算机系副主任陈继东,蚂蚁金服全球可信身份平台ZOLOZ亚洲区总经理
程学旗,CCF大数据专家委员会秘书长

评审委员会

崔 斌,CCF数据库专业委员会秘书长赵东岩,CCF中文信息技术专业委员会秘书长张云泉,CCF高性能计算专业委员会秘书长

仲裁委员会

武永卫,教育部计算机类专业教学指导委员会秘书长
于 剑,CCF人工智能与模式识别专业委员会秘书长
祝烈煌,CCF区块链专业委员会秘书长

国际交流委员会

周晓方,澳大利亚昆士兰大学教授

创业合作委员会

魏宁娣,郑东新区管委会副主任代予龙,郑东新区智慧岛管委会副主任王元卓,中科院计算所大数据研究院院长吴吉义,浙大网新百橙执行董事

大赛特邀专家

(按姓氏拼音首字母排序)

陈学斌,华北理工大学教授

陈跃国,中国人民大学教授

邓 波,军科创新院人工智能中心副主任研究员

冯 程,西门子高级研究员

冯一帆,深瞳云涂技术副总裁

郭嘉丰,中国科学院计算技术研究所研究员

何洁月,东南大学教授

贺 敏,国家互联网应急中心副处长

扈 浩,中原银行技术总监

黄宜华,南京大学教授

季统凯,中科院云计算中心主任

蒋 斌,湖南大学计算机系主任

李飞飞,阿里巴巴集团副总裁

李肯立,湖南大学教授、国家超级计算长沙中心主任

林 恒,费马科技联合创始人

林鸿飞,大连理工大学教授

卢惠林,无锡商业职业技术学院研究所所长

卢亿雷,精硕科技集团高级技术副总裁兼nEqual首席技术官CTO

罗圣美,星环科技研究院院长

马 帅,北京航空航天大学教授

彭绍亮,国家超算长沙中心副主任

全 兵,苏研人工智能方向研发负责人

邵蓥侠,北京邮电大学教授

石宣化,华中科技大学教授

宋怀明,中科曙光首席科学家

谭 昶,科大讯飞大数据研究院副院长

谭光明,中国科学院计算技术研究所研究员

王 莉,太原理工大学教授

王 璐,基金会中心网副总裁

王 新,复旦大学教授信息办主任

王 鑫,天津大学智能与计算学部人工智能学院副院长

王健宗,平安科技大数据部高级产品总监

王静远,北京航空航天大学副教授

王志军,中国联通信息化部副总经理兼数据中心总经理

向 阳,同济大学电信学院党委副书记

徐 巍,蚂蚁金服高级算法专家

徐睿峰,哈尔滨工业大学教授

许 威,兴业银行信息科技部综合规划处处长

杨 兵,滴滴出行高级产品经理

余 珂,爱奇艺高级总监

袁晓如,北京大学教授

翟为唐,八六三软件董事长

张 民,苏州大学教授

张 卓,奇安信集团副总裁

张清华,重庆邮电大学计算机科学与技术学院院长

张仰森,北京信息科技大学教授

周浩杰,江南计算技术研究所副主任

朱小飞,重庆理工大学教授

组织单

报名参赛

点击阅读原文或扫码报名

参赛对象:

不限国籍、年龄、身份,

不管是高校学生,还是职场团队,

只要热爱大数据及AI技术,

都可参赛报名。

大赛官网:

网页链接

报名请扫码:

更多内容请关注:

雪球转发:0回复:0喜欢:2