2020年10月22日至24日,中国计算机大会CNCC 2020在北京举行,实验室一行10人参加了此次会议。

大数据时代催生出数字经济,各行各业都已经离不开数据,“数据为王”渐渐被人们所接受。2020年10月22日下午,CNCC 2020《“数据为王”的再思考与实践》技术论坛在北京新世纪日航饭店云南厅成功召开。论坛由华中科技大学周可教授主持,邀请了来自数文明科技涂子沛先生、华中科技大学谢长生教授、清华大学李国良教授、华为存储与机器视觉技术开发部孙凌翔部长和腾讯用户研究与体验设计部陈妍总经理,共同探讨数据给我们社会带来的深刻影响。
第一位作报告的是来自腾讯公司的陈妍女士,她从市场的角度来理解数据带来的影响,报告主要围绕着多源数据融合技术的应用研究和平台化思路来展开,结合数据的来源多样性和数据结合的灵活性来进行深入探讨。多源数据在产品规划阶段提供了现有政务系统的满意度研究和政务服务的高频事件研究,在预研版本中支持对用户画像、弱势群体定性调研,新版本发布之前采用新旧系统的眼动测试进行对比研究,在版本发布之后根据媒体的宣传效果量化分析和埋点统计分析,之后持续支持产品的循环迭代,这些都是来自多源数据的赋能。在投资研究领域,多源数据已经取得了显著的成果,多源数据的交叉验证能够显著提高信度和效度。

第二位作报告的是涂子沛先生。作为大数据领域的著名作家,他结合数据智能给出了两个案例,一个是发生在浙江绍兴的“碰瓷”事件,办案人员把有民众收集鳝鱼血的情报与一起卡车“碰瓷”案件关联起来,最终成功破案;另一个是“911”事件。涂子沛通过这两个案例引出了数据智能的概念,并认为数据之间的关联可以产生巨大的价值,且目前人工智能的核心就是数据智能。涂子沛介绍的另一个内容是城市大脑。早在100年前,这一概念就出现在了英文资料中。2016年以来,人们对城市大脑的关注度逐渐提高。人们认为摩天大楼就是城市的大脑,现如今,人们则认为城市大脑是“系统之系统”,是可以智能指挥各个系统的核心层。在报告中,涂子沛回顾了城市大脑概念的发展与演变,并且基于现阶段建设概况,阐述了建设城市大脑的实现技术与步骤。

第三位出场的是一直耕耘在学术前沿的谢长生教授。长达40年的奋斗与感悟,使得谢老师以《万物皆数》为题,从哲学的高度讲解对数据的理解。谢老师指出在认识自然的体系上,钱学森提出哲学、科学、技术、应用四个层次,和两千多年前我国的道家提出的“道、法、术、器”四个层面是高度契合的。但我国长期在“术、器”层面高度发达,而在“道、法”层面十分缺乏,尤其缺乏科学思维。科学革命后,我国表面上看起来也是数字技术(术)发展一日千里,数字应用(器)改变生活方式,但在哲学(道)和科学(法)层面的基础贡献都是西方的。谢长生教授还从哲科的角度定义了三个“万物皆数”的关键词:信息是映射物理空间和思维空间的符号体系,数字是所有信息符号体系中表达能力最强的一种,计算是对数字的序列化操作,可以表达宇宙的一切规律,并从哲科的角度讲解了图灵机智能模式和类脑智能模式。最后谢老师表达了对中国年轻一代可以在哲科层面做出重要贡献的期望。

第四位作报告的是清华大学李国良教授。李老师以《Database meets AI》为题,分别从AI4DB和DB4AI两个角度分别讨论了数据库系统如何应对大数据时代的挑战,提出了支持人工智能的原生数据库系统。首先,AI4DB是将各种AI技术集成到数据库系统中,用来提供自监控、自诊断、自愈、自优化、自安全和自组装功能。其次,DB4AI是指使用声明性语言让数据库提供人工智能功能。李老师还定义了原生数据库系统的五个阶段(AI advised,AI assisted,AI Enhanced,AI Assembled 和AI designed)并给出了详细的介绍。李老师还通过具体例子(比如数据库自动调优、基于深度强化学习的查询优化、基于机器学习的基数估计和自治索引/视图推荐)具体讨论了DB和AI相互结合。最后,指出“Database meets AI”不仅具有挑战性,也蕴含着巨大的机遇。

第五位作报告的是华为的孙凌翔部长,他从存储产品的角度,以《从华为存储看数据》为题,讲述了产业落地和未来规划中对数据期许。孙淩翔指出,随着数据的指数级增长,数据存储逐渐成为 IT 产业中最重要的核心部分。从预研开始,华为存储经过十余年不断积累,逐渐发展成为目前在国际上首屈一指的存储品牌。报告中回顾了研发团队对多源异构数据存储逐渐加深的认识,介绍华为存储在存储产品上的设计思想和方法,并展望了将来数据存储产品的发展趋势。

整场论坛线上线下都吸引了大批爱好者踊跃参与。与会期间,听众们积极提问跟专家们互动。会后许多听众找到涂子沛先生为刚刚拿到的新书签名,找到讲者们合影留恋,并相互交换了联系方式,此次论坛圆满结束。
