2024 年 8 月 7 日 - 10 日,由中国计算机学会主办、中国计算机学会数据库专业委员会和新疆大学承办、新疆 IT 三会等单位协办的第 41 届中国数据库学术会议(NDBC 2024)在新疆乌鲁木齐成功举办。
大会上 PingCAP 联合创始人黄东旭发表了主题演讲,PingCAP 全球教育负责人包光磊在教育分论坛上与高校老师就大模型助力数据库教学以及开源人才培养等话题进行了探讨,PingCAP 联合创始人崔秋代表 PingCAP 与中国计算机学会数据库专委会签署了新的框架协议,双方将共同推进“开源数据库领域拔尖创新人才培育计划”。
黄东旭在 NDBC 2024 上的报告,从工业界的视角出发,深入探讨了近 10 年来数据库内核技术的演进趋势。他分享了自己作为开发者和软件工程师的独到见解,分析了存储技术的变化、数据结构的演变以及分布式系统的挑战,并展示了 TiDB 的设计思路和架构优势,以及如何应对这些挑战。
包光磊在教育分论坛上同清华大学、人民大学、东北大学、国防科技大学等高校老师共同探讨大模型如何助力数据库教育,以及 Talent Plan 如何通过开源的方式培养开源内核数据库人才。
他在分享中提到,过去学术界也有许多优秀的开源的分布式系统相关课程,如 MIT 开源的 6.824 课程。6.824 采用了 lectures -> papers -> exams -> labs -> project(optional) 的构成逻辑,在这种逻辑下学习者往往无法从 lecture 和 paper 的学习中找到重点;同时,缺少工程支撑,学习者会对分布式系统工程应用感到陌生。
Talent Plan 是一个专为高校学生设计的分布式数据库和分布式系统内核开发课程,在设计时针对以上潜在的困难进行了有针对性的优化,逻辑是从工程开始的:学习者第一步先要明确自己要做什么(一个分布式数据库系统);之后学习者学习导学课程,理解项目中贯穿的知识点、难点和对应的论文要点;此时,学习者开始带着明确的目的性去研读论文;最后,学习者投入到项目的开发中,实现完全工业化的分布式数据库系统。
分享中他详细展示了 Talent Plan 的课程结构、学习方式和案例分析,强调了项目实践、讲座、论文阅读和编码实践在学生技术能力培养中的重要性。Talent Plan 已经在中科大、华中科大、华东师大等高校成为研究生、博士生的推荐课程,并在全球 250 多所高校中推广,每年培养近 1000 名数据库内核人才。
此外,他还介绍了 TiDB.ai,一个基于知识图谱的对话知识库工具,为学习和使用 TiDB 提供了智能化的辅助,探讨了 AI 时代数据库教学的更多可能性。
开源已经成为推动全球创新的重要力量,无论是在系统、大数据、AI、大模型的发展上,开源都已经成为一支不可或缺的重要力量。随着大数据、云计算、人工智能等技术的快速发展,开源数据库的应用场景不断拓宽,其重要性日益凸显。然而,尽管开源数据库在数据库行业中占有举足轻重的地位,但开源及数据库内核人才的短缺却成为制约行业发展的瓶颈。这一矛盾现象,即开源数据库的广泛应用与专业人才的不足,构成了当前数据库行业面临的主要痛点。鉴于此,基于新一届 CCF 数据库专委会的工作计划安排,PingCAP 提出依托 CCF 数据库专委会,结合 Talent Plan 项目的成功经验,设立并推动“开源数据库领域拔尖创新人才培育计划”,以人才培养为核心,建立开放、共享、协作的开源数据库学习型社区。
崔秋表示,此协议的签署标志着双方将致力于通过构建开放共享的数据库技术社区,汇聚高校、企业及社区资源,共同培养数据库内核研发人才,促进知识交流和技术创新,推动中国乃至全球数据库技术创新和应用的发展。