我是从一个小城市出来的,所以接触计算机的时间并不是特别早,中学才开始,当时能用字符敲出几个图案出来,就会很开心了。
21 世纪初 20 世纪末的时候,我选择了计算机视觉这个方向,其实这条路当时并不好走,因为当时计算机视觉还没有清晰的定义,工业界都没有能够去想象视觉能干什么事情。所以当时的选择其实完全是基于自己对这种方向的一个热爱,相较于数据库等其他领域,视觉对我的感官会刺激性更大一点,所以我会有兴趣不断地去优化它、从而做得更好。所以,从博士到教授,我在香港中文大学做了十几年的计算机视觉方面的研究。
现在,我在腾讯优图团队任杰出科学家。腾讯优图是腾讯的核心计算机视觉研究部门。
腾讯内部各个部门的合作是非常紧密的,所以我们团队实际上形成了一个大的联合部门。围绕着视觉这样一个 AI 的核心技术,再发展到互联网,甚至是在其他行业的各个领域。把技术带到千家万户,是其中的重大原则和宗旨。
现在我们围绕两个中心来解决 AI 视觉的问题。
其中一个中心是将我们已有的技术直接拿过来转化成生产力,即一些能给普通用户使用的软件或 App。腾讯公司内部有非常强大的工程团队,我们能够做代码优化,我们能够做各种代码版本的卷积、算法的迭代,所以在公司内部有专门的队伍或人员来负责,我们可以很快地把技术运用到实践中。
另外一个中心是,希望能够利用我们现在对技术层面的一些积淀,比如说对于自然图像的理解,甚至是对语义分割的检测识别等等这样一些非常高端的算法,能够变成在某个场景中可以使用的事情。
其中,智能医疗就是一个非常重要的部分。医疗是一个场景,场景的背后是技术,背后是一套关于图像的语义分割和检测技术。
设想这样一个场景,当我们照了一张胸片,我们希望有一个智能的 AI 的工具能够去分析和诊断,判断是否需要做进一步的治疗,以及医生是否需要介入。
目前,优图医疗 AI 技术对早期肺癌的敏感度(即早期肺癌识别准备率)已达到 85% 以上,并与多家三甲医院展开合作。同时,腾讯优图的眼底模型通过检测患者眼部视网膜照片,可识别出眼部疾病早期阶段可能出现的动脉瘤,将“糖尿病视网膜病变”筛查准确率提升至 96%,几乎接近医生的诊断结果。
要实现这样的场景,前提一定是依赖于我们有非常强大的算法和工程能力,才能为智能医疗开端。
除了医疗上的应用,人脸识别在寻亲上也实现了落地合作。2017 年 3 月,依托腾讯优图人脸识别技术,福建省公安厅“牵挂你”防走失平台正式上线,截止目前已成功找回 681 名走失人员。不仅如此,基于优图实验室的人脸识别技术,QQ 全城助力上线了“人脸寻亲”功能,通过与宝贝回家和民政局的合作,上传被拐照片即可进行检索比对,即时呈现比对结果,帮助他们找到亲人。同时,以腾讯优图实验室跨年龄人脸识别技术为基础,只需要上传走失人口的照片,即可在失踪人脸数据库中进行检索比对,即时呈现比对结果。即使数据库中登记的是走失人口成年后的照片,也能通过跨年龄人脸识别技术根据其儿时照片进行匹配。
类似的场景越来越多,就越能解决和帮助到社会的进步,能让日常生活更加便利。
在公司,除了满足业务上的功能需求和业务目标,我希望当我们的团队足够大的时候,我们能够有一部分同学集中做前沿研究,同时多寻找一些真正对社会和民生有意义的东西去做,我相信这是我的个人价值,这本身也是公司的普世价值所在。