当前位置:首页
>> 科技创新 >> 人才风采

见微知著 讲述数据中的故事

发布日期:2020-08-31 11:10 访问次数: 信息来源:城西科创大走廊管委会
分享:

“超越摩尔定律的发展速度下,计算机的计算速度越来越快,存储越来越大,带宽越来越宽,但是有一个东西几百年来都没变过,你知道什么吗?”这是之江实验室融合智能研究中心副研究员傅四维抛出的问题。这个问题与他的研究方向息息相关,也是之江实验室正在攻坚的技术创新研究领域之一。

 

 

本科时期,傅四维的专业方向是计算数学,毕业论文写的是Helmholtz方程数值解,是偏微分方程的一种。从小就酷爱数学的他,在解Helmholtz方程数值的过程中,为数字之美深深震撼。“一塘池水,我朝水中扔一颗石头,会漾起一圈圈涟漪。我要做的就是在一定误差范围内,近似计算涟漪在时域上的三维轨迹,再把涟漪最终的形态画出来,得到的图像,特别美。”将数值分析的结果可视化出来之后,傅四维直观感受到了数字之美,原来数字可以演化出这么完美的视觉感受。硕士期间,傅四维开启了计算机领域的研究,主攻数据可视化。与本科时用数学画出涟漪一样,数据可视化也是一个把数据具象化的过程。傅四维说:“和可视化的缘分,仿佛是冥冥之中注定的。”“当时计算机还不是热门专业,我个人之前对计算机也并不了解。说实话,我也曾经很迷茫,但是深入研究之后,对计算机有了全新的认识,开始真正喜欢上这个领域。”

 

有些科学研究需要经历漫长的等待,才可能出结果。但数据可视化不同。傅四维解释说:“数据导入进来,通过可视化,我很快就能知道数据里面有什么,呈现了什么样的故事。这种及时反馈给我带来了很大的激励。”2013年,在傅四维读研期间,大数据行业快速兴起,数据可视化的研究前景也随之变得更为广阔。读博期间,他继续主攻这一领域的研究,发表了4篇一作论文。其中,2篇发表在IEEE TVCG(IEEE Transactions on Visualization and Computer Graphics,计算机图形学领域的顶级期刊),还有1篇被人机交互顶级会议ACM CHI收录。

 

临近毕业时,计算机领域开始急速发展,全球科技行业都身处计算机的热潮当中,“当时很多人都想转行做AI,我也在思考,是不是要追随科技行业的大趋势,投身AI,放弃可视化。”在迷茫的关口,傅四维开始思考认知科学和人工智能交叉领域的问题。正如他对文章开篇问题的理解,急速发展的存储和带宽带来了海量数据,而人脑对数据的处理和理解能力在近百年来却没有较大的变化。如何解决信息科学领域最大的瓶颈之一?傅四维认为,数据可视化、可视分析有望为打破瓶颈开辟一条可行的道路。

 

基于这样的判断和理解,傅四维认为,数据可视化领域正处在“黎明前的黑暗”,行业的春天即将来临。再加上对该领域浓厚的研究兴趣,他决定继续数据可视化的研究之路。进入工业界做应用研究?还是在学术界做基础研究?傅四维在毕业季拿到了华为等多个大厂的offer,但他都拒绝了。Do something different.这是傅四维的座右铭。“我希望能思人所未思、做人所未做。科研就是这样,创新是第一要义,永远要做跟别人不一样的事情。”秉持这样的理念,傅四维来到了之江实验室。 

 

在之江实验室,傅四维加入了“见微”团队。“‘见微’来源于‘见微知著’。”傅四维解释说,“‘微’指的是数据,‘著’指的是挖掘出数据中的故事。”大数据时代,挖掘数据中的故事,就是希望数据可视化能够为决策提供重要支撑,发挥数据中隐藏的价值,实现真正的人机交互。“见微”团队目前正在进行的项目是“大数据可视分析平台构建”。该项目致力于为可视分析系统的开发搭建一个底层平台,“我们的平台涵盖了数据分析的全链路,包括数据导入、清洗、建模、可视化、导出等几大核心模块。使用者只需要导入数据,就能快速生成一个可视分析系统,并且导出成外部可访问的网页,或生成Word报告。”利用这个平台,可根据需求快速定制出一个可视分析系统。

 

基于这个项目,“见微”团队改变了行业内的纯手动可视分析,实现了半自动的可视分析,并致力于突破全自动的可视分析,让人与数据的实时交互成为可能。

大屏是公众最常见的可视化展示载体之一。满屏的数据与图表,看似简单明了,但是对于受众来说,只是被动接受,没办法根据自身需要实时与数据进行交互。举个例子,如果想了解目前全球的疫情状况,大屏上只会显示全球各国确诊病例数据,如果你想了解某个最感兴趣的国家,大屏无法单独呈现。而基于“见微”团队构建的系统,你只要输入一句自然语言:“某国疫情的发展趋势”,系统就能选择最合适的图表生成该国的疫情数据与发展趋势。另外,大数据可视分析平台的多个图表支持实时联动。比如界面上有散点图和柱状图,当你选择折线图中的一个点时,柱状图中与这个点相对应的数据也会被点亮。新冠肺炎疫情期间,研究团队就利用这套系统对当前的疫情状况进行了可视化分析。

 

这个应用场景背后的技术难点有不少。首先,如何解析这句话的自然语言与任务?疫情的趋势,要包含时间与疫情数据,还要将所选国家的疫情数据从全球的疫情数据中筛选出来。其次,理解透彻之后,要用什么样的图表呈现才最合适?目前,“见微”团队正着力攻克相关技术难点,并已取得了相当大的进展。另外,针对海量数据渲染的挑战,“见微”团队开发了一个全球领先的海量图数据可视化工具库,实现了1000万图视觉元素的实时渲染,通过FPS效率测试,该库的渲染效率超过了D3、Cytoscape、Sigma、Stardust四个国际知名图可视化工具。

 

 



见微知著 讲述数据中的故事

时间:2020-08-31 11:10

“超越摩尔定律的发展速度下,计算机的计算速度越来越快,存储越来越大,带宽越来越宽,但是有一个东西几百年来都没变过,你知道什么吗?”这是之江实验室融合智能研究中心副研究员傅四维抛出的问题。这个问题与他的研究方向息息相关,也是之江实验室正在攻坚的技术创新研究领域之一。

 

 

本科时期,傅四维的专业方向是计算数学,毕业论文写的是Helmholtz方程数值解,是偏微分方程的一种。从小就酷爱数学的他,在解Helmholtz方程数值的过程中,为数字之美深深震撼。“一塘池水,我朝水中扔一颗石头,会漾起一圈圈涟漪。我要做的就是在一定误差范围内,近似计算涟漪在时域上的三维轨迹,再把涟漪最终的形态画出来,得到的图像,特别美。”将数值分析的结果可视化出来之后,傅四维直观感受到了数字之美,原来数字可以演化出这么完美的视觉感受。硕士期间,傅四维开启了计算机领域的研究,主攻数据可视化。与本科时用数学画出涟漪一样,数据可视化也是一个把数据具象化的过程。傅四维说:“和可视化的缘分,仿佛是冥冥之中注定的。”“当时计算机还不是热门专业,我个人之前对计算机也并不了解。说实话,我也曾经很迷茫,但是深入研究之后,对计算机有了全新的认识,开始真正喜欢上这个领域。”

 

有些科学研究需要经历漫长的等待,才可能出结果。但数据可视化不同。傅四维解释说:“数据导入进来,通过可视化,我很快就能知道数据里面有什么,呈现了什么样的故事。这种及时反馈给我带来了很大的激励。”2013年,在傅四维读研期间,大数据行业快速兴起,数据可视化的研究前景也随之变得更为广阔。读博期间,他继续主攻这一领域的研究,发表了4篇一作论文。其中,2篇发表在IEEE TVCG(IEEE Transactions on Visualization and Computer Graphics,计算机图形学领域的顶级期刊),还有1篇被人机交互顶级会议ACM CHI收录。

 

临近毕业时,计算机领域开始急速发展,全球科技行业都身处计算机的热潮当中,“当时很多人都想转行做AI,我也在思考,是不是要追随科技行业的大趋势,投身AI,放弃可视化。”在迷茫的关口,傅四维开始思考认知科学和人工智能交叉领域的问题。正如他对文章开篇问题的理解,急速发展的存储和带宽带来了海量数据,而人脑对数据的处理和理解能力在近百年来却没有较大的变化。如何解决信息科学领域最大的瓶颈之一?傅四维认为,数据可视化、可视分析有望为打破瓶颈开辟一条可行的道路。

 

基于这样的判断和理解,傅四维认为,数据可视化领域正处在“黎明前的黑暗”,行业的春天即将来临。再加上对该领域浓厚的研究兴趣,他决定继续数据可视化的研究之路。进入工业界做应用研究?还是在学术界做基础研究?傅四维在毕业季拿到了华为等多个大厂的offer,但他都拒绝了。Do something different.这是傅四维的座右铭。“我希望能思人所未思、做人所未做。科研就是这样,创新是第一要义,永远要做跟别人不一样的事情。”秉持这样的理念,傅四维来到了之江实验室。 

 

在之江实验室,傅四维加入了“见微”团队。“‘见微’来源于‘见微知著’。”傅四维解释说,“‘微’指的是数据,‘著’指的是挖掘出数据中的故事。”大数据时代,挖掘数据中的故事,就是希望数据可视化能够为决策提供重要支撑,发挥数据中隐藏的价值,实现真正的人机交互。“见微”团队目前正在进行的项目是“大数据可视分析平台构建”。该项目致力于为可视分析系统的开发搭建一个底层平台,“我们的平台涵盖了数据分析的全链路,包括数据导入、清洗、建模、可视化、导出等几大核心模块。使用者只需要导入数据,就能快速生成一个可视分析系统,并且导出成外部可访问的网页,或生成Word报告。”利用这个平台,可根据需求快速定制出一个可视分析系统。

 

基于这个项目,“见微”团队改变了行业内的纯手动可视分析,实现了半自动的可视分析,并致力于突破全自动的可视分析,让人与数据的实时交互成为可能。

大屏是公众最常见的可视化展示载体之一。满屏的数据与图表,看似简单明了,但是对于受众来说,只是被动接受,没办法根据自身需要实时与数据进行交互。举个例子,如果想了解目前全球的疫情状况,大屏上只会显示全球各国确诊病例数据,如果你想了解某个最感兴趣的国家,大屏无法单独呈现。而基于“见微”团队构建的系统,你只要输入一句自然语言:“某国疫情的发展趋势”,系统就能选择最合适的图表生成该国的疫情数据与发展趋势。另外,大数据可视分析平台的多个图表支持实时联动。比如界面上有散点图和柱状图,当你选择折线图中的一个点时,柱状图中与这个点相对应的数据也会被点亮。新冠肺炎疫情期间,研究团队就利用这套系统对当前的疫情状况进行了可视化分析。

 

这个应用场景背后的技术难点有不少。首先,如何解析这句话的自然语言与任务?疫情的趋势,要包含时间与疫情数据,还要将所选国家的疫情数据从全球的疫情数据中筛选出来。其次,理解透彻之后,要用什么样的图表呈现才最合适?目前,“见微”团队正着力攻克相关技术难点,并已取得了相当大的进展。另外,针对海量数据渲染的挑战,“见微”团队开发了一个全球领先的海量图数据可视化工具库,实现了1000万图视觉元素的实时渲染,通过FPS效率测试,该库的渲染效率超过了D3、Cytoscape、Sigma、Stardust四个国际知名图可视化工具。