摘要

关于科研信息化,中国科学技术大学网络信息中心的李京主任无疑是最合适的采访对象之一。在他看来,科研信息化已经成为中国高校信息化较大的“短板”,也是最大潜力所在。将这块“短板”补齐,有助于高校充分挖潜科研特色和能力,继而推动高等教育内涵式发展,助力科技强国建设。...

  关于科研信息化,中国科学技术大学网络信息中心的李京主任无疑是最合适的采访对象之一。

  一方面,科研信息化本来就是中科大信息化的重点和特色;另一方面,李主任除了在信息化战线辛勤耕耘十多年之外,本身就是中科大计算机系的知名教授,在信息化和科研方面都有深厚的积累和深刻的认识。

  在他看来,科研信息化已经成为中国高校信息化较大的“短板”,也是最大潜力所在。将这块“短板”补齐,有助于高校充分挖潜科研特色和能力,继而推动高等教育内涵式发展,助力科技强国建设。


李京 中国科学技术大学网络信息中心主任

科研与信息化脱节是大问题

  《中国教育网络》:科研信息化是中科大信息化的重点,在您的心目中,如何定义和看待高校科研信息化?

  李京:我认为,科研信息化就是用信息技术和信息化的手段支撑科研管理、科研活动和科研服务,实现对科研全流程的支持。

  我们一直在说要用信息化来支撑我们学校的管理、教学、科研和服务。

  其中科研信息化我觉得是最难做的:一是它的专业性更强;二是它的个性化要求更多;三是它的复杂程度更高。

  因此,通常在中国高校的信息化版图中,管理和服务的信息化一般都是起步最早,也是发展较为全面的。“十三五”之后,尤其受新冠疫情的影响,教学信息化获得了长足发展,但唯独科研信息化发展比较滞后。

  总体上看,科研信息化已经成为中国高校信息化较大的“短板”,也是最大潜力所在。将这块“短板”补齐,有助于高校充分挖潜科研特色和能力,继而推动高等教育内涵式发展,助力科技强国建设。

  《中国教育网络》:随着信息技术的日新月异,您认为当前高校科研信息化的内涵和外延都有了哪些扩展?

  李京:最初的科研信息化是对科研活动的零散支持,而高校科研信息化普遍是从科研管理的信息化开始做起的,后来延伸到科研服务。

  到现在我们开始关注对科研活动本身的支持,可以分为以下几个方面:

  首先最基础的当然是包括学校图书馆在内所提供的科研情报以及科技前沿文献的服务;

  其次是算力服务,我们通过超算对具体的科研活动进行计算模拟、计算仿真的支持,这方面的需求相当大;

  再次我们会协助提供或者优化科研的生产力工具,比如优化程序、优化算法等。

  当然,我们也在考虑能否借助日新月异的信息技术为科研提供更大范围、更深度的支持。

  《中国教育网络》:您认为,一直以来高校的科研信息化存在哪些问题?

  李京:我认为有这四点:

  第一,缺乏顶层设计。信息化作为现代大学治理的底层逻辑,已经越来越受到高校的重视。

  但具体到科研信息化,在大部分高校领导心目中,科研还基本上属于科学家们各自为战的状态,在这个领域的信息化是否必要,认识上还比较模糊。

  另外,由于中国高校并未建立真正的CIO制度,高校分管信息化的领导未必分管科研相关工作,这也使得信息化与科研本身就不在一个管理“频道”上。

  第二,信息化与科研脱节。搞信息化的人不懂科研一直是个大问题。在原985高校的不少研究型大学中,信息化部门的负责人一般由计算机系的教授兼任,本身对于科研有一定的认识,这种状况稍微好一些。

  但在很多高校当中,信息化部门的领导是管理出身,对科研活动本身的特点和规律认识不足,无法很好地对接科研服务。应该说,信息化与科研脱节是当前阻碍科研信息化发展的主要因素。

  第三,体制机制没有理顺。很多高校的科研信息化涉及信息化部门、科研管理部门、二级学院等,到底由哪个部门统筹、协调、管理,其实一直都没有理顺。

  另外,信息化部门可以做科研信息化的底层、通用部分,但是具体到科研数据库、大型科研装置的管理,也存在一个管理维度的问题。

  第四,科研人员本身没有这方面意识。虽然科研范式正处于转型阶段,但并不是所有科研人员都能认识到信息化以及信息技术对于科研的意义。

  在很多大型的项目组或者国家实验室中,主要参与者仅涉及科研项目本身,压根也想不到应该有信息化背景人才的参与。

  事实上,科研人员在项目过程中很需要这方面的帮助和支撑,只是意识不到而已。我想这也是阻碍科研信息化的问题之一。

“区块链”促进科研数据共建共享

  《中国教育网络》:科研数据是国家科技创新发展和经济社会发展的重要基础性战略资源。相比于高校的管理数据、教学数据等而言,科研数据由于学科众多,尤其是学科交叉日渐紧密的今天,显得非常庞杂。从具体实践当中,您认为当前科研数据的处理和共建共享方面存在哪些难点?

  李京:基于科研数据的特点,处理起来有以下几个难点:

  一是形态各异。科研数据种类繁多,模式多样,既可以是结构化数据,也可以是非结构化数据或者半结构化数据,比如语音、视频都有可能是科研数据的组成部分,这使得它与传统数据相比处理起来更为复杂。

  二是体量庞大。当前科研数据的体量动辄以TB、PB的单位来计算,比如来自卫星、射电望远镜的数据,这种庞大数据量对存储和算力都提出了更高的要求,对数据传输也带来了极大挑战,尤其是一些地处深山的科研项目。

  三是人为原因。如果说上面两项是技术问题,还可以通过资源投入和技术攻关得以解决的话,那么这个问题就涉及科学家本身。

  我们知道,数据本身是有价值的,科研数据的价值更是难以估量。尽管每次科研的角度、着重点不同,但采集的数据,处理完之后,难道就没有其他价值可以挖掘了吗?

  这个可能连科学家自己都很难判断,因此会非常重视其知识产权或者说科研数据的剩余价值。

  于是,在科研数据共享方面会衍生出两个问题:第一,科学家是否放心将科研数据交给信息化部门保存;第二,科学家是否愿意与其他研究者共享。

  事实证明,很多科学家是不太愿意公布原始数据的,或者只愿意提供数据目录,这是我们在建设科学数据中心时遇到的一个非常棘手的问题。


中国科学技术大学

  《中国教育网络》:我们在科研数据共建共享方面有哪些想法?另外,数据共享也涉及数据安全的问题,在这方面我们有哪些实践和思考?

  李京:国家已经出台了科学数据的管理办法,目的就是加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和国家安全。

  除了共建共享可以产生更大的科学价值,另外一方面还可以防止学术腐败、学术造假,保证可追溯。

  根据“政府预算资金资助形成的科学数据应当按照开放为常态、不开放为例外”的原则,当前科技部门重大科研项目在进行中期检查或者验收时,数据共享是前提条件,这也为我们建设数据中心提供了一个很好的契机。

  另外,就高校而言,也可考虑是否出台一些政策,比如将科研数据的共建共享与考核、评职称等关联起来。

  当然,科研数据的数据共享是以数据安全为前提的。一方面,对科研数据进行分层管理,比如某些重要实验室,它的网络与互联网就是隔离的;另一方面,通过不同等级的等级保护实现安全保障。“十四五”期间,我们打算试点区块链技术来推动科研数据的共建共享。

  《中国教育网络》:中科大的科研信息化对于学校科研的助力或者贡献有没有实际数据的支撑?

  李京:仅仅从算力角度而言,中科大的超算中心对于学校科研的支撑作用就非常明显。例如去年,中科大主页上介绍的我校重要科研成果约40%与我们有关。另外,学校8%到10%的高水平论文也是在超算中心完成的。

科研信息化应有专职部门负责

  《中国教育网络》:就现阶段而言,结合学校的实践,您认为想要做好科研信息化需要加强哪些方面的工作?

  李京:在力所能及的范围内,我们做了以下几个方面的工作:

  第一,加强队伍建设。信息化与科研脱节最重要的原因在于信息化部门不懂科研模式和规律,为此我们将“两条腿走路”,加大高水平人才的引才力度。

  一方面,我们以计算机学院等二级学院的名义招募博士后作为特聘研究员;另一方面,从明年开始,希望我们信息化部门有特殊政策可以直接招聘人才。

  这些高水平人才都有深厚的科研背景和学科背景,既懂科研又懂信息化,本身又有良好的学习能力和悟性,在与二级学院和具体科研活动的交流过程中也会极大地降低沟通成本,这样就会大幅度提升学校科研信息化的效能。

  第二,做好人才评价。家有梧桐树,凤凰自来栖。我们的“梧桐树”除了科大的良好声誉、学风等因素之外,很重要的一点是信息化部门的人才评价制度。

  不同于其他高校以科研成果和发表文章的考核制度,我们当然也鼓励信息化部门工作人员发表高水平论文或者发布科研成果,但同时,我们也考核工作人员支持科学家做出了什么重大的科研成果。

  只要科学家团队在论文当中致谢了,我们就作为考核的成绩来看待,继而影响他们评职称、升迁等一系列发展路径。

  通过这种人才评价制度,工作人员会主动与二级学院的科研人员沟通、交流,在提升主动服务意识的同时,也增加了学习的动力,也只有这样,才能留住高水平人才。

  第三,专职部门负责。科大的科研信息化相对较好,我认为很重要的一点是有一个专门负责的部门一超算中心。

  之前超算中心只是提供算力,现在还提供存储服务,未来的科学数据中心也放在超算中心,你可以将超算中心理解为专门支撑科研信息化的部门。

  因为只有专职负责部门存在,它才会全力以赴、想方设法去提升学校科研信息化,毕竟这也涉及到它的工作成绩和绩效。

  《中国教育网络》:结合学校的信息化“十四五”规划,我们在科研信息化方面有哪些规划?

  李京:关于学校信息化“十四五”规划。我们有一个总体的思路,那就是依托互联网思维,通过与互联网基因浓厚的厂商合作,以to C的方式来建构我们的智慧校园。

  同时,借助基于互联网模式的行为刻画和建模,为师生教学、科研活动提供大规模的个性化服务。

  而且to C本身也非常符合科学协作的形式,以此期望能够为科研情报、科研协作、科研数据共享为基础的科研信息化提供更大的可能性。

  具体到科研信息化,我们将在“十四五”期间主要规划以下几件工作:

  一是建设科研协作平台。随着学科交叉的趋势日益明显,大科学的概念逐渐深入人心。我们考虑建设的科研协作平台,可以汇聚校内外、跨国界、跨领域的学者智慧,并将科技情报、算力、生产力工具等集成进去,不断更新迭代。实际上是集成科研信息化将其打造为“科学大脑”。

  二是建设科学数据中心。“双一流”对于学科的重视也为科研信息化发展带来了新的机遇。

  中科大正在建设一万平方米、五层的数据中心大楼,除了提供多样算力以外,计划建设容量超过20PB的科学数据中心,我们希望把科研类的数据都能够汇聚到一起,全面推动科研数据共建共享以及社会服务这项工作的进行。

  此外,通过混合云技术,我们为科学家们一直头疼的数据计算、存储等问题提供“一条龙”服务,让科技创新“轻装上阵”,让科学家们可以将全部注意力都回归到科研项目和创新发展上去。

  三是承建未来网络以及研发任务。互联网是科研信息化的关键基础设施。中科大承担了未来网络国家基础设施的研发以及承建任务,希望在这一方面加大对于科研信息化的网络基础设施支持。

  除此之外,我们还会拿出一部分信息化的经费支持我校部分科研成果的落地,在这个过程中探索科研信息化支持科研活动的新路径。

  记者:王世新