金融大数据

首页 > 研究领域  > 金融大数据
金融大数据研究中心简介
2018年10月23日09时 人评论

金融大数据中心以金融大数据间的知识关联为研究视角,致力于金融领域的价值分析、发现及协同创新机制。为响应中共中央政治局2018年经济工作中的防范化解重大风险任务,中心特别关注于金融风险的防范,以作为中国金融业核心的银行业为研究对象,聚焦于银行控制结构的核心银行股权结构,从股权结构关联视角出发,融合了全量的工商注册企业数据以及商业银行股权结构数据,面向资本市场构建了亿级实体-关系三元组的大规模知识图谱。

金融大数据中心目前已推出知融金融大数据平台服务,该平台研发了超大规模图数据管理关键技术,对亿级三元组的大规模知识图谱实现了准确、高效、鲁棒的查询与管理,实现了对资本市场的实体、实体关系和实体属性的知识关联查询,以及多层股权结构的发现与揭示。同时,提出了基于知识关联的金融风险模式发现算法,对交叉持股,资本系等蕴含潜在金融风险的股权结构进行了准确发现。该平台将应用于深圳证券交易所的资本市场风险评估服务。

金融大数据中心承担了国家自然科学基金重大研究计划“大数据驱动的管理与决策研究”中的重点支持项目“基于知识关联的金融大数据价值分析、发现及协同创新机制”,基于大数据中知识的多层次、多角度关联结构设计知识组织和表示方法、构建金融大数据的知识大图。

一、主要成果

l 科研产出方面

[1]Blanchet, J., Chen, X., and Pei, Y. Unraveling Limit Order Books Using Just Bid/Ask Prices[J],2017. Submitted.(*)

[2]Hong L,Fan X. MoCSys: A MOOC Community System for Knowledge Sharing and Collaborative Study, Submitted to Journal of the Association for Information Science and Technology (JASIST), 2017.

[3]Li B, Wang J, Huang D and Hoi S. Transaction Costs Optimization for Online Portfolio Selection[J], Quantitative Finance, forthcoming.

[4]Li B, Zhang D and Zhou Y. Do Trend Following Strategies Work in Chinese Futures Markets?[J], Journal of Futures Markets,2017, 37(12): 1226 – 1254.

[5]Li Y, Yu J, and Zeng T.A Specification Test Based on the MCMC Output[J],2017. Submitted.

[6]Li X H.,Sun D W, Liu M C,Ma F C.Towards a graph-based data model for semantics evolution[C]. IConference 2017, research track, full paper.

[7]Li R Y, Bao J, Ruan S J, Hong L and Zheng Y.Reachability Query based on Real-Time Trajectories, Submitted to IEEE International Conference on Data Engineering (ICDE),2017

[8]Peng H, Liu Z, and Chang T.Revisiting purchasing power parity in brics countries using more powerful quantile unit-root tests with stationary covariates[J]. Communication in Statistics- Theory and Methods, 2017.

[9]Qian T Y,Zhu P S, Li X H*,Sun D W. Identifying Users’ Gender via Social Representations[C]. IConference 2017, research track, full paper.

[10]Shi Y, Pan M. Evolutionary dynamics of social tolerance in the economic interaction model with local social cost functions[J]. Applied Economics Letters, 2017, 24(2): 75-79.

[11]Shi Y, Pan M, Peng D. Replicator dynamics and evolutionary game of social tolerance: The role of neutral agents[J]. Economics Letters, 2017, 159: 10-14

[12]陈昕韫, 刘岩,曾涛. T+1/T+0交易制度对市场投机性影响:基于ETF高频数据的实证分析[J].工作论文,2017.

[13]胡婷,惠凯,彭红枫.异常波动停牌对股价波动性和流动性的影响研究——来自我国取消异常波动停牌的自然实验[J].金融研究,2017,(09):146-160.

[14]洪亮, 周璟, 舒婵. 信息资源开发与利用研究进展:社区交互、多维计量与智能系统[J]. 图书情报知识, 2017(5):30-39.

[15]洪亮等,基于黑洞探测的城市公共安全管理系统V1.0,计算机软件著作权,登记号:2017SR536918

[16]洪亮, 李雪思, 周莉娜. 领域跨越:数据挖掘的应用和发展趋势[J]. 图书情报知识, 2017(4):22-32.

[17]洪亮等,大图数据库中基于集合相似度的子图匹配方法,中国国家专利,申请号:201710150451.7

[18]洪亮等,基于变粒度快速GeoHash编码的时空模式挖掘方法,中国国家专利,申请号: 201710419426.4

[19]李斌,林彦,唐闻轩.ML-TEA:一套基于机器学习和技术分析的量化投资算法系统[J].工程理论与实践, 2017, 37(5):1089-1100.

[20]李斌,张迪,唐松慧.基于次梯度投影的在线泛投资组合选择策略[J].管理科学学报,forthcoming.

[21]李斌,冯佳捷.中国股票市场的质量因子研究.管理评论, forthcoming.

[22]李占雷,霍帆帆,霍朝光. 商业模式创新男女有别——基于知识管理视角[J]. 华东经济管理,2017,31(10):128-135.

[23]李瑞远, 洪亮. 一种基于包含度的子图匹配方法[J]. 软件学报, 2017.

[24]李旭晖,吴燕秋,王晓光. 演化视角下图像的语义表示[J/OL]. 图书情报知识,2017,(06):79-86.

[25]李旭晖, 吴燕秋, 王晓光. 基于角色关联的叙事型文化遗产知识表示方法[J]. 图书情报工作, 2017(9):116-122.

[26]彭红枫,肖祖沔.供给侧改革背景下需要将PPI纳入通货膨胀目标吗[J].统计研究,2017,34(09):3-15.

[27]彭红枫,杨柳明.抱团是否可以取暖?——群组制度对P2P借贷行为的影响研究[J].外国经济与管理,2017,39(05):85-99.

[28]彭红枫,米雁翔.信息不对称、信号质量与股权众筹融资绩效.财贸经济,2017,38(05):80-95.

[29]彭红枫,谭小玉.人民币国际化研究:程度测算与影响因素分析.经济研究[J],2017,52(02):125-139.

[30]潘敏,陶宇鸥,汪怡. 商业银行长期流动性监管具有顺周期特征吗?——来自中国银行业的经验证据[J]. 国际金融研究,2017,(04):76-85.

l 平台打造方面

    逐步完善大数据平台的建设,集成多样化数据源,提供全方位的金融服务;初步实现了资本市场知识图谱的构建,股权图谱包含9000万行数据,520万实体。在平台建设中,整合了全球14个主流交易所数据,而且通过爬取、交换、购买等多种方式,收集全国4700万家企业的各类公开信息资源和和泛舆情类数据;在数据的基础上,构建金融知识服务平台,该平台实现了基本面信息查询 、图结构信息查询(族谱) 和证券行业相关应用服务(如深沪实时行情、投融资等)服务,并提供开放数据API。

    在知识图谱建设上,研究团队针对多方获取的数据初步构建了金融领域知识图谱,理论上提出一种以角色为基础,事件为导向,适于描述主题、分类知识关联的金融知识表示建模方法;对图挖掘算法进行探索,并申请了相关专利;针对金融数据实际情况设计并优化了信息抽取技术。 

知融平台目前共有6个页面,主页,基本查询,多层股权结构,交叉持股,金融本体,资本系。主页主要展示的平台的相关简介基本查询分为三个部分:实体查询,模板查询,关系查询在实体查询中输入企业的名称,结果会输出企业的工商登记信息模板查询可以查询企业具体几个类别的信息,例如证券号,股本,法人代表等。关系查询可以查询两家企业之间的股权关联,例如可以查询招商银行和招商局轮船之间的股权关系;多层股权结构查询,输入企业名称设定查询的层数,结果会输出股权结构图,不同的层级用不同的颜色标注。零层就是招商银行本身,一层是招商银行的股东,二层是一层企业的股东,三层是二层企业的股东,以此类推。右侧列表显示了不同层级节点数目的相关情况,包括了该层的节点数,叶子节点数,叶子节点说明这一节点是该层的末端节点,也就是说上一层的节点和这个节点之间不存在关联,或者说没有查询到他的上一层股东。非叶子节点的平均股东显示的是叶子节点的节点数比上该层节点总数的比例,保留到两位小数;交叉持股查询,交叉持股是指两家企业互相持有对方企业股权的一种现象,在搜索框中输入两家企业的名称,设定查询层数,例如四层,系统会分别查询这两家企业向上四层的股权结构,并且在整个股权结构图中查找存在交叉持股的企业。金融本体的页面主要展示了一些金融实体的基本概念和相关的简介,例如这里有金融机构的定义和相关简介,银行的基本解释等信息。最后是资本系查询的页面,左侧是资本系的列表,点击可以查看结构图,图中红色的节点是资本系控制或持股的金融机构,绿色的节点是整个股权结构图中属于资本系的节点,左侧有相关的节点数目的列表,显示了每一层节点数,以及每一层属于这个资本系的节点数,以及属于资本系的节点数占该层节点数的比值,第三列和第五列P/N是指上一层的节点数占这一层的节点数的比例。左上方的搜索框可以具体查询某一家企业属于哪一个资本系。

l 成果创新性方面

1. 基于知识关联的知识组织新方法将领域大数据的价值分析发现规约为基于知识大图的知识计算

2. 金融知识大图的价值分析发现可以扩展知识关联深度与广度,使用户从金融知识系统的观察者变为参与者

3. 协同价值创造机制使主体可以主动认识和利用价值分析成果,促进社会化协同的金融活动发展

4. 金融大数据知识服务平台可以构建人、机、知识、数据深度交融的大数据应用生态系统

5. 本项目的理论与应用成果具有普适性,知识大图及知识服务框架可迁移到其他领域大数据应用中。

参考:http://zhirong.whu.edu.cn

二、主要项目

编号

项目

国家自然科学基金重大研究计划重点支持项目

基于知识关联的金融大数据价值分析、发现及协同创造机制“大数据驱动的管理与决策研究”

国家自然科学基金重点国际(地区)合作研究项目

大数据环境下的知识组织与服务创新研究

国家自科基金青年项目

71503191

银行竞争与银行资本对银行信贷标准制定的交互影响:动态理论与国际实证对比研究

国家自科基金国际合作项目(71661137003)

法、金融与经济增长之再考察——中国的变革挑战与英国等国的经验

云计算和大数据国家重点研发计划

图模式匹配查询系统的研究和实现

深圳市科技计划项目

面向智慧城市的情境感知社会化推荐方法研究

三、主要特色

从理论上构建了基于知识图谱的金融大数据价值分析发现的知识关联模型和理论体系;在实践应用上,基于知识图谱模型,设计了基于知识大图的银行股权知识关联模型,构建了基于知识大图的银行股权信息系统,能够复原相关商业银行所有层级的股权嵌套关系,绘制完整的基于知识大图的银行股权结构网络,从而实现对银行股东及股权结构信息的穿透性揭示,为我国金融体系的监管提供了一个全新的思路、方法、模型和可行路径,助推银行股权结构穿透式监管目标的实现,从而为防范系统性金融风险提供大数据支撑。

武大超算中心和大数据院自有硬件与软件支持,实现大规模复杂网络查询与分析,构建银行股权查询平台,实现银行股权网络查询与可视化,并可分银行类型、地区对银行股权结构特征进行查看。

提出了大数据价值分析发现的一个新的途径:从知识关联的角度来探讨大数据价值分析发现与创造的一般方法,并以此为基础构建领域大数据价值发现和创造的统一框架。通过知识关联集成各类金融知识,并通过知识服务降低了金融大数据处理的技术门槛,既提高了知识的利用率,又加快了价值创造的效率,从而形成一个由金融大数据、人、计算机构成的完整、高效的金融大数据应用生态系统。

 

版权所有 ©武汉大学大数据研究院 | copyright © 2008-2018 Big Data Institute, Wuhan University. All Rights Reserved.