谷银观点
谷银基金行业月度简报 | 大数据板块
政策/知识/技术总结
六大层级构成大数据产业链完整闭环
大数据产业链包括一切与大数据产生与聚集(数据源)、组织与管理(储存)、分析与发现(技术)、交易、应用与衍生产业相关的所有活动。按照数据价值实现流程,贵阳大数据交易所将大数据产业链分为六大层级:数据源、大数据硬件支撑层、大数据技术层、大数据交易层、大数据应用层与大数据衍生层,其中每一层都包含相应的 IT 硬件设施、软件技术与信息服务等,构成了大数据产业链的完整闭环。
政策支撑大数据产业发展,2020 年规模或超 1.3 万亿
2006 年之后,国家开始正式发布一系列相关政策,不断扶持和引导大数据及相关产业的发展,特别是在 2014 年“大数据”概念首次正式写入《政府工作报告》,大数据成为国家重点发展的未来方向之一,目前,大数据也已经成为我国战略方向之一。根据贵阳大数据统计的数据,中国大数据产业市场规模维持高增长,2014-2020 年复合增长率为 53.6%,预计到 2020 年,中国大数据产业市场规模将达到 13626亿元。从产业结构上看,目前硬件支撑层、应用层与技术层为大数据主要组成,2017 年市场规模分别为 1389 亿元、809 亿元与 633 亿元,占大数据总市场规模比例分别为 39.5%、 23.0%与 18.0%。
中美差距缩小将是我国大数据产业催化剂
行业内普遍认为我国大数据行业与美国存在三到五年的差距,未来几年美国作为大数据优势国家仍将领跑世界,并且对外输出先进的理念与技术,美国大数据发展仍然代表大数据发展方向。我们认为,我国大数据行业想要快速发展并占领全球制高点必然需要缩小与美国的距离。因此消除与美国大数据行业之间的差异将是我国大数据行业的重要催化剂,主要有三点:1、数据文化的确立;2、技术工具的革新;3、数据交易共享的开放。
以应用为代表的下游产业将成为大数据主体
根据《2016 年中国大数据交易产业白皮书》的数据,未来几年我国大数据应用市场规模将以 87.6%的复合增长率增长,我们根据《白皮书》数据计算,到 2020 年大数据应用市场规模份额将达到 40%,成为大数据中规模最大的产业,与此同时,衍生层市场和交易层市场也快速增长,2014-2020 年复合增长率分别为 88.0%和 72.4%,2020 年市场份额分别为 18.5%和 4.0%,以应用为代表的下游产业将成为大数据主体。
政府和金融大数据应用落地最快,工业领域应用前景可期
从规模数据上看,政府与金融大数据应用市场规模远远大于其他行业,同时政府金融两行业市场规模的年复合增长率也稳居前二,政府金融大数据已经率先落地,政府大数据已经广泛的应用到交通、公安、法检等各个专业领域,金融大数据也已经应用到银行、金融等领域,并延伸了金融边界。根据我们的排序,工业领域大数据落地速度超过应用,加之大数据是工业互联网核心价值,未来大数据在工业领域应用前景可期。
大数据产业链定义:“大而新”是大数据的关键特征
大数据是一个宽泛的概念,从 2001 年“大数据”一词在 Gartner 的研究报告出现至今,大数据一直没有统一的定义。
Gartner 认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。国际数据公司(IDC)从大数据的 4 个特征来定义,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。维基百科对“大数据”的定义是“无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合”。
无论各方对于大数据的定义有何不同,但均体现了大数据“大”的特征。但体量大、结构多样体现更多的是数据特征,对于数据的处理与应用,则需要新技术(新型计算架构、智能算法等)、新理念与新知识。因此大数据不仅“大”,而且“新”,是新资源、新工具和新应用的综合体。
六大层级构成大数据产业链完整闭环
大数据产业链包括一切与大数据产生与聚集(数据源)、组织与管理(储存)、分析与发现(技术)、交易、应用与衍生产业相关的所有活动。按照数据价值实现流程,贵阳大数据交易所发布的《2016 年中国大数据交易产业白皮书》将大数据产业链分为六大层级:数据源、大数据硬件支撑层、大数据技术层、大数据交易层、大数据应用层与大数据衍生层,其中每一层都包含相应的 IT 硬件设施、软件技术与信息服务等,构成了大数据产业链的完整闭环。
大数据产业链
数据源:大数据产业基础。数据源是大数据产业链的第一个环节,是大数据产业发展的基础。由于中国大数据流通在全社会还未形成规模,目前数据源区块主要集中在政府管理部门、互联网巨头、移动通讯企业等手中。随着互联网渗透不断深入,数据产生方式也变得更加多样,数据源已经呈现出爆炸式增长,越来越多的企业将加入数据生产和采集行业,数据源将进一步扩大。
硬件支撑:大数据底层支柱。大数据硬件是指数据产生、采集、传输、存储、计算等一系列与大数据产业链相关的硬件设备。包含传感器、移动智能终端、各种有线/无线传输设备、存储设备、服务器、网络/安全设备等。在大数据需求的刺激下,越来越多的硬件产品都打出“智能牌”。智能硬件逐渐改变人们日常生活的同时,还在用户无触发、无感知的情况下,24 小时不间断采集数据。
技术层:大数据价值实现手段。大数据技术层指实现一切大数据采集与预处理、存储管理、大数据分析挖掘、大数据安全和大数据可视化的技术手段。大数据技术能够将大规模数据中隐藏的信息和知识挖掘出来,为社会经济活动提供依据,提高各个领域的运行效率,甚至整个社会经济的集约化程度,是大数据价值实现的重要条件。
交易层:最大化数据价值。随着大数据技术的成熟和发展,大数据在商业上的应用越来越广泛,有关大数据的交互、整合、交换日益增多,大数据交易也应运而生。大数据交易可以打破信息孤岛及行业信息壁垒,汇聚海量高价值数据,对接数据市场的多样化需求,完善产业生态环境,实现数据价值的最大化,对推进大数据产业创新发展方面具有深远意义。目前大数据交易有交易所模式、电商模式、API 模式,大数据的价值通过数据确权、清洗、交易等形式得以释放和体现。
应用层:大数据价值体现。大数据的价值体现在大数据应用上。大数据产业的下游由大量公司组成,它们基本上扮演的角色是大数据生态圈里的数据提供者、特色服务运营者和产品分销商,基本通过开放平台和搜索引擎获取用户,处于产业的边缘地带。目前,大数据应用在各行各业的发展呈现“阶梯式”格局:互联网行业是大数据应用的领跑者,政府、金融、电信、交通、医疗等领域积极尝试大数据,其中政府、金融会在近几年呈爆发式增长。
衍生层:大数据下的新业态。大数据衍生层是指基于大数据分析和应用而衍生出来的各种新业态。大数据分析和应用,在经济社会各领域的扩散渗透,不仅促进相关产业生产率水平的提升,同时也衍生出很多与之相关联的新兴产业,使得人类生产生活、工作消费方式发生根本性转变。
热点、趋势、动态
天津启动建设健康医疗大数据超级平台。
2 月 19 日下午,天津市卫生健康委员会、武清区人民政府与浪潮集团有限公司签署战略合作协议,三方将共同建设发展天津健康医疗大数据,建设天津市“健康云”,推进天津市健康医疗大数据创新应用和产业发展。此次合作将实施全市各级医疗机构和公共卫生领域全量医疗健康数据汇集,逐步形成全市统一的健康医疗大数据资源池和分类数据服务目录,实现全市各类健康医疗数据互通共享,建设完善天津市健康医疗大数据标准、安全和支撑保障体系。(天津政务网)
北京城市大数据研究院成立佐证政务 IT 数字化转型
1 月 28 日,由石景山区政府 、中国电子科技集团有限责任公司、太极计算机股份
有限公司、北京东土科技有限公司、北京百分点信息科技有限公司等共同发起成立的北京
城市大数据研究院在石景山区揭牌成立。
北京城市大数据研究院成立佐证政务 IT 数字化转型。 第一轮政务 IT 建设:最早提出构建国家四大基础数据库:“人口基础信息库”、“法人单位基础信息库”、“自然资源和空间地理基础信息库”、“宏观经济信息数据库”。另外还有十二金工程,这个阶段我国电子政务快速发展,实现电子化过程。第二轮政务 IT 建设:提出数字中国的电子政务概念,从数据采集分析开始,建设一体化平台,应用大数据的技术解决业务目标。
上市公司/标杆企业分析
数据堂:数字的银行
数据堂(831428.OC)成立于 2011 年,2014 年 6 月完成股份制改造,并于 2014年 12 月在新三板挂牌,海通证券担任做市商,是中国第一家数据资源运营的公众公司。公司是国内专业的数据服务提供商,主要业务包括数据采集、制作、共享、交易、订阅和应用服务,以及大数据的存储、管理、挖掘、分析的专业系统解决方案。6 年多来,数据堂为国内外超过 1000 位合作伙伴在人工智能、金融征信、精准营销、智能交通等领域提供数据采集、数据整合和数据云服务。
数据堂数据产品
定位数据银行,打通数据源上下游。
公司数据获取方式主要有五种:1、通过众包平台线上采集;2、组织兼职人员线下采集;3、优质供应商供应数据;4、用户共享数据;5、网络爬取数据。数据堂对获取的数据进行清洗和存储。公司的客户类型主要分为大企业客户和数据堂网站平台的注册用户两类,其中大企业客户分为数据业务的云联网公司、跨国企业在华机构、国内科研院校等几大类。
公司盈利模式主要有三种:1、向客户收取数据采集制作费用,利用大众力量及资源,为数据需求企业提供图像、视频、语音、文本等大数据采集、制作等服务;2、向客户收取数据的销售费用或订阅(租赁)费用,在数据采集制作的过程中,获取数据集的版权,并提供相应数据的销售和订阅服务;3、向客户收取数据租赁费用,依靠数据堂自制数据,代理第三方数据,用户共享数据等几种渠道,逐步积累各行业的大规模的数据集,从而提供面向大众的数据应用服务,即基于数据平台和数据资源,为中小企业及个人客户,提供面向广大用户的数据应用服务。
数据堂商业模式