谷银观点
谷银基金行业月度简报 | 大数据板块
政策/知识/技术总结
大数据时代,演绎第三次浪潮的华彩乐章
对于大数据, Gartner给出的定义是需要运用新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维克托•迈尔-舍恩伯格及肯尼斯•库克耶编写的《大数据时代》提出,大数据不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。
大数据具备 Volume(大量)、 Velocity(高速)、 Variety(多样)、 Value(低价值密度)、 Veracity(真实性)的特点(IBM)。随着信息技术不断发展,互联网快速普及,与人们的生产、生活日益紧密,全球数据亦呈现倍数级增长的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。
大数据 5V 特性
1980年, 著名未来学家阿尔文•托夫勒在其著作《第三次浪潮》 中,将“大数据”
描绘为“第三次浪潮的华彩乐章”。
2003年《The Google File System》、2004年《MapReduce: Simplified Data Processingon Large Clusters》、2006 年《Bigtable: A Distributed Storage System for Structured Data》谷歌大数据三大论文发布, 以及 2005 年 Hadoop 项目的诞生,使得大规模处理结构化、半结构化、非结构化数据1的廉价方案成为可能,为大数据产业的快速普及创造了基础条件。
2008 年,大数据得到部分美国知名计算机研究人员认可。 业界组织计算社区联盟(Computing Community Consortium)发表白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》,详尽阐述了大数据对社会治理的推动作用,及其潜在的商业价值。大数据正式进入世界最具有价值和影响的技术行列。
2009 年,美国政府为构建开放、透明机制,启动 Data.gov 网站向公众开放多种政府数据,包括交通、经济、医疗、教育和人口服务等。 2012 年, Data.gov 已累积来自 172 个政府机构的数据集,数量从 2009 年的 47 个暴增至 40 万个以上,催化美国政府推出相关政策,加速大数据技术发展。至此, 大数据产业迎来其发展的大时代。
大数据发展历程
为什么要研究大数据?
2015年,亚马逊市值第一次超越沃尔玛, 当前前者市值更是后者的三倍多,而亚马逊销售额中有 1/3 是依托大数据精准营销产生。通过记录顾客浏览网站时的行为数据,如所搜关键词、到访页面、关注商品、购买订单,以及不定期举行活动引导客户明确喜好,如主题投票,亚马逊搜集并分析客户属性、兴趣、需求,利用聚类等大数据模型为客户群体推荐合适商品。
以色列的环境比中国大西北更恶劣,但将大数据引入农业后,以色列成为了“欧洲的厨房”。凭借较高的信息化和数字化基础,以色列农业技术公司利用大数据帮助农民根据农场的具体情况采用更加个性化的耕种方案。如 Taranis 公司利用大数据分析法推出包括预测天气、灌溉和病虫害状植物模型技术, 指导农民合理灌溉、杀虫;AKOL 公司更是将不同区域农民工作习惯等人为因素纳入农作物生长及环境状况的大数据分析范畴,进一步优化方案。
更甚者,在体育界,植入科技和大数据之后,美国金州勇士队在短短几年内就实现了从一个“烂”球队到 NBA 总冠军的飞跃。 勇士队老板拉科布作为数据分析的坚实拥趸,把数据分析思想充分融入到球队的训练之中,最先引入球馆录像和分析系统,同时其团队统计历年 NBA 比赛,发现最有效的进攻是眼花缭乱的传球和准确的投篮,并创造了三分球新打法,助力勇士队快速成长。
正如《大数据时代》所言,大数据开启了一场重大的时代转型,就像望远镜让我们感受到宇宙,显微镜让我们能够观测微生物,大数据收集、分析海量数据帮助我们更好地理解世界,是众多新发明和新服务的源泉。如今,数据已经成为重要的商业资本,可以作为前期投入创造实际经济价值,此外,大数据也撼动着医疗、教育、人文、社交等世界的方方面面……其社会价值亦不可估量。
大数据发展的基础: 数据积累、算力提升、 技术创新
在互联网快速普及、物联网加速渗透的背景下,PC、手机、传感设备等全面兴起,推动全球数据呈现倍数增长、海量集聚的特点,为大数据产业发展奠定了庞大的数据基础。根据 IDC 统计,2011年全球创建和复制的数据总量为 1.8ZB,2016 年这一规模为 16.1ZB,预计2020年将达到44ZB,在其《数据时代2025》白皮书(希捷赞助)中,更是预测到2025年,全球创建和复制的数据总量将扩展至 163ZB(1ZB等于1万亿GB)。
同时, 处理如此规模的数据量也对算力提出了巨大的挑战。所幸, 摩尔定律推动处理器性能不断提升, GPU、 FPGA、 TPU 等高算力芯片不断涌现,为大数据产业发展保障了迅速的处理能力。在 Google I/0 2018 开发者大会上,谷歌发布了第三代 TPU处理器,基于 TPU 3.0 的新运算阵列 TPUv3 Pod 性能相比 TPUv2 Pod 有 8 倍提升,运算速度可超 100PFlops(PFlops: 每秒千万亿次浮点计算)。
再者, 云计算、 人工智能等新技术的出现也为大数据产业发展提供了技术支撑。云计算为企业实现了更为便捷的大数据解决方案,其按用量付费、可扩展的存储计算能力、便捷易部署等特点,大大降低了企业应用大数据的难度与成本,促进大数据产业加快推广。人工智能通过深度置信神经网络等领先算法,自动处理、分析大规模数据,从而获得预测性的洞察,指导或直接替代人工决策,提高大数据核心——预测的效率性。
大数据产业链:数据为源、分析为核、应用为王
分析大数据产业链,主要涵盖数据来源、数据管理与分析、数据应用。 1)数据是行业发展的源泉, 政府、 BAT、运营商等是当前中国大数据的主要拥有者,另在细分领域拥有入口资源的公司也是稀缺标的。 2) 数据管理与分析是产业中游。数据管理负责数据的集成、存储、安全等环节, 其中,数据存储是产业链的支撑,参与者以传统数据库企业为主; 数据安全是产业发展的重要保障,渗透数据存储、传输、交互的各个环节。 而产业链最核心的当属数据分析与挖掘,其能力直接决定着大数据应用的推广程度和范围,当前Hadoop、 Spark是使用较为广泛的两种处理框架, 算法方面受益人工智能,神经网络算法关注度再次高涨。 3) 应用为王, 对大数据分析结果进行应用是完成产业商业化目标,实现价值的终点。
热点、趋势、动态
一、2017年大数据产业发展现状分析
(一)大数据产业规模加速增长
近年来,我国大数据产业从无到有,全国各地发展大数据积极性较高,行业应用得到快速推广,市场规模增速明显。2017年我国包括大数据核心软硬件产品和大数据服务在内的市场规模将超过2600亿元,与2016年相比,增长了49%。2017年1月,工信部发布了《大数据产业发展规划2016-2020年》,进一步明确了促进我国大数据产业发展的主要任务、重大工程和保障措施。国家政策的接连出台为推动大数据产业快速成长提供了良好的发展环境,未来2-3年市场规模的增长率将保持在50%左右。预计2020年,我国大数据市场规模将超过8000亿元,预计未来中国将成为全球数据中心。
(二)大数据投融资持续升温
持续升温的大数据创业潮,激发着国内大数据公司的“生产热情”,大数据持续被国内资本市场看好。自2011年以来,大数据领域成功融资的企业数量逐年增加,2014年进入快速上升阶段,环比增长176.47%,2014年以来持续稳步增长,2016年获得融资的企业数量达到221多家。据统计,截至近日,大数据领域有183家企业获得融资,大数据领域持续获得资本市场的高度青睐。
大数据产业具备了良好基础,面临难得的发展机遇,但仍然存在一些困难和问题。一是数据资源开放共享程度低。数据质量不高,数据资源流通不畅,管理能力弱,数据价值难以被有效挖掘利用。二是技术创新与支撑能力不强。在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,对开源技术和相关生态系统影响力弱。三是大数据应用水平不高。虽然大数据具有强劲的应用市场优势,但是目前还存在应用领域不广泛、应用程度不深、认识不到位等问题。四是大数据安全体系不健全。数据所有权、隐私权等相关法律法规和信息安全、开放共享等标准规范不健全,尚未建立起兼顾安全与发展的数据开放、管理和信息安全保障体系。五是人才队伍建设亟需加强。大数据基础研究、产品研发和业务应用等各类人才短缺,难以满足发展需要。
二、中国大数据发展预测
(一)政策影响趋势
随着国家大数据战略推进实施以及配套政策的贯彻落实,大数据产业发展环境将进一步优化,社会经济各领域对大数据服务需求将进一步增强,大数据的新技术、新业态、新模式将不断涌现,产业规模将继续保持高速增长态势。
(二)技术影响趋势
大数据的技术发展与物联网、云计算、人工智能等新技术领域的联系将更加紧密,物联网的发展将极大提高数据的获取能力,云计算与人工智能将深度融入数据分析体系,融合创新将会不断地涌现和持续深入。
(三)人才影响趋势
随着2017年教育部公布第二批获准开设“数据科学与大数据技术”的高校名单,加上第一批获批高校获批开设该专业。今年开始,大数据需要的复合型人才将源源不断形成。加之海外和传统行业跨界人才不断加入大数据行业,大数据产业将迎来创新发展。
(四)资本影响趋势
近年来,伴随着资本大量进入大数据行业,出现了创业公司估值过高的现象。泡沫期的大数据行业,许多企业的发展远远无法回归企业的本质,导致创业企业供给与市场需求之间脱节。随着资本的沉没,理性资本将引领大数据行业健康发展。一些在资本热潮褪去之后还能沿正常轨道发展的企业将占据新一轮的资本优势,得到进一步的发展和壮大
投资并购重组
云计算自动化平台HashiCorp获1亿美元D轮融资,估值达19亿美元
HashiCorp一直在开发用于管理云基础设施的开源工具,公司拥有相当庞大的商业业务。近日,该公司完成了1亿美元D轮融资,成为估值达19亿美元的独角兽公司。
这轮融资由IVP领投,其投资项目包括AppDynamics、Slack和Snap。现有投资者纪源资本、Mayfield、Redpoint Ventures和True Ventures,以及新投资者Bessemer Venture Partners参投。本轮融资过后,HashiCorp的融资总额达1.79亿美元。
根据HashiCorp提供的数据,该公司的开源工具已被下载4500万次。它利用这个开源基础来推动业务发展。
公司首席执行官Dave McJannet在一份声明中表示:“我们采用了开源的方式,与云提供商合作,为云的采用提供了一个通用的工作流程。在商业上,我们作为全球最强的2000家上市公司的战略合作伙伴背负着巨大的责任,因为他们通常采用混合云和多重云技术。本轮融资将帮助我们加快步伐。”
为了保持增长,HashiCorp需要建立其全球业务,这需要大笔资金。此外,随着公司规模扩大,员工团队的规模也必须扩大。
HashiCorp于2012年成立,由Mitchell Hashimoto和Armon Dadgar创办,总部位于美国旧金山,致力于为企业提供服务,通过数据中心管理技术研发,让开发者通过工具构建完整的开发环境,提高开发效率,并陆续推出了五种开源工具以满足不同的需求。
公司所提供的主要企业服务包括应用程序开发、交付和维护,使用的DevOps 基础设施工具主要包括Vagrant、Packer 、 Terraform 、Serf 、Consul , Vault 和 Nomad 等。
HashiCorp提供了大量的DevOps 基础设施自动化工具,集开发、运营和安全性于一体,可以帮助开发者编写和部署应用程序,加速应用程序分发,助力企业提升开发效率。
HashiCorp于2014年获得了1000万美元A轮融资。2016年9月,HashiCorp 获得2400万美元的 B 轮融资,由GGV Capital 领投,Mayfield 、 True Ventures 和新投资方 Redpoint 参投。
相数科技获数千万Pre-A轮融资 赋能顶尖企业及组织数据智能决策
近日,数据智能服务商「相数科技」完成数千万人民币Pre-A轮融资,投资方为仁爱资本。时龙资本担任本轮融资独家财务顾问。本轮融资将切实推动相数科技在技术研发投入、人才队伍建设以及市场拓展等方面获得全方位发展。
以数据智慧赋能企业创新发展
相数成立之初,即为全球最大的共享单车企业摩拜开发了“魔方”大数据智能决策平台。借助“魔方”平台,摩拜充分发挥了大数据的力量并突破自身的管理瓶颈,更协助城市管理部门维护交通通畅、优化城市规划。
摩拜单车“魔方”大数据人工智能决策平台
此后,在智慧交通领域,相数科技相继为腾讯自动驾驶、番茄出行、大于出行,以及国内最大的智能停车服务企业“停简单”、国内最大的即时物流平台“点我达”,以及腾讯、华夏幸福等国内顶尖企业提供了优质的大数据智能决策平台。
领跑第三代大数据智能决策平台,让城市更智慧
随着智慧城市的纵深发展,越来越多的企业和政府需要倚重大数据的智能决策能力,来实现资源的高效配置。数据智能决策平台也在历经了简单的数据可视化、常规实时数据可视化等阶段之后,进入了基于多源数据、人工智能决策模型主导的、解决复杂系统问题的第三代平台时代,而相数科技正是这一趋势的引领者。
在智慧城市大数据平台方面,相数科技承担了北、上、广、深等重点城市多个重要的政府大数据决策支持平台项目,独创了基于多源城市数据传感器和融合多种城市大数据资源的城市大数据智能决策平台CityEye,定义了未来几年智慧城市数据平台的基本范式。
某公安禁毒大数据监控分析平台
城市综合治理平台
而在生态合作方面,一直以来,相数科技不仅与清华、北大、中科院等国内学术科研机构保持研究合作,同时还多次与Fackbook、谷歌旗下的Sidewalk Labs、IBM等世界顶级企业就物联网、大数据和数据标准等方面进行了技术交流与合作,在充分获得认可的同时,一些研发成果也已经准备运用到加拿大多伦Waterfront的智慧城市建设之中。
实现服务产品化,打造数据智能平台生态圈
互联网下半场已经到来,如果说互联网的上半场是做连接、连接数据和信息,从而获取大数据资源,那么下半场,如何对大数据资源开发和利用,利用大数据赋能来顺应时代发展的需求,则是每个企业和组织需要面临的首要问题。
在这一方面,相数科技已经走在前列,并通过一系列为行业头部客户服务的经验积累,将自己的数据智能产品和技术打磨的日趋成熟。此轮融资,将有助于相数科技在持续增强技术优势的同时,把产品和服务向行业深处延伸。此外,相数科技未来也将携手更多伙伴共同构建开放的大数据服务生态,为大数据产业落地提供技术和商业平台。
相数科技CEO周旺表示:本轮融资后,相数科技将会持续加大核心技术的研发投入,提高技术壁垒,并推进将成熟的定制化服务向产品化、云端化发展。同时,相数科技将竭力构建包含数据、平台、应用的产业生态合作圈,在不断开拓国内市场的同时,尝试海外市场的拓展。
上市公司/标杆企业分析
四维图新(002405):
四维图新立足数字地图,经十余年的创新发展,已成为导航地图、导航软件、动态交通信息、乘用车和商用车车联网解决方案以及位置大数据服务领域的领导者。近年来,公司通过系列资源整合不断完善自身生态系统:收购MapScape成为全球领先的导航地图编译服务提供商,实现NDS、RDF、GDF等各种数据格式的编译转换,并面向宝马、戴姆勒等提供全球NDS数据编译服务;收购杰发科技布局IVI车载信息娱乐系统芯片、AMP车载功率电子芯片,同时研发MCU(BCM)车身控制芯片、TPMS胎压监测芯片等,力争打破国外巨头垄断等等。未来,公司遵循“智能汽车大脑”战略,依靠高精度地图、高精度定位、算法、芯片、系统平台等优势,有望升级为自动驾驶解决方案提供商。
图:四维图新位置大数据服务
公司位置大数据服务主要基于海量交通出行大数据仓库、位置云服务平台及大数据生态系统,搭建集团级数据蜂巢系统,用最小的成本存储、定制、使用、交叉引用以及范式管理位置数据,形成SaaS平台输出能力,并面向政府机关、交警、公安、保险、互联网、运营商、物流、交通、气象等政企及行业用户,提供电子地图、位置分析研判及可视化处理、行业应用解决方案等,帮助用户获得位置大数据能力加成。目前,公司已与武大信息资源研究中心、公安部一所、中规院交通分院、苏州科达、上海电科、海信、浙江大华等多家行业领先机构达成战略合作。其创新应用产品MineData作为“数据+可视化+分析研判”的一站式位置大数据服务平台,已荣获ITS Asia 2017“创新产品奖”,2018年6月MineData2.0版本发布,系统数据总量已经超过4.7PB,数据日增量超过3.3TB,助力公司不断提升产业赋能价值。
2017年,公司实现营收21.56亿元,同比增长36.03%;实现归母净利2.65亿元,同比增长69.38%。2018年前三季度实现营收15.23亿元,同比增长14.96%;实现归母净利2.19亿元,同比增长38.38%。
表:四维图新历年经营情况 图:四维图新分业务毛利情况(2017,亿元)