大数据不是金融的灵丹妙药,有舍才有得
近年来“大数据”被广泛应用到各行各业,甚至有明显过热迹象,从央视的春运迁徙图到姚晨看到微博数据的惊呼,从两会期间的两会大数据到《星星》都叫兽的高低领毛衣,大数据被推到了一个前所未有的高度,同时也从一个高精尖的科研方向变成了一个世人皆知的词汇。而当“大数据”这个火热的词汇遇上了“金融”这个同样火爆的领域,会擦出怎样精彩的火花?
11月21日,毕友我师课堂第十四期活动在毕友创星谷举行,主讲嘉宾是西南交通大学金融大数据研究院院长及首席教授李维萍先生。李院长同时也是美国俄克拉荷马州立大学数学系终身教授和金融学研究员,密歇根州立大学博士,耶鲁大学数学系博士后,先后在美国加州伯克利MSRI研究所、普林斯顿IAS研究所、法国IHES⾼高等研究所、德国 Max-Planck研究所等世界⼀流科研机构做访问学者。在资产定价、信用风险管理、公司债券、数据科学等领域有着非常丰富和专业的研究经验。
李教授用通俗的解释、直观的图表、诸多的应用实例,从金融、数据科学以及两者的结合及应用等方面做了专业、深度的分享。
金融的要点——无套利
金融是致力于对投资进行研究的领域,金融产品是投资、价值和投资风险的一种工具。金融的要点是什么?李教授指出,金融的最大特点就是货币是存在时间价值的,金融产品的要点就是要实现同一种产品同一个价格,也就是无套利。
李教授还分享了最新前沿的金融领域关注的重点,以及目前尚未解决的问题,如股权溢价之谜、股利之谜、股权本土偏好之谜、巴克斯凯赫基德兰德消费之谜等。比如股利之谜就是一种很常见的现象,公司发放估计股利给投资者,投资者会对公司有更高的估值,而目前对此还没有一种被经济学家广泛接受的解释。又如股权本土偏好之谜发现,在很多国家个人和机构仅持有适量的外国股权,尽管他们有能力在国际市场上进行大量的投资组合的分散化。
数据科学不等于大数据
数据科学就是大数据吗?李教授一再强调这一被很多人误解的观念,指出数据科学并不等同于大数据。在今年8月底国务院发布的《促进大数据发展行动纲要》中提出了要“建立数据科学的学科体系”,“探索建立数据科学驱动行业应用的模型”,这里用“数据科学”要比“大数据”更恰当。
数据科学是一个多学科领域,是一个流程和系统,在大量的不同类型的结构和非结构数据中提取知识;同时也是一种数据分析领域的延续,比如统计学,数据挖掘和预测分析,也包括在数据库里面的知识探索。数据科学利用数据准备、统计、预测模型和机器学习来研究各种领域的问题,可用于市场优化、错误检测、风险管理、市场分析、公共政策等等方面。
数据科学不等于统计
数据科学也不等同于统计,统计只是其中的一部分。数据科学结合了数学、统计学、化学统计学、生物生命统计学,信息科学和计算科学的技术和理论,同时也包括了信号过程,概率模型,机器学习,统计学习,数据挖掘,数据库,数据工程,模式认知和学习,可视化,预测分析,不确定性模型,数据仓库,数据压缩,计算机编程,人工智能和高性能计算。
数据科学依赖于统计学、机器学习、最优化、信息处理、文本检索和自然语言处理来分析数据和解释结果。
数据科学的应用
数据科学影响了很多领域的学术和科学研究,包括机器翻译,语音辨识,机器人,搜索引擎,数字经济,也包括了生物科学,医疗信息,健康信息,社会科学和人类学。数据科学也对经济,商业和金融产生了很深刻的影响。从商业展望来看,数据科学是一个完整的情报竞争,一个新出线的领域,包括了一系列的行动,比如数据挖掘和数据分析。
比如,随着不断发展的GPS,图像和传感器技术的发展,作为标准的数据收集设备在农业装备、农民增产能够使用大量的数据。这些数据提供了关于农作物,天气,土壤特征和其他因素影响农作物的生长和产量。
又如,数据科学也被很多公司使用来查找出消费者想要什么,他们如何购买和他们未来会想要买什么,也即数据导购。目前,亚马逊和Netflix使用历史数据科学算法来创造“智慧产品推荐”为他们的客户。
再如,比较和评估机构的表现来让学生、父母和学术研究者是重要的研究部分。通过投资数据科学机构能够鉴别,基于企业需求引导培育学生(学习技能)增加就业机会。“教育文化大数据”在《促进大数据发展行动纲要》中也被明确提出,探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用。
金融+数据科学的应用
当金融与数据科学结合起来,又将用于哪些领域?李教授分享了其在债券市场、股票市场、新三板、银行和金融机构的系统性风险等应用实例。
比如,金融危机咨询委员会(FCIC)报告指出,在2007-2008年金融危机本来是可以避免的。他们总结了在许多有系统性的重要作用的机构中对公司治理和风险管理方面的巨大错误是引发金融危机一个关键原因。
统计学习问题并不包括预测一些列的数值,但是能预测给定某天的股票市场表现是上涨还是下跌。不确定性在金融经济学中对金融资产定价中扮演了一个中心角色。没有不确定性,许多金融经济学的内容将会是多余的。
大数据不是金融的灵丹妙药
介绍了这么多大数据在金融领域的应用,而李教授在最后总结并强调到:“对金融来说,数据科学不是灵丹妙药!不要期望大数据包治百病,金融实践要求有更高的技术来寻找投资和盈利的机会,但数据科学是不可缺少的。金融+数据科学对投资和管理风险来说是一种更好地方式”。