获悉,浙江数新网络有限公司(以下简称「数新网络」)近日宣布完成数千万元Pre-A轮融资,由国内顶级投资机构领投,泓沣,众灏跟投。本轮融资计划用于关键人才招聘和市场开拓。
「数新网络」是一家专注于云数据平台的大数据服务商,2020年7月成立于杭州。
创始人陈廷梁(花名:王贲)是原阿里云大数据平台研发总监,御膳房、DataWorks平台创始人,数加平台总负责人。硕士毕业于哈尔滨工业大学,拥有十几年的阿里、雅虎中国、盛大游戏等国内顶尖互联网公司任职经历,以及超过12年大数据平台研发经验。核心管理团队均为原阿里云高职级成员,研发人员占团队约80%。
从2012年加入阿里云以来,AI背景出身的陈廷梁从数据挖掘开始开发数据工具平台。他认为在阿里云最早做的御膳房才是代表了先进生产力的方向,也就是把阿里的数据开放共享给其生态,但这和阿里妈妈等主营业务冲突,未有更加长足的发展。因此,2018年陈廷梁离开阿里准备创业时,就是想坚持做公有云的云数仓,以及对应的开放共享模式。
2020年,陈廷梁开创云数仓/云数据平台方向,自主研发DataCyber产品序列,包括云数据平台CyberMeta,大数据运维平台CyberOPS,数据科学平台CyberScience,数据分析平台CyberExcel,致力于提供大数据时代的操作系统。
云数据平台CyberMeta是从数据汇聚到数据服务的一站式大数据智能研发与治理平台,集成了数据集成、数据开发、生产运维、实时分析、资产管理、数据质量、数据安全、数据共享等核心数据工艺,承上启下,让数据从采集到展现、从分析到驱动应用实现一站式平台服务。CyberMeta适用于需要打破数据孤岛、进行数字化转型的大型企事业单位或政府机构,帮助这类企业快速掌握开放自主开发与全栈数据研发的能力。用户通过一个平台,即可实现多种数据源接入与集群绑定、数据传输、离线计算与实时计算、数据治理与资产管理、数据接口开发与管理等各类复杂组合场景的应用。
大数据运维平台CyberOPS是集大数据集群的安装、管理、监控、诊断为一体的平台,适用于大型企事业单位或政府机构需要快速搭建大数据集群,安装、使用、管控大数据开发组件的DT基础设施建设应用场景。
数据科学平台(CyberScience)是一个为学校提供教学一体的教学实训平台,教师通过创建课程,在课程中配置课程内容、数据集和建模环境,根据学生名单开放权限;学生登录平台根据所学课程,创建实验进行建模,完成相应课程的学习和作业的提交。
值得一提的是,数据分析平台CyberExcel是产品序列中最面向大众的一款产品。通过一体化和标准化,产品通过封装有效降低用户使用复杂度,面向企业一线运营人员,让他们使用Excel模式就能简单地应用大数据计算、生成透视表等功能。
基于该四款产品,「数新网络」可提供数据汇聚到数据服务、高效建模、智能运维、智能分析的一站式服务,让数据从采集到展现、从分析到驱动应用得到高质量结合,整体提升企业竞争力。
DataCyber产品序列定位于通用的技术平台工具,也就是「数据网」——既可以提供公有云服务,也可以在大型政企的私有云部署。陈廷梁希望这两种版本的数据未来都是可以互联互通的,所以之后也会着力构建数据交换网络。
「数新网络」认为其对标公司是美国的Snowflake和Databricks,在陈廷梁看来,这两家百亿美金的大数据巨头代表了未来。
Snowflake 是来自硅谷的独角兽云数仓公司,2020年登陆纽交所上市时,曾创下史上最大 IPO的记录。Snowflake 颠覆了数仓行业,将计算分析和存储分离开,在云上建立一个高效、便于使用、性价比高的数据仓库。Snowflake在2020年做的Data Cloud(数据云)是在云数仓之上,大量租户可以在同一朵云上使用的数据平台;还提出了Data Consumer的理念,也就是各个租户之间可以进行数据交换。
Databricks最新估值380亿美元,是世界上第一个和唯一一个云中的Lakehouse(数据湖仓一体)平台。Databricks拥抱开源,优化大数据计算引擎,结合最好的数据仓库和数据湖,为数据和 AI提供了一个开放和统一的平台。
Snowflake坚持在PaaS层进行云化的商业模式,加上Databricks做大数据平台实时化和支持非结构化数据做智能分析的技术长处,是「数新网络」希望借鉴的优势。
「数新网络」希望结合全球云数仓先进理念,打造适合中国落地路径的云数仓体系。因此,CyberMeta,CyberOps和CyberScience这三款产品都结合了云数仓与云湖一体的模式。
陈廷梁认为,Snowflake的公有云体系在国外的环境中更容易发展,国外的世界500强企业基本都是私营企业,可以直接使用公有云。而国内只有体量比较大的企业客户对数字化的要求更高,才需要用大数据平台和算法平台这种基础设施,且他们更倾向于用私有云部署。这个矛盾之处让云数仓体系在国内比较难实现。
然而,原来阿里云的公有云架构在做私有云部署时底座过大,需要数十台服务器支持;同时,这个底座也与开源生态不兼容,导致许多大型客户担心被阿里云绑定,导致跟主流计算引擎脱节,无法迁移替换。
因此,陈廷梁基于在阿里云的经验积累,结合国内实际情况,对产品做了很大的改变,核心打造独立自主可控的一站式、云原生大数据基础设施平台,实现弹性可扩展、混合云/私有云的灵活部署。
「数新网络」采取的核心策略就是基于开源,也融入开源生态,打造国内云数仓顶级开源社区。即对于云的大数据底座,尽可能用开源的主流生态,产品只做数据平台层的建设。对于重要标杆客户,还可以基于开源底座做定向代码开源。
另一方面,「数新网络」也顺应大数据架构在近十余年来的变化趋势,采用Data Fabric,也就是数据平台智能化,让数据开发和算法开发更加「傻瓜化」。
据介绍,「数新网络」致力于提供大数据时代的主板和操作系统,以开源一站式地支持底层的各种计算引擎,相当于作为集成不同计算引擎的品牌电脑,提供封装以及上层更简单易用的操作系统。
陈廷梁提到,用这个模式尽快确立市场优势后,会把基础架构再开源,就可以支持大量在此基础上开发的数据中台等系统。
「数新网络」拓展了适合国内企业的云数仓基建模式,成熟的解决方案主要应用于场景金融、政务数字化转型和先进制造等领域,也包括医疗、零售、能源等行业。
目前,其标杆客户包括浦发银行、华泰证券、高济医疗、中国石化、国家电网江苏省电力公司、屈臣氏、中国航发、浙江银保监局、香港大学等政企单位。
「数新网络」的产品大数据运维平台(CyberOPS),帮助浦发银行解决内部五大数据集群(批量数据集群、流式集群、联机查询集群、洞察集群、租户集群)包括其各服务组件安装、升级、监控等运维复杂度高、人力投入大等问题,提升平台整体运营服务效率,有效保证平台的可用性。
云数据平台(CyberMeta)产品帮助国有大型能源公司建立数据中台。提供实时开发平台,通过Flink+Kafka技术实现实时的数据采集和数据处理能力,支持异构数据源读写,自动构建血缘关系。同时,也提供统一的数据资产管理平台,通过元数据采集对资产进行统一的管理,形成资产目录,提供全域数据检索能力,对数据热度分析并出具报告,对资产进行盘点,监控元数据变化。
数据科学平台(CyberScience)也作为高校科研实验平台,全面对接公有云,实现建模环境的服务化,其中建模环境与工作目录分离并可配置空闲自动关闭,同时与数据集隔离,实现数据集安全共享,另外模板化方式集成各种建模工具,方便用户快速上手。
在金融领域,「数新网络」还拥有金融产品超市、科技金融贷、抵押在线登记、保险在线快赔等产品,打造金融综合服务平台解决方案。
大型政企是「数新网络」瞄准的核心付费客户,但下半年也会开放开源的基础版本,给互联网企业或普通民营企业使用。「数新网络」重点服务金融领域,希望能够覆盖到更多的中小微企业及个人,提升社会效能,从而让每个人都能够享受数据的价值。