您正在访问的是FX168财经网,本网站所提供的内容及信息均遵守中华人民共和国香港特别行政区当地法律法规。× 关闭

FX168财经网>区块链>正文

金色沙龙第七期圆桌论坛:区块链数据挖掘及应用

www.d88.com www.hbshiqi.cn 文 / 普普来源:FX168财经网

廣告
廣告

金色财经讯 本期金色沙龙将以区块链行业数据挖掘和解读为主题,邀请Chaindigg创始人/CEO 叶茂、BTC.com CEO 庄重、PeckShield创始人蒋旭宪、TokenInsight CEO 呼涛、同济金融人工智能协会会长乔烨、链塔智库CEO张翔、港盛科技CTO&联合创始人史亮、拾斗量化创始人牛神、库神COO,联合创始人 张玉等业内知名人士进行观点分享。

7eSfG4p7bLqMPyECkO0SgF0ZTDjQAqt2dfftsBB7.jpeg

在本期金色沙龙最后的圆桌论坛环节,BTC.com CEO 庄重、港盛科技联合创始人cto史亮、链塔智库联合创始人于睿、chaindigg创始人叶茂、拾斗量化创始人牛神、库神联合创始人coo张玉,在金色学院创始人安鑫鑫的主持下,就“区块链数据挖掘及应用”话题,展开了精彩讨论。

安鑫鑫今天的主题是数据,大家刚刚听了各位嘉宾的分享,有没有一些思考呢?在这个行业里面,数据是大家不太关注的一个企业类别。但是它对行业的价值,是非常大的。数据主为分为两个大的方向:一个是链上数据,可以反映出来很多方向;另一个是交易数据,是偏金融、行情的数据。接下来从不同的角度和各位嘉宾,再深组分享一下,再讨论一下。

很多嘉宾都是有非常强的传统数据或者传统金融的背景,所以第一个问题是:与互联网大数据挖掘相比较,区块链领域的数据挖掘,有什么相同和不同点?

于睿:我们观察这个行业有几点很有趣:和传统互联网相比最大的不同,传统互联网行业先兴起,有数据。但是在区块链行业则相反,数据研究机构是在推着行业往前走。这个背后的逻辑不同之处在于,面对的客户需求不太一样。我们观察这件事遇到了很多尴尬,比如链上的数据,我们做了很多调研,想去参访这些用户。但大家给我们的反馈,你就告诉我买哪个能赚就行。这是在座的各位,应该去琢磨的事,这是区块链的一个特点。

第二点,真正推动这个行业的发展,大企业和传统企业还没有进场,我们怎么通过数据吸引他们进来,这也是一点。

张玉:因为我做钱包之前,一直做人工智能方面的事情,主要给银行、保险公司做数据分析。我谈一下我的理解,传统互联网和区块链数据挖掘不一样,从数据形态来看,目前区块链数据以结构化数据为主,非结构化数据,例如像语音、图片,还没有大规模上链,所以现在数据量还是比较小。第二是量,虽然刚刚统计数据有很多TB,但是跟任何一家银行、保险公司的量都没有办法比。所以在量和形态上,有很大的差距。第三,从分析方法来看,传统的数据挖掘主要是做异常检测、放量分析等事情。目前来看,区块链还在这个范畴之内,可能会偏统计一些,真正的数据挖掘的工作才刚开始。

第四,关于应用场景,从深度来看还比较初级。在传统金融行业,已经从业务层面,比如从获客到风控、运营、服务,每个环节都有非常多的业务场景。区块链目前还主要服务于交易,所以在分析深度上,还远远没有达到这么深的层次。

叶茂:先说一下我的观点。关于传统数据挖掘跟区块链数据挖掘的异同点,相同的地方,整体的基础框架是类似的,是用类似的方法做数据的分析、关联、挖掘,基础框架是类似的。特别是区块链里面一些非链上数据,比如我们抓取数据,会提取论坛、网站的数据。这些数据跟传统的大数据挖掘更相似,用到的方法也相关。不同点在于哪?一方面区块链的链上数据它有一个特点,区块链的链上数据会有分叉的该。分叉意味着,如果要做实时的数据挖掘,我们要关注后面最新的区块怎么来处理数据的变动。如果没有处理好这个环节的话,数据通常在我们的结果里面,在某些时间点上,出来的数据是不太准确的。所以分叉怎么去处理,这可能跟传统不太一样。第二方面,因为在区块链里面,有一块是链上数据,链上数据很规则,它包括区块、交易和规则。我们还要结合非链上数据,就是刚刚讲到的从点论坛、暗网拿过来的数据。这类数据跟链上的数据如何关联进行挖掘,这一块也是一个要考虑的。这不是一个纯数据的关系,会有这么一个差别。

史亮:我之前在传统金融做了十多年,所以对传统金融IT和数字资产的IT有些了解。对于刚刚叶总讲的我非常认同,其实数据挖掘,就是大数据、人工智能如果大家真的关心,并且想在区块链行业未来做这块的话。原先在互联网里的一些技术,或者对应的基础框架是可以照版照用的,这是过去五年积累的非常有用的。差异点在于,区块链是一个有序的数据,所以它把原先互联网上一些无序的数据存储直接在底层进行了有序,所以它的数据可靠性更高。大数据分析做人工智能数据挖掘的时候,有很大一部分时间用在数据清洗上面。一些可靠性不高、波动的数据,甚至历史的数据会有变化。这些在未来区块链应用的时候,这些情况会变得更加好。所以到时候整体的数据存储,会变得更加可靠、有效。在数据抽取、清洗和规格化方面,我相信原先投大量资源在人工智能和大数据上做的事情,通过区块链底层,就可以省下来了。像分析的方法,这个部分一定会在区块链上面大放异彩的。

庄重:刚刚各位嘉宾聊了,区块链上的大数据有一点,最初做区块链行业的人不太多,偏统计的比较多一些。随着这个行业的发展,这一步门槛过了以后,重新去发掘大数据领域积累的技能。我们也是有一些困惑,有些数据信息怎么样让普通用户觉得是有趣的,另外提供这样服务的时候,怎么保证有公信力。因为一些链下数据的抓取,存在一些公信力的问题,这也是我们在产品上遇到的一些困惑。

安鑫鑫:刚刚大家聊到这个行业还是很初期,很多在通过数据推动行业的发展,整个数据的产业也处于初步阶段。接下来大家站在行业的角度上,思考一下数据这个板块,因为在座的朋友更多是一些从业者,大家在看一些方向。在数据板块,哪些方面未来还有机会,以及一些瓶颈,难点在哪?

庄重:跟各家厂商的定位有关系,因为我们自己的定位是面对不同的区块链爱好者,包括一些开发者。从我们自己的角度出发,我们是更希望自己是一个只提供最客观数据的提供方,同时怎样让开发者在接入我们API的时候更方便,查询接口也更友好。也是怎么样能够基于我们平台,可以做一些比较复杂的查询任务,或者做一些定制化的需求。我们自身比较希望偏技术一点,希望让用户自己在上面发掘探索出,基于这些数据想要达到的效果。

安鑫鑫接下来有没有一些大的方向的规划呢?

庄重:首先是API的易用性。今年会看目前的情况,会类似推出一个,你可以在我们平台定制一些比较复杂的企求,这些企求不是实时返回的。我们想给开发者做一些深度的支持。

安鑫鑫BTC.com,大家平时有用吗?我用得最多的是上面查地址、查交易。

庄重:关于地址的话,可能会在今年推出一个新的改进。当然是比较初级的,就是针对一个地址,我们会尝试给你反馈,我们认为它们的关联性,这样对于呈现一个比较完整的基于比特币的信息。这是接下来我们会在地址查询上,做的迭代。

史亮:我跟在座的各位不太一样,我本身不是一个数据挖掘分析方面的专家,我偏向于金融IT,对投资标的、业务这块比较了解。在这个沙龙之前请教了一些朋友,包括一些大数据、人工智能的朋友,去看利用区块链的方式,去解决一些数据的问题会怎么样,接下来的发展趋势会怎么样。

整体聊下来,在一些顶尖的人来看来,这个行业还是有比较大的前景。在于区块链领域的深度数据挖掘和人工智能这一块。因为它跟现有的大数据和人工智能比较典型的差异在于,它颠覆了一些底层的东西。现在我们看到的大数据也好,数据挖掘也好,是基于谁能够抓到数据,谁能够获取数据,并且存储到这个数据。它的使用者和所有者之间是不一样,大家知道数据并不在你的手里,而是在存储者的手里,它是真正的使用者,去深度理解和使用这些数据。甚至所有者和使用者有一个对抗的过程,我们发现很多对抗,我不愿意把这个东西放到支付宝上,但是没办法,有时候为了便捷就这么做了。这个过程会被区块链颠覆掉,这是大家在认知上有所共识的东西。因为区块链能保证数据可靠性的同时,会引导数据所有权的保有。让你保有这个数据,允许让别人使用数据的同时,你会得到对应的收益。这种收益转移,不是把数据卖给了某个大公司,你就再也无关了,不是的。接下来大家会更乐意去分享真实可靠的数据,并且把真实可靠的数据聚拢到区块链上。这时候我们做深度挖掘和分析,精准性会更高。我拿到的所有信息都会真实,我做的所有事情都会让信息的所有权获益。你得到便捷的同时,说不定还能得到一些额外的奖励,比如币。

所以我觉得这个行业未来的发展空间非常大。这个行业的数据非常有限,而且链上存的内容非常有限,很多实际场景的数据还没有到链上去。链上的数据,都可能是为了某些活动,比如某个游戏随意放在上面的数据,它的数据还没有到生产领域的时候。但是这会改变的,改变过程中需要很多技术专家、业务专家,和相关从业者一起来推动。当下我们做大数据挖掘,又走在区块链上,这是一个很有前景的方向。

如果整个区块链行业起来了,区块链金融对应的、数字资产的交易、数字资产跟全球其他资产之间的交换,都会成为大的可能性,这个行业也会顺起来。

安鑫鑫刚刚讲到了一个新的方向,就是数据与区块链的结合的应用,这是区块链应用的一个很大的方向。第二,发现链上的数据,现在可能大部分都是偏交易的,币与币之间的交易数据,还可以增加更多的新的数据点。

叶茂:刚刚史总讲得很好。从我来讲,区块链行业的数据分析才刚刚起步,传统方向上每个领域都会有很好的数据分析公司出来,因为数据是一个底层的基础。区块链还属于比较早期,里面有很多机会。比如对数字货币的一些跟踪应用,它的能力就可以帮我们更好地做链上数据规整,还有出现问题之前的预警,还有出现问题之后的弥补。这一块对于行业非常有帮助。

第二部分,区块链数据有个很大的特点,它是容易获取的。什么意思呢?数据只要在区块链里面有一个节点,公链的数据都可以同步过来,这给大家很多机会,因为已经不存储获取的门槛了。大家所要关注的就是怎么样把数据利用起来,比如一个利用的方向,利用数据做量化交易,或者用数据去做一些跟分析报告相关的事情。以量化来讲,量化策略非常多,不同的人可以根据数据研究出来不同的策略,这些策略就可以在现实生活中进行利用和回测。

第三部分,区块链数据和其他数据的关联,比如跟非链上数据的关联,比如行情数据、其他地方采集的数据。链上数据跟这些数据的关联,会产生一些很好的组合效应,看能够应用到什么地方。目前区块链的数据应用还比较窄,DApp上面也可以做一些分析,比如哪些DApp更容易获得用户的DApp,都可以算出来。

安鑫鑫TokenInsight是行业比较领先做链上数据的,现在很多做数据的方向,都在偏向为投资者服务。大家知道如果数据能指导你多赚一分钱,或者少赔一点钱,意义就很大了。第一步是发现数据,第二步是处理数据,第三步,做一个显性的数据,让数据的作用更加直白的表现出来。

张玉:现在大家对于区块链认为是价值互联网,目前大家对现有的数字资产的定义说白了,是对数学模型、经济模型比较信任,产生的信任资产。像大规模增值的资产,尤其是数字资产,有我们个人的身份数据,还有个人账户的行为数据,大量的上链以后,才有可能产生真实的数据资产。这个部分还有待于新的技术能够突破,才能够完全解决。因为目前的量,希望有更多的技术方,能够在底层的公链上有所突破,把数据资产上链的事情给解决,再谈数据挖掘、大规模的应用,才比较现实。

安鑫鑫等于提了一个需求,给数据提供方。

于睿:几位讲得太好了,我再说一个点。目前好像数据行业实现数据资产定价,包括交易过程,希望未来链上链下数据打通,包括分析的框架和方法论。应用方面刚刚几位谈到了,现在链上可以呈现的数据非常单一,未来数据量变大以后,这个情况会怎样,也需要大家去探索。

然后,给大家提一个问题,我看到前两天一个新闻,日本发行了数字货币,今天央行有消息,央行也要发。这个市场形成以后,在座的各位做的事情,是不是能够应用过去?

牛神:其实所有数据的基础性的分析或者工作,今天叶总讲了一个比较好的应用方向和场景。我能够想到了,因为我们是做量化交易的,这些数据分析我考虑到两个方面。第一,在金融科技上的应用上。第二,在区块链产业上的应用,在数字资产上它是一个自由金融的市场。一些数据团队,给这个行业提供了比较系统化、真正的数据分析,对行业的是非常有帮助的。

uCket2RJYeIQzn1o80NUonyUet4KrkFIMjeRQBLx.jpeg

安鑫鑫:刚刚各位嘉宾讲得很深了,把我后面的问题已经回答了。接下来再聊一个问题,每个人、每家的数据产品,有非常定向的服务需求。大家更加分散地去看,看现在的市场对数据的真正需求是怎样的,是怎样的用户人群,更加需要什么样的数据。各位对这块有什么更深的思考,它不局限于自身的产品,而是对整个数据行业有一个思考。甚至于对行业外的人,有一些思考。

牛神:我想了三个方面。

第一,我看叶总的PPT讲了比较一个刚性的需求,政府部门监管的需求,对数据非常重要。

第二,做量化交易,对基础性的数据API也是一种刚性需要。

第三,区块链行业的投资人也好,还是行业从业者也好,对数据的需求也是比较强的。所以从这种角度来讲,这个市场刚性的需要还是比较重要的。因为在整个币圈区块链是一个非常自由的市场,公信力是非常重要的。

于睿:我们希望结合数据,让更多的传统的钱和行业建立认知,然后再建立信心,这样才能推动行业的发展。

安鑫鑫链塔智库在传统行业有很深的资源,现在链塔做的事情是对行业非常有帮助的,一直在总结和汇总行业各种各样的信息。向传统行业的人传道布道。

张玉:我的观点是这样的,如果是从目前区块链应用的场景来看,我们叫交易行业。交易行业从获客到风控、运营、产品的定价和最后的服务,整个环节大家都开始用了。举一个例子,比如钱包支持某个币种,肯定要看这个币种它的地址用户量、活跃活度,全球那么多币种,我们不可能把每个币种都加进去。数据挖掘和数据分析的工作,对整个产业链有一个比较明确的应用了。包括金色最近也在做数据分析,这是从当前的状态来看。我们作为从业者,更大的希望还是希望区块链未来能应用到其他行业,这个里面非常重要的一个点。我们必须要能解决一些资产上链的问题,有哪些资产能够数据化,把数据化的资产能够搬到区块链上来应用,这里面我认识到非常多的公链在尝试,目前还没有大的突破。我相信这是一个大的趋势,我觉得传统大数据分析的方法和成果,都可以直接过来应用。我更看好的一个点,我们早期做金融行业数据挖掘的时候,做不到全生命周期分析。就说客户跟企业的关联,分散在不同的渠道里面,有电话、网络、微信,各个渠道都没有打通。现在能解决这个问题,但是没有办法搬到链上去。如果没有一个好的技术,即使有区块链也没有办法满足。所以如果要更快的发展,很多东西要突破,这需要大家一起努力。

叶茂:刚刚我讲了几个点,包括对政府、对个人、对量化,这也是一部分应用。其实在区块链上还有很多可以做的事情,举个例子,怎么在传统世界,我们会用数据挖掘会做精准营销,在区块链上面,一个项目方它也需要做营销,但是这个营销怎么做呢?可以在区块链上利用数据去做一些分析,可以让项目变得更有效率。第二方面,我们现在关注数字货币这个方向,除了数字货币,现在在国家层面上更提倡无币区块链,也就是区块链应用完以后,区块链上的数据是存在的。这个数据跟实体结合,如何用,也有一些相关的方法。这个方法去借鉴,去做其他链上的数据挖掘,这里面也会有很多空间。更大的范围和空间,是在以后。因为这些链随着区块链不断的推进,会不断的产生结合。用怎样的方式,推动实体经济,这是非常厉害的。

安鑫鑫刚刚提的大部分偏链上数据,港盛科技做的是偏交易所相关,所以它和交易所的数据相关。讲一下在整个措施过程中,交易所的交易产生的哪些数据,是有很多价值,对市场是用指导意义的。

史亮:我讲一下金融交易相关的话题。数据分析和数据挖掘,在金融里面有三个方面的应用,可以帮助大家很快去落地,并且是有很大的前景。第一,清算结算业务,清算结算业务大家毋庸置疑。数字货币的交易大家对清结算还没有感受,但是在传统金融里面,区块链在清算结算上的应用已经开始了。国内也好,国际也好,一些大的银行、大的交易机构,已经开始用一些区块链的技术做清算结算,来保证数据的可靠性、准确性。这个领域里面在于数字货币的交易里面清算结算的业务,一定是基于区块链技术来充分使用的。这一部分给普通的炒币者和机构带来很大帮助。

第二个是风控,因为数字资产涨幅、跌幅非常大,所以大家觉得我已经做了高风险的事情,但是高风险在哪里,大家没有特别深的判断。所以实际上来说,你做金融交易、做金融投资,最关注的就是风控,这是它的核心所在。所以实际上你如何做好风控,在这个过程当中是非常重要的事,而风控的分析需要用到大量的数据。这不是交易过程中的风险控制,有事前、事中、事后三个方面都要做。这里面有大量的模型、数据的处理、数据的挖掘,我要看投资交易数据以后,到底风险收益比率是怎样的,我做这笔交易,如果投前还有一个分析的过程,我们还会有一些场景分析的做法,就可以更有帮助。所以这个里面需要大量准确的数据,数据的准确性会帮助到大家很多。这一部分是风控要做的,这对于普通数字货币投资者来说,一个是反欺诈,一个是我的币去了哪,所有的交易过程是可追溯的,现在是不可追溯的,所以才有了去中心化的交易所。这也区块链可以在交易里面的一些布局。

第三方面是分析。这在传统行业里面都是刚起步,大家知道人工智能神经网络在投资领域里面,模型在量化里面刚开始的应用,而且在过去几年的表现都还是不错的。甚至在非交易里面也表现非常不错。实际上在数字资产交易里面,也可以大量使用分析类数据。分析类数据,也需要大量的数据做支撑,并且还需要分析模型。这三方面的应用,肯定会帮助到个人投资者也好、机构投资者也好,还是投资机构、管理机构,把整个交易做得更加健康健全,让整个数字资产、投资交易变成一个大的金融体系,合规合法地往前走。

安鑫鑫大家知道BTC.com是比特大陆旗下的子品牌,为整个区块链行业来服务的。真正通过链上数据,尤其是比特币的链上数据来反映一些情况。近期有没有一些数据,比如挖矿的人数上升还是下降,交易的人数有没有变动,或者持币的用户有没有变动,有没有发现这样的数据呢?

庄重:因为我们有矿池业务,我关注更多的还是全网的算力,包括这些算力的来源。我们也发现了一些奇怪现象,我们观测到算力下降,这些算力会从BTC流入到BTH,但是整体算力确实有一些减少。最近的价格和矿机价格也有一定的关系。近期有一定的算力减少,但是跟最近的价格也没有太大的关联,这也是最近注意到一个比较奇怪的现象。

最后我们从欧洲地区新了一些新的算力增长,用户数很多,但是平均的量跟国内差别还是很大。大家之前关注的伊朗,确实能看到,但我们不能给提供服务。我们自身也注意到,从去年丰水期、枯水期,从我们内部可以看到算力迁移的情况。所以做区块链数据分析,我们自己也需要知道把链上链下数据打通。比如在我们这里很难拿到交易所的数据,刚刚有嘉宾谈到数字货币,从现在开始会有一些闪电网络新的应用。这些我们也是想尽量能够抓住这些新的热点,我们的强项还是在于新的技术探索上。我们对比一些传统做数据分析的厂商,这方面我们还是有所欠缺的。我们还是先在技术服务上,帮助大家先知道一些策略,或者一些其他情况。这是目前我们的考虑。

安鑫鑫今天聊得挺深入的,圆桌到此结束了,祝大家新年快乐。

来源:金色财经

分享

相关文章

48小时/周排行

最热文章
  • FX168财经APP下载