摘要:通過對訂單和選定加密貨幣交易的分析,CryptoIntegrity數據科學團隊發現86%的平均交易量和88%的交易額都是人為做出來的(HitBTC和Huobi因為其他原因沒有包含其中,具體原因將在下文中提到)。...
本文來自 Medium,原文作者: Crypto Integrity 數據科學團隊
Odaily 星球日報譯者 | Moni

根據 Crypto Integrity 數據科學團隊發布的一份最新報告,多家頂級加密貨幣交易所存在惡意刷單行為,包括OKEx、Bit-Z、ZB.COM、CoinBene、LBank、Huobi Global、BW、HitBTC、IDAX、BitMart、以及 CoinTiger。通過對訂單和選定加密貨幣交易的分析,Crypto Integrity 數據科學團隊發現 86% 的平均交易量和 88% 的交易額都是人為做出來的(HitBTC 和 Huobi 因為其他原因沒有包含其中,具體原因將在下文中提到)。而有些加密貨幣,檢測到的虛假交易量占比甚至接近 100%。
在進行具體分析之前,星球君(微信:o-daily)將簡單概述一下本文的大致框架,基本上將會被分成以下幾個部分:
1、市場概況
2、交易額對價格的影響
3、市場操縱行為
4、通過交易所圖表進行市場數據分析
5、流動性分析
6、應用方法論
7、數據樣本
8、已知問題
下面,就讓我們一起看下 Crypto Integrity 數據科學團隊本次針對主要交易所刷單欺詐問題的分析:
1、市場概況
下圖是 11 家加密貨幣市場頂級交易所 2019 年 2 月的 30 天交易額,數據源:CoinMarketCap

在 CoinMarketCap 上有 241 家加密貨幣交易所,顯示的交易額數據都很高。在這 241 家交易所中,有27家的調整后交易額為 0,而報告交易額(reported volume)是 935 億美元,占到全部報告交易所交易額的 21%,這 27 家交易所大多數是期貨交易所,還有一些提供零交易費的交易所,其中包括 BitMEX、Bithumb、Cobinhood等。
30 天總交易額(%):$441,557,469,457 (100%)
排除后(Excluded)交易額(%):$93,511,692,648 (21%)
調整后(Adjusted)交易額(%):$348,045,776,809 (79%)
調研后(Researched)交易額(%):$118,802,880,621(總交易額的 27%,調整后交易額的 34%)
本研究覆蓋了截至 2019 年 2 月 28 日 CoinMarketCap 平臺上 30 天調整后交易額排名最高的 11 家加密貨幣交易所,這些交易所的交易額占到了二月份調整后總交易額的 33%,本次分析主要側重于每個交易所上幾個最具流動性的加密貨幣。值得注意的是,這些交易所都不支持法定貨幣。此外,正如 BTI、CER 和其他一些研究方一樣,Crypto Integrity 數據科學團隊本次分析樣本不應具有代表性,因為他們有意集中在一些有可疑交易活動的交易所上。不過,分析結果能夠讓你對加密貨幣市場里刷單交易有更好的了解。
下圖:截至 2019 年 2 月的加密貨幣交易所交易額,這些加密貨幣交易所交易額全部都是非零調整后交易額。(數據源:CoinMarketCap)

下圖:截至 2019 年 2 月交易額排名前四十的加密貨幣交易所,Crypto Integrity 數據科學團隊分析了 CoinMarketCapo 平臺上排名前五十的加密貨幣交易所,交易額都是非零調整后交易所。另外,Crypto Integrity 數據科學團隊還預估了真實交易額,但其中沒有包括 HiBTC 和 Huobi Global 這兩家加密貨幣交易所。

需要注意的是,本次研究并沒有涵蓋場外交易(OTC)市場。
2、為什么你應該關注這個研究?
真實交易額不僅是評估加密資產固有價格的一個重要指標,其變化也可能也會是投資者分析加密資產未來價格走勢的一個指標。從理論上來說,市場資本化和加密貨幣價格(類似于股票或商品價格)取決于需求和供應兩者之間的平衡。反過來,需求取決于預期投資價值(也就是有多少人會購買或持有一種資產)和實用價值(也就是有多少人會使用這種資產)。總之,真實交易額這個指標反映了市場對某個加密貨幣技術或效用的興趣,以及散戶投資者和機構投資者是否會大量購買該加密貨幣。興趣越大,交易額就越高。此外,真實交易額還取決于交易量中的真實流動性和其他隱私,其實對投資者和交易中來說都非常重要。如果用數學公式表達的話,如下所示:
價格=f(V, P1,….PN),其中V就是交易額,P是其他一些參數;
交易額=f(L, K1……KN),其中L是流動性,K是其他一些參數。
簡單地說,如果想要做出均衡的加密貨幣投資決策,就要了解真正的流動性和交易額。傳統金融市場有許多工具來防止市場數據作假,但目前加密貨幣行業似乎還沒有太多這樣的工具,因此交易所的一些惡意行為也很容易影響到投資者和交易者。
3、市場操作行為
在受監管的金融市場里,很多惡意交易行為是被明令禁止的,其中最常見的就是刷單交易和破壞性交易、比如欺詐、塞單、Flipping 等(注:Flipping 交易是值投資者以報價獲得首次公開募股(IPO),然后在 IPO 剛剛啟動并在公開市場交易后不久,便立刻賣出來快速獲得回報的行為)。在本次研究中,Crypto Integrity 數據科學團隊重點關注的是刷單交易(Wash Trade),這也是加密貨幣市場里最普遍的市場濫用行為,預計之后他們的分析方向就會涵蓋其他主題。
根據 The Audiopedia 的解釋,刷單交易是指通過人為增加交易量來誤導市場參與方,讓投資者和交易者誤以為某個加密貨幣的需求量大于實際需要。
Crypto Integrity 數據科學團隊以及在之前的文章《加密貨幣市場的刷單交易——BW交易所案例》(Wash trade in cryptomarkets — a case of BW exchange)中分析過刷單交易的受益者。不過,本文關注的重點問題是刷單交易在現實世界中如何通過欺詐性交易實施的,Crypto Integrity 數據科學團隊總結了三種主要的刷單機制,并按照實施(檢測)最簡單到最難進行了劃分,分別是:
1、沒有限價訂單的內部交易
2、具有短期限價訂單的內部交易
3、由短期限價訂單引起的附近價差交易
沒有限價訂單的內部交易。由于這種交易即簡單又沒有風險,所以經常會在一些“涉世不深”的交易所里出現。一個有欺詐交易的交易所通常會報告一筆交易,但他們的實際交易委托賬本(order book)里卻不會有任何變化。這種做法本身倒不會有什么風險,因為在幾分之一秒內交易委托賬本不會存在限價訂單,所以其他參與者根本無法與這些訂單進行交互,只有交易所自己才能維持這類交易活動。
具有短期限價訂單的內部交易。沒有人被禁止用中端市場價格出具限價訂單,這樣一來會增加流動性并讓加密貨幣價差進一步擴大。相比之下,這種訂單在交易委托賬本里可能只會存在幾毫秒,因此人們無法“擊中”這些交易,甚至根本都看不到有這些交易。嚴格來說,并非所有的“短命”交易訂單都是惡意的,畢竟有些投機者和套利者會監控所有收到的訂單,然后迅速捕獲那些能為他們提供交易機會的訂單。
由短期限價訂單引起的附近價差交易。為了繞交易流程更加有機,一些交易所已經升級了更先進的刷單交易機器人程序,以便在最佳買入時間點附近進行出售交易,并且在最佳賣出時間點附近進行買入交易。需要注意的是,刷單交易者其實根本無意和市場上的其他參與者進行實際交易。為了最大限度地降低出現這些交易真的“被交易”的風險,交易所通常會把限價訂單時間社會自衛幾分之一秒,然后進行快速處理。
那么如何定義一個刷單交易呢?一般來說,一個 0.5 BTC 的限價訂單緊跟在一個真實的 0.5 BTC 市場交易訂單之后 50 毫秒就被完成交易的話,就可以將其歸類為刷單交易。不過現在,這些制造刷單交易的人也不是省油的燈,他們也在不斷改變刷單交易策略,比如:
1、放置一些不同交易額的限價訂單;
2、放置一些不同交易額的激進訂單(aggressive orders),有的比靜止訂單(resting order)規模大,有的比靜止訂單規模小;
3、放置不同生命周期的限價訂單;
4、放置不同生命周期的激進訂單(在這種情況,交易所會把激進訂單的大小調整的比靜止訂單更大一些,以便激進訂單能被部分填充,然后變成一個新的靜止訂單)
4、交易所
以下圖表展示了所選交易所上存在可疑交易活動實例,并附有簡短評論。確定產生可疑交易活動的機制被總結在每個圖表下放,由于來自 Huobi 和 HitBTC 兩個交易所的數據存在某些問題,迫使我們把這兩個交易所排除在這次分析之外了。
下圖,識別可疑交易活動機制——Crypto Integrity

OKEx,算法檢測到某些加密貨幣存在內部連續交易(in-spread trades),需要對短期訂單進行更徹底的分析;

Bit-Z,系統交易實在不改變買賣價差的條件下進行的,但是買入價格賣出價表現極不穩定,因此說明該交易所流動性很低;

ZB.com,該交易所內部進行的連續交易和非連續交易都和正常的好交易(decent trade)一起被監測到了。

CoinBene,短期現價訂單存在廣泛的買賣差價,這些訂單也是由系統自動進行內部連續交易的。

LBank,該交易所在連續一段時間內的隨機價格內部連續交易占主導地位,賣出交易的價格高于買入交易的價格。

Huobi Global,由于市場數據每1-3秒進行快照,因此數據可能并不準確,也無法回復真實的市場歷史交易數據。
BW,以中端市場價格系統性地進行買入和賣出連續交易。
HitBTC,即使在某些加密貨幣中有非常狹窄的買賣價差空間,該交易所也被檢測到存在內部連續交易。
IDAX,該交易所短期現價訂單存在廣泛的買賣價差,這些訂單也會被系統地進行內部連續交易,LTC / USDT顯示了沒有限價訂單的另一種模式。
BitMart,該交易所和IDAX很相似,有兩種檢測模式:內部連續交易(比如ETH/USDT)和無限價訂單(比如BTC/USDT)。
CoinTiger,以中間市場價格進行買入和賣出的內容連續交易。
5、流動性
Crypto Integrity 數據科學團隊總結了三種流動性指標。
1、便利流動性(Handy liquidity)是一個交易委托賬本里的累積交易額,流動性水平可能會比原生中間市場價格相差0.5%(或是更少)。流動性資產越多,便利流動性就會更高。
2、內部連續買賣價差,這是一個百分比數字指標,其計算公式如下:
(最佳賣價-最佳買價)/【(最佳賣價+最佳買價)/2】*100
很多流動性加密資產具有較窄的內部連續買賣價差。
3、10BTC 內部連續買賣價差,這也是一個百分比數字指標,其計算公式如下:
(賣價-買價)/【(賣價+買價)/2】*100
買價和賣價是 10 BTC 的總交易額的加權平均價,流動資產越多,內部連續買賣價差范圍就越窄。
上圖是加密貨幣交易所流動性匯總(BTC/USDT交易對),綠色表示高流動性,紅色表示低流動性,該分析是以 Coinbase 交易所數據作為基準的。
令人驚訝的是,在觀察分析的這段時間內,BitMart 的便利流動性最高,OKEx 所有三個指標的預估值都表現良好。但是,這個結果仍然需要進一步分析,因為交易所對外公開顯示的流動性可能不等于他們真正可獲得的流動性。據悉,一些欺詐交易會以特定類型的限價訂單形式出現,而其他市場參與者是無法觸及這些交易的。
6、方法論
系統分析是通過每個選定加密貨幣交易所的原生應用程序接口(API)收集的市場數據,這些市場數據由交易委托賬本(如果適用會不斷更新)和交易組成。
可疑交易(刷單交易)的定義:
1、如果交易發生的價格高于最佳賣出價、或是低于最佳買入價,那么這類交易就會被視作為“非連續內部交易(out-of-spread trade)”。
2、如果交易發生的價格低于最佳賣出價、或是高于最佳買入價,那么這類交易就會被視作為“連續內部交易(in-spread trade)”。
3、其他交易是指按照最佳賣出價和最佳買入價進行的交易,這些交易也會被認為是“好交易(decent trade)”。
人為交易時非連續內部交易和連續內部交易的總和,人為交易總額時所有人為交易額的總和。總體統計數據的計算方法如下:
1、計算每個交易所每個加密貨幣的總人為交易量和人為交易額的占比;
2、計算所有支持的交易所內全部選定加密貨幣的總人為交易量的算術平均值(非交易額加權平均值)、以及總人為交易額占比的算術平均值(非交易額加權平均值)。
由于數據收集和時間同步存在一些潛在問題,Crypto Integrity 數據科學團隊的算法可能會在沒有刷單交易的時候檢測到一些人為交易(類型I誤報錯誤),他們已經將 Coinbase Pro 視為 100% 有機流量的基準,但其算法也可能會檢測出一些輕微異常。
上圖:以 Coinbase Pro 為基準進行的內部連續交易和非內部連續交易
7、數據樣本
正如前文中所提到的,Crypto Integrity 數據科學團隊分析了幾個選定的加密貨幣(交易對),這些加密貨幣都已經在下表中列出。本次分析是隨機選擇的數據樣本,時間范圍是 2019 年 2 月和 3 月初。
上圖:每個交易所被分析的加密貨幣(交易對)。
Crypto Integrity 數據科學團隊的研究全部基于對原始數據的分析,包括交易和交易委托賬本,他們對每個交易委托賬本保存了 10 個買價和 10 個賣價,并總結出三種市場數據協議類型:
1、完整訂單日志(通常通過 FIX、ITCH、WS 等協議)是最詳細的類型,可以提供每個訂單的歷史激勵,包括下單時間、執行和取消情況等。FIX是金融信息交易(Financial Information eXchange)協議,主要用于正確交易過程交換的公開協議,它定義每條交易信息的內容和格式,這些信息內容與交易流程相對應,以保證交易信息安全準確低傳送,主要用于各方參與者之間建立實時的電子化通訊。ITCH是一種直接數據饋送協議,允許用戶追蹤每個訂單狀態,從訂單第一次被輸入、到執行或取消。WebSocket(WS)是一個計算機通信協議,通過TCP連接提供全雙工通信通道(full-duplex communication channel)。
2、二級更新(通常也是通過 FIX、ITCH、WS 等協議)提供了每個交易委托賬本的獨立更新(或快照),最多到“N”個價格水平,每次更新都是在一次基于特定價格水平的總體改變。
3、二級快照(通過通過 WS、REST 等協議)針對每個快照時刻提供交易委托賬本狀態,比如,Bittrex 交易所每個一秒就會通過WS協議更新一次市場數據(MD:Market Data);另外它也會受到協議和交易所自身交易速率限制的約束,比如Yobit交易所就限制了交易委托賬本快照每分鐘的請求數量不得超過 100 個。
很少有加密貨幣交易所報告交易委托賬本的時間戳,在這種情況下,Crypto Integrity 數據科學團隊在分析交易委托賬本和交易時直接選擇使用了本地時間,也就是交易委托賬本和交易被接受到 Crypto Integrity 數據科學團隊服務契的時間。下表是各家交易所市場數據協議的匯總:
實際上,掌握的數據越詳細,研究結果也會更精細、更可信。為了準確匹配交易委托賬本和交易,Crypto Integrity 數據科學團隊要求交易委托賬本和交易時間戳需要達到毫秒級別。較差的數據會讓市場操縱監控變得困難,所以根據經驗,交易所的應用程序接口越好,可信度也就越高。
8、已知問題
1、Huobi
雖然他們的應用程序接口文檔聲稱訂閱者會在每次更新的時候收到通知,但是 Crypto Integrity 數據科學團隊發現,通過 WebSockets 應用程序接口更新的市場數據是以 1 秒時間頻率推送的,如下圖所示。
這意味著:
(a) 生命周期不到 1 秒時間的訂單無法被檢測到,也就是說,如果在 Huobi 應用程序接口兩次刷新期間有不到 1 秒時間的訂單被下單、或是被填充/取消,其實是無法被檢測到的;
(b) 訂單下單、填充、或是取消的實際時間是未知的。
2、HitBTC
雖然他們的應用程序接口文檔聲稱訂閱者會在每次更新的時候收到通知,但是 Crypto Integrity 數據科學團隊發現,通過 WebSockets 應用程序接口更新的市場數據是以 100 毫秒(或以 100 毫秒的倍數)時間頻率推送的,這種情況和 Huobi 很相似,如下圖所示。
此外,Crypto Integrity 數據科學團隊還發現 HitBTC 存在缺少訂單取消更新的問題,這可能導致出現買賣價差錯誤,從而導致統計數據不準確。
下圖是以 Coinbase Pro 為基準的市場數據更新,他們的更新頻率是 1 毫秒。
最后,Crypto Integrity 數據科學團隊還公開了他們的刷單交易欺詐檢測算法,可以在該團隊的 GitHub 存儲庫中訪問獲取。