蜜臀av性久久久久蜜臀aⅴ_精品久久久久久无码人妻蜜桃_一本伊大人香蕉久久网手机_伊人色综合久久天天人手人婷

怎樣運用多因素策略來構(gòu)建強大的加密資產(chǎn)投資組合

摘要:具體的數(shù)據(jù)預(yù)處理涉及重復(fù)值、異常值/缺失值/極端值、標準化和數(shù)據(jù)頻率的處理。duplicated(subset=[key1,key2,duplicated(subset=[key1,key2,對數(shù)據(jù)范圍內(nèi)的所有因子做出如下調(diào)整:該方法不足在于,量化領(lǐng)域常用的數(shù)據(jù)如股票價格、token價格常呈現(xiàn)尖峰厚尾分布,并不符合正態(tài)分布的假設(shè),在該情況下采用方法將有大量數(shù)據(jù)錯誤地被識別為異常值。...

前言

書接上回,我們發(fā)布了《用多因子策略構(gòu)建強大的加密資產(chǎn)投資組合》系列文章的第一篇 - 理論基礎(chǔ)篇,本篇是第二篇 - 數(shù)據(jù)預(yù)處理篇。

在計算因子數(shù)據(jù)前/后,以及測試單因子的有效性之前,都需要對相關(guān)數(shù)據(jù)進行處理。具體的數(shù)據(jù)預(yù)處理涉及重復(fù)值、異常值/缺失值/極端值、標準化和數(shù)據(jù)頻率的處理。

一、重復(fù)值

數(shù)據(jù)相關(guān)定義:

  • 鍵(Key):表示一個獨一無二的索引。eg. 對于一份有全部token所有日期的數(shù)據(jù),鍵是“token_id/contract_address - 日期”
  • 值(Value):被鍵索引的對象就稱之為“值”。

診斷重復(fù)值的首先需要理解數(shù)據(jù)“應(yīng)當”是什么樣子。通常數(shù)據(jù)的形式有:

  1. 時間序列數(shù)據(jù)(Time Series)。鍵是“時間”。eg.單個token5年的價格數(shù)據(jù)
  2. 橫截面數(shù)據(jù)(Cross Section)。鍵是“個體”。eg.2023.11.01當日crypto市場所有token的價格數(shù)據(jù)
  3. 面板數(shù)據(jù)(Panel)。鍵是“個體-時間”的組合。eg.從2019.01.01-2023.11.01 四年所有token的價格數(shù)據(jù)。

原則:確定了數(shù)據(jù)的索引(鍵),就能知道數(shù)據(jù)應(yīng)該在什么層面沒有重復(fù)值。

檢查方式:

  1. pd.DataFrame.duplicated(subset=[key1, key2, ...])
  2. 檢查重復(fù)值的數(shù)量:pd.DataFrame.duplicated(subset=[key1, key2, ...]).sum
  3. 抽樣看重復(fù)的樣本:df[df.duplicated(subset=[...])].sample找到樣本后,再用df.loc選出該索引對應(yīng)的全部重復(fù)樣本
  4. pd.merge(df1, df2, on=[key1, key2, ...], indicator=True, validate='1:1')
  5. 在橫向合并的函數(shù)中,加入indicator參數(shù),會生成_merge字段,對其使用dfm['_merge'].value_counts可以檢查合并后不同來源的樣本數(shù)量
  6. 加入validate參數(shù),可以檢驗合并的數(shù)據(jù)集中索引是否如預(yù)期一般(1 to 1、1 to many或many to many,其中最后一種情況其實等于不需要驗證)。如果與預(yù)期不符,合并過程會報錯并中止執(zhí)行。

二、異常值/缺失值/極端值

產(chǎn)生異常值的常見原因:

  1. 極端情況。比如token價格0.000001$或市值僅50萬美元的token,隨便變動一點,就會有數(shù)十倍的回報率。
  2. 數(shù)據(jù)特性。比如token價格數(shù)據(jù)從2020年1月1日開始下載,那么自然無法計算出2020年1月1日的回報率數(shù)據(jù),因為沒有前一日的收盤價。
  3. 數(shù)據(jù)錯誤。數(shù)據(jù)提供商難免會犯錯,比如將12元每token記錄成1.2元每token。

針對異常值和缺失值處理原則:

  1. 刪除。對于無法合理更正或修正的異常值,可以考慮刪除。
  2. 替換。通常用于對極端值的處理,比如縮尾(Winsorizing)或取對數(shù)(不常用)。
  3. 填充。對于缺失值也可以考慮以合理的方式填充,常見的方式包括均值(或移動平均)、插值(Interpolation)、填0df.fillna(0)、向前df.fillna('ffill')/向后填充df.fillna('bfill')等,要考慮填充所依賴的假設(shè)是否合。
  4. 機器學習慎用向后填充,有 Look-ahead bias 的風險

針對極端值的處理方法:

1.百分位法。

通過將順序從小到大排列,將超過最小和最大比例的數(shù)據(jù)替換為臨界的數(shù)據(jù)。對于歷史數(shù)據(jù)較豐富的數(shù)據(jù),該方法相對粗略,不太適用,強行刪除固定比例的數(shù)據(jù)可能造成一定比例的損失。

2.3σ / 三倍標準差法

標準差 體現(xiàn)因子數(shù)據(jù)分布的離散程度,即波動性。利用 范圍識別并替換數(shù)據(jù)集中的異常值,約有99.73% 的數(shù)據(jù)落入該范圍。該方法適用前提:因子數(shù)據(jù)必須服從正態(tài)分布,即 。

其中,, ,因子值的合理范圍是。

對數(shù)據(jù)范圍內(nèi)的所有因子做出如下調(diào)整:

怎樣運用多因素策略來構(gòu)建強大的加密資產(chǎn)投資組合

該方法不足在于,量化領(lǐng)域常用的數(shù)據(jù)如股票價格、token價格常呈現(xiàn)尖峰厚尾分布,并不符合正態(tài)分布的假設(shè),在該情況下采用方法將有大量數(shù)據(jù)錯誤地被識別為異常值。

3.絕對值差中位數(shù)法(Median Absolute Deviation, MAD)

該方法基于中位數(shù)和絕對偏差,使處理后的數(shù)據(jù)對極端值或異常值沒那么敏感。比基于均值和標準差的方法更穩(wěn)健。

絕對偏差值的中位數(shù)

因子值的合理范圍是。對數(shù)據(jù)范圍內(nèi)的所有因子做出如下調(diào)整:

怎樣運用多因素策略來構(gòu)建強大的加密資產(chǎn)投資組合

三、標準化

1.Z-score標準化

  • 前提:
  • 由于使用了標準差,該方法對于數(shù)據(jù)中的異常值較為敏感

2.最大最小值差標準化(Min-Max Scaling)

將每個因子數(shù)據(jù)轉(zhuǎn)化為在 區(qū)間的數(shù)據(jù),以便比較不同規(guī)模或范圍的數(shù)據(jù),但它并不改變數(shù)據(jù)內(nèi)部的分布,也不會使總和變?yōu)?。

  • 由于考慮極大極小值,對異常值敏感
  • 統(tǒng)一量綱,利于比較不同維度的數(shù)據(jù)。

3.排序百分位(Rank Scaling)

將數(shù)據(jù)特征轉(zhuǎn)換為它們的排名,并將這些排名轉(zhuǎn)換為介于0和1之間的分數(shù),通常是它們在數(shù)據(jù)集中的百分位數(shù)。*

  • 由于排名不受異常值影響,該方法對異常值不敏感。
  • 不保持數(shù)據(jù)中各點之間的絕對距離,而是轉(zhuǎn)換為相對排名。

其中,, 為區(qū)間內(nèi)數(shù)據(jù)點的總個數(shù)。

怎樣運用多因素策略來構(gòu)建強大的加密資產(chǎn)投資組合

四、數(shù)據(jù)頻率

有時獲得的數(shù)據(jù)并非我們分析所需要的頻率。比如分析的層次為月度,原始數(shù)據(jù)的頻率為日度,此時就需要用到“下采樣”,即聚合數(shù)據(jù)為月度。

下采樣

指的是將一個集合里的數(shù)據(jù)聚合為一行數(shù)據(jù),比如日度數(shù)據(jù)聚合為月度。此時需要考慮每個被聚合的指標的特性,通常的操作有:

  • 第一個值/最后一個值
  • 均值/中位數(shù)
  • 標準差

上采樣

指的是將一行數(shù)據(jù)的數(shù)據(jù)拆分為多行數(shù)據(jù),比如年度數(shù)據(jù)用在月度分析上。這種情況一般就是簡單重復(fù)即可,有時需要將年度數(shù)據(jù)按比例歸集于各個月份。

相關(guān)推薦
蜜臀av性久久久久蜜臀aⅴ_精品久久久久久无码人妻蜜桃_一本伊大人香蕉久久网手机_伊人色综合久久天天人手人婷

  • <blockquote id="p4xxi"><xmp id="p4xxi">

    <em id="p4xxi"></em>
    <abbr id="p4xxi"><noframes id="p4xxi">
    <em id="p4xxi"></em>
    国产视频精品va久久久久久| 国内成人精品2018免费看| 亚洲卡通欧美制服中文| 欧美成人中文字幕| 欧美成人中文字幕| 日韩亚洲欧美精品| av72成人在线| 国产精品一区二区你懂的| 久久精品亚洲乱码伦伦中文| 久久久久久久一区二区三区| 亚洲国产一区视频| 日韩一级裸体免费视频| 国产精品久久久久久福利一牛影视| 亚洲欧美日韩精品久久奇米色影视 | 国产精品视频免费一区| 欧美一区二区三区精品电影| 久久9热精品视频| 亚洲精品小视频在线观看| 中文精品在线| 亚洲国产精品久久久久婷婷884| 亚洲国产三级在线| 国产精品久久久久久久久久免费| 欧美一二区视频| 欧美99在线视频观看| 亚洲免费一级电影| 久久一区二区三区av| 亚洲一区二区网站| 老司机精品视频网站| 亚洲欧美成人一区二区三区| 久久综合狠狠| 午夜影院日韩| 欧美巨乳在线| 麻豆九一精品爱看视频在线观看免费| 欧美国产精品va在线观看| 久久国产精品99精品国产| 欧美国产精品久久| 久久精品国产第一区二区三区最新章节| 免费日本视频一区| 久久狠狠久久综合桃花| 欧美日韩精品一区| 欧美成人嫩草网站| 国产亚洲欧美日韩精品| 9久re热视频在线精品| 亚洲国产小视频在线观看| 欧美一区二区高清| 亚洲欧美日韩国产| 欧美好吊妞视频| 欧美 日韩 国产在线| 国产一区二区三区在线观看免费视频| 日韩视频一区二区| 亚洲日本中文字幕区| 久久久久久久久久久一区| 欧美在线观看视频在线| 国产精品看片你懂得| 亚洲毛片一区| 一区二区三区欧美亚洲| 欧美成人黄色小视频| 欧美成人高清| 亚洲高清色综合| 久久亚洲私人国产精品va| 久久综合久久久| 韩国一区二区三区在线观看| 欧美一区二区日韩一区二区| 欧美一区二区三区四区在线 | 欧美一区二区在线看| 午夜欧美精品| 国产精品视频xxx| 亚洲欧美激情在线视频| 欧美一二三区在线观看| 国产精品一卡二| 欧美亚洲专区| 毛片av中文字幕一区二区| 18成人免费观看视频| 免费成人网www| 亚洲三级影院| 亚洲尤物影院| 国产视频在线一区二区| 久久国产精品毛片| 欧美成人精品福利| 亚洲毛片一区| 国产精品白丝av嫩草影院| 亚洲一区二区视频在线观看| 久久精品视频在线看| 在线日韩精品视频| 欧美激情欧美狂野欧美精品| 亚洲毛片网站| 欧美在线亚洲综合一区| 伊人成年综合电影网| 欧美精品久久久久久久久老牛影院| 日韩小视频在线观看专区| 亚洲欧美999| 樱桃国产成人精品视频| 欧美国产专区| 亚洲免费在线观看视频| 美女图片一区二区| 日韩视频一区二区三区在线播放| 国产精品乱码| 久久综合精品一区| 一区二区三区**美女毛片 | 亚洲精品在线视频观看| 欧美视频在线不卡| 久久久不卡网国产精品一区| 91久久在线| 久久亚洲国产成人| 夜夜爽av福利精品导航 | 国产精品久久久久9999高清| 久久精品久久综合| 亚洲最新中文字幕| 女生裸体视频一区二区三区| 亚洲欧美日本在线| 亚洲乱码国产乱码精品精| 国产日韩欧美在线视频观看| 欧美顶级大胆免费视频| 久久er99精品| 99精品国产在热久久| 欧美成人一区二区三区片免费| 亚洲自拍偷拍色片视频| 亚洲欧洲精品一区二区精品久久久| 国产精品久久久久久久久果冻传媒| 久久夜色精品国产亚洲aⅴ | 久久夜色精品国产噜噜av| 亚洲精品一区久久久久久| 国产情侣久久| 国产精品久久久久免费a∨| 欧美高清视频| 麻豆精品在线视频| 久久国产精品久久久| 亚洲欧美成人在线| 中文欧美日韩| 夜夜嗨av一区二区三区中文字幕| 欧美xxxx在线观看| 免费不卡中文字幕视频| 久久人91精品久久久久久不卡| 午夜精品久久| 亚洲女同精品视频| 亚洲午夜精品久久| 一区二区三区欧美在线| 一本久道久久综合狠狠爱| 亚洲精品一区二区三区不| 亚洲日本中文| 亚洲精品在线免费| 日韩亚洲欧美高清| 一区二区三区高清在线| 日韩一级片网址| 中文欧美在线视频| 亚洲一级免费视频| 亚洲欧美一区二区在线观看| 亚洲欧美制服中文字幕| 亚洲欧美日韩在线不卡| 午夜精彩视频在线观看不卡 | 小嫩嫩精品导航| 性欧美精品高清| 久久riav二区三区| 久久欧美中文字幕| 欧美福利精品| 亚洲乱码日产精品bd| 一区二区三区高清视频在线观看| 99精品国产福利在线观看免费| 一本大道久久精品懂色aⅴ | 欧美激情一级片一区二区| 亚洲缚视频在线观看| 日韩视频一区| 午夜国产欧美理论在线播放| 久久精品亚洲| 欧美大片91| 国产精品丝袜久久久久久app| 国产欧美日韩一区二区三区在线| 国产一区91| 亚洲精品女人| 性欧美精品高清| 欧美激情第1页| 亚洲午夜电影| 久久日韩粉嫩一区二区三区| 欧美日本一道本| 国产一区二区三区无遮挡| 亚洲国产日韩欧美| 亚洲欧美伊人| 亚洲第一精品电影| 亚洲自拍偷拍麻豆| 久久先锋资源| 国产精品入口66mio| 在线观看欧美日本| 亚洲在线视频| 欧美国产欧美综合 | 亚洲综合视频网| 老司机精品视频一区二区三区| 欧美午夜影院| 亚洲福利视频一区二区| 欧美亚洲一区三区| 亚洲国产一区二区三区高清| 午夜一级在线看亚洲| 欧美日韩国产成人在线观看| 国产一区清纯| 亚洲综合色噜噜狠狠| 亚洲国产精品视频| 久久九九热免费视频| 国产精品视频九色porn| 99精品99久久久久久宅男| 理论片一区二区在线| 午夜精品久久久久久久久久久久|