1. <dd id="ekrqy"><nav id="ekrqy"></nav></dd>

       登錄系統    賬號注冊      
          
        


      News Message

      AlphaStock



      AlphaStock



      AlphaStock: A Buying-Winners-and-Selling-Losers Investment Strategy using Interpretable Deep Reinforcement Attention Networks





      1. 金融術語

      • 持有期 :投資最小時間單位。
      • 序列投資:投資序列是一系列持有期的序列。
      • 資產價格:p(i)=p1(i),p2(i),,pt(i), , 這里pt(i) 是股票i在t時刻的價格。
      • 多倉 
        • 多倉是先在 t1 時刻買入股票后面 t2 時刻賣掉平倉的操作
        • 利潤是 ui(pt2(i)?pt1(i)) , ui 是購買股票i的量。
      • 空倉
        • 空倉是先在 t1 時刻借入股票賣掉后面 t2 時刻買入還回股票的操作
        • 利潤是 ui(pt1(i)?pt2(i)) , ui 是借入股票i的量。
      • 投資組合:
        • 如果有 I 只股票,一個投資組合定義為 b=(b(1)...,b(i),...,b(I))T , 這里 b(i) 是股票i的資金占比, i=1Ib(i)=1.
      • 零-投資組合:
        • 資產組合b(j)的資金記為 M(j) , 多倉的M(j)>0,而空倉M(j)<0
        • 對于有J個資產組合的投資組合來說,如果j=1JM(j)=0,那么它就是零-投資組合。

      2. BWSL策略

      這一節介紹問題建模和設定。

      本文使用的策略是買入winner售出loser策略(buy-winners-and-sell-losers (BWSL) ),這里的winner和loser指的是股票集合中預測可能漲價更多的和漲價少甚至跌得多的股票。

      具體執行過程是:

      1. 在時間t, 借入“loser”股票并且賣掉他們:

      在時刻t,給定預算 M~ ,我們借“loser”并賣掉(開空倉)。我們能借的股票i的量是:

      ut?(i)=M~?bt?(i)/pt(i)其中 bt?(i) 是股票i在空倉組合 bt? 中的比例。

      2. 在時間t, 買入“winner”:

      (開多倉)能夠買入股票i的量是ut+(i)=M~?bt+(i)/pt(i)

      3.在第t個持有期結束時,賣出多倉組合:

      我們能得到的金額是所有股票在t+ 1時以新價格出售股票的收益,

      4. 在第t個持有期結束時,買回空倉組合:

      我們花在買空頭股票上的金額是

      5. 回報率

      總的收益是 Mt=Mt+?Mt? ,將價格漲幅記作 zt(i)=pt+1(i)/pt(i) ,最后回報率為

      目標

      如果我們想要 Rt>0 ,那么需要

      這意味著,股票價格的絕對漲跌不是主要關注點;相反,股票之間的相對價格關系要重要得多。


      優化目標

      夏普比率


      3. AlphaStock模型

      這一節介紹具體算法。

      AlphaStock一共包含了3個部分:簡單來說就是

      • 股票特征提?。↙STM-HA)
      • 股票間相對關系抽?。–AAN),
      • 根據上漲得分產生投資組合(portfolio generator)

      三部分;比較一目了然:

      LSTM-HA、CAAN、portfolio generator


      具體來說就是上圖從左到右的過程:

      • 每只股票的原始特征經過LSTM-HA(歷史注意力網絡)產生股票特征表示 rt(i) ;
      • 然后用CAAN(股票間的注意力網絡)將不同的股票特征進行比較整合,產生一個上漲分數,稱作winner score st(i) ;
      • 這樣就可以根據得分,篩選出用來做多和做空的股票,再用softmax等方式產生資金分配;
      • 最后,有了資產組合后,就可以計算獲得的利潤,那么就可以使用RL優化了。

      現在我們按照圖片上從左到右(白藍紅綠)的順序介紹具體的算法:

      (1)原始特征

      用了技術面和基本面兩種因子,具體來說就是下面這7個。

      (2)股票特征提取

      我們將時間t的最后K個歷史持有時段,即從時間t - K到時間t的時間段,稱為t的回顧窗口。

      我們的模型使用長短期記憶(LSTM)網絡遞歸地將X編碼成向量為

      其中 hk 為LSTM在第k步編碼的隱藏狀態,將最后一步的hk作為股票的表示。它包含X中元素之間的順序依賴關系。

      這一部分的創新是:使用了history state attention,用所有的中間隱藏狀態 hk 來增強 hK 。按照標準的注意力機制,增強后的表示記為r,計算為

      屬于時間關系的一種特征提取。

      (3)股票相對價格關系預測

      The Basic CAAN Model

      CAAN模型采用自注意機制,給定股票的表示 r(i) ,我們為股票i計算一個查詢向量 q(i) ,一個關鍵向量 k(i) 和一個值向量 v(i)

      股票 j 與股票 i 的相互關系建模為:使用股票i的 q(i) 來查詢股票j的 k(j) ,即(其中Dk是縮放參數):

      然后,我們將歸一化的相互關系 βij 作為權重,將其他股票的 v(j) 值相加,得到整合的分數:


      Incorporating price rising rank prior.

      這部分是使用歷史的價格上漲率排名先驗來對上面的權重β做一個改進版。

      我們用 ct?1(i) 表示股票 i 在上一次持有期間(從t - 1到t)的價格上升率的排名。

      我們用股票ct?1(i)坐標上的相對位置作為股票相互關系的先驗知識。在ct?1(i)坐標軸上計算它們的離散相對距離

      其中Q為預設量化系數。

      我們使用查找矩陣 L=(l1,...,lL) 來表示每個離散值 dij 。以 dij 為索引,對應的列向量 ldij 是相對距離 dij 的嵌入向量。

      得到新的β后仍是上面的操作。(根據最后的實驗結果,加了這個先驗有一點點提升)

      (4)投資組合

      我們首先將股票按照贏家分數降序排序,得到每個股票i的序號o(i),選前G個用來開多倉,后G個用來開空倉,使用softmax分配倉位:

      最后記作 bc 維度是I,前G維和 b+ 相同,后G維和 b? 相同,其余維度是0.

      (5)使用RL優化網絡

      軌跡

      動作是一個I維二進制向量,當agent投資股票i時,元素動作(i) t = 1,否則為0。

      設定好reward

      這樣就可以用RL優化了。

      4. 實驗結果

      對比的方法和評估標準如下:

      做了一些ablation,AS-NC指的是沒有使用股票間的CAAN結構;AS-NP是沒有使用排名先驗來改進CAAN。

      還畫出了不同時間長度的因子對于“winner score”的影響,是個比較有趣的實驗發現:可以看到9-12個月前漲價現在漲價的影響是正面的,而過去8個月的漲價被認為是不利因素。交易量也有相似的效應。



      1. 金融術語

      • 持有期 :投資最小時間單位。
      • 序列投資:投資序列是一系列持有期的序列。
      • 資產價格:p(i)=p1(i),p2(i),,pt(i), , 這里pt(i) 是股票i在t時刻的價格。
      • 多倉 
        • 多倉是先在 t1 時刻買入股票后面 t2 時刻賣掉平倉的操作
        • 利潤是 ui(pt2(i)?pt1(i)) , ui 是購買股票i的量。
      • 空倉
        • 空倉是先在 t1 時刻借入股票賣掉后面 t2 時刻買入還回股票的操作
        • 利潤是 ui(pt1(i)?pt2(i)) , ui 是借入股票i的量。
      • 投資組合:
        • 如果有 I 只股票,一個投資組合定義為 b=(b(1)...,b(i),...,b(I))T , 這里 b(i) 是股票i的資金占比, i=1Ib(i)=1.
      • 零-投資組合:
        • 資產組合b(j)的資金記為 M(j) , 多倉的M(j)>0,而空倉M(j)<0
        • 對于有J個資產組合的投資組合來說,如果j=1JM(j)=0,那么它就是零-投資組合。

      2. BWSL策略

      這一節介紹問題建模和設定。

      本文使用的策略是買入winner售出loser策略(buy-winners-and-sell-losers (BWSL) ),這里的winner和loser指的是股票集合中預測可能漲價更多的和漲價少甚至跌得多的股票。

      具體執行過程是:

      1. 在時間t, 借入“loser”股票并且賣掉他們:

      在時刻t,給定預算 M~ ,我們借“loser”并賣掉(開空倉)。我們能借的股票i的量是:

      ut?(i)=M~?bt?(i)/pt(i)其中 bt?(i) 是股票i在空倉組合 bt? 中的比例。

      2. 在時間t, 買入“winner”:

      (開多倉)能夠買入股票i的量是ut+(i)=M~?bt+(i)/pt(i)

      3.在第t個持有期結束時,賣出多倉組合:

      我們能得到的金額是所有股票在t+ 1時以新價格出售股票的收益,

      4. 在第t個持有期結束時,買回空倉組合:

      我們花在買空頭股票上的金額是

      5. 回報率

      總的收益是 Mt=Mt+?Mt? ,將價格漲幅記作 zt(i)=pt+1(i)/pt(i) ,最后回報率為

      目標

      如果我們想要 Rt>0 ,那么需要

      這意味著,股票價格的絕對漲跌不是主要關注點;相反,股票之間的相對價格關系要重要得多。


      優化目標

      夏普比率


      3. AlphaStock模型

      這一節介紹具體算法。

      AlphaStock一共包含了3個部分:簡單來說就是

      • 股票特征提?。↙STM-HA)
      • 股票間相對關系抽?。–AAN),
      • 根據上漲得分產生投資組合(portfolio generator)

      三部分;比較一目了然:

      LSTM-HA、CAAN、portfolio generator


      具體來說就是上圖從左到右的過程:

      • 每只股票的原始特征經過LSTM-HA(歷史注意力網絡)產生股票特征表示 rt(i) ;
      • 然后用CAAN(股票間的注意力網絡)將不同的股票特征進行比較整合,產生一個上漲分數,稱作winner score st(i) ;
      • 這樣就可以根據得分,篩選出用來做多和做空的股票,再用softmax等方式產生資金分配;
      • 最后,有了資產組合后,就可以計算獲得的利潤,那么就可以使用RL優化了。

      現在我們按照圖片上從左到右(白藍紅綠)的順序介紹具體的算法:

      (1)原始特征

      用了技術面和基本面兩種因子,具體來說就是下面這7個。

      (2)股票特征提取

      我們將時間t的最后K個歷史持有時段,即從時間t - K到時間t的時間段,稱為t的回顧窗口。

      我們的模型使用長短期記憶(LSTM)網絡遞歸地將X編碼成向量為

      其中 hk 為LSTM在第k步編碼的隱藏狀態,將最后一步的hk作為股票的表示。它包含X中元素之間的順序依賴關系。

      這一部分的創新是:使用了history state attention,用所有的中間隱藏狀態 hk 來增強 hK 。按照標準的注意力機制,增強后的表示記為r,計算為

      屬于時間關系的一種特征提取。

      (3)股票相對價格關系預測

      The Basic CAAN Model

      CAAN模型采用自注意機制,給定股票的表示 r(i) ,我們為股票i計算一個查詢向量 q(i) ,一個關鍵向量 k(i) 和一個值向量 v(i)

      股票 j 與股票 i 的相互關系建模為:使用股票i的 q(i) 來查詢股票j的 k(j) ,即(其中Dk是縮放參數):

      然后,我們將歸一化的相互關系 βij 作為權重,將其他股票的 v(j) 值相加,得到整合的分數:


      Incorporating price rising rank prior.

      這部分是使用歷史的價格上漲率排名先驗來對上面的權重β做一個改進版。

      我們用 ct?1(i) 表示股票 i 在上一次持有期間(從t - 1到t)的價格上升率的排名。

      我們用股票ct?1(i)坐標上的相對位置作為股票相互關系的先驗知識。在ct?1(i)坐標軸上計算它們的離散相對距離

      其中Q為預設量化系數。

      我們使用查找矩陣 L=(l1,...,lL) 來表示每個離散值 dij 。以 dij 為索引,對應的列向量 ldij 是相對距離 dij 的嵌入向量。

      得到新的β后仍是上面的操作。(根據最后的實驗結果,加了這個先驗有一點點提升)

      (4)投資組合

      我們首先將股票按照贏家分數降序排序,得到每個股票i的序號o(i),選前G個用來開多倉,后G個用來開空倉,使用softmax分配倉位:

      最后記作 bc 維度是I,前G維和 b+ 相同,后G維和 b? 相同,其余維度是0.

      (5)使用RL優化網絡

      軌跡

      動作是一個I維二進制向量,當agent投資股票i時,元素動作(i) t = 1,否則為0。

      設定好reward

      這樣就可以用RL優化了。

      4. 實驗結果

      對比的方法和評估標準如下:

      做了一些ablation,AS-NC指的是沒有使用股票間的CAAN結構;AS-NP是沒有使用排名先驗來改進CAAN。

      還畫出了不同時間長度的因子對于“winner score”的影響,是個比較有趣的實驗發現:可以看到9-12個月前漲價現在漲價的影響是正面的,而過去8個月的漲價被認為是不利因素。交易量也有相似的效應。




      Share Http URL:  http://www.tiara-e.com/get_news_message.do?new_id=1043














      請輸入評論





























      青草免费视频,97 碰,山东老熟妇乱子视频,亚洲精品美女视频_河北新闻网