金融系に特化したLLM - appricot’s diary

金融系に特化したLLMとして、FinGPTとBloombergGPTがある。両者について、メモ。

Pre-trained model(LLM)は、既製品を利用。具体的にはMetaによるLLaMAなど。
1. BloombergGPTは、LLMの部分も、金融データを使って自前でやっている。そこた違いか？
その上で、既製品をFine-tuneする際に、各種金融系データ (News, SNS, 企業開示, 株価)を利用。
FIne-tuneの方法は、金融系データ＋LoRAとRLSPを利用。
1. LoRAは既存の方法。パラメータの一部のみをFine-tuneすることで、低学習コスト。学習の際には、Newsに対するStock Priceの増減（Positive, Negative, Neutral)も、ラベルとして利用。
2. RSLP(Rainforcement Learning via Stock Price)は、新規の方法。RLHPが、Fine-tuneを人間のFeedback + 強化学習を用いて実施する方法だが、その人間のFeedbackの部分を株価で代替。これによって、各種金融イベントに対するMarket response予測などを容易にする効果あり。
評価結果は、残念ながら、論文に含まれておらず。

Pre-trained model(LLM)について、一般的なデータ(General Data)と、金融系のデータ(Domain-specific data)の両方を利用して学習。
1. Bloomberg内のデータとPublicな金融系データの両方を利用。
TokenizerとしてSub-word tokenizerではなく、Uni-gramを利用。
LLM構築時の訓練モデルとして、Bloombergが作成したモデルを利用。
1. Decoder-onlyの言語モデル。70個のLayerから構成 + Self Attentionメカニズム。
2. 言語はPyTorch。インフラは、Amazon SageMakerを利用。
3. Alibi位置エンコーディングを利用。長い文の入力にも対応。
評価結果として、Domain-specificなTasksで高い性能。General tasksも、タスクによって、他の汎用モデルと同じか、それを凌駕する性能。