728x90

NLP분석을 주식 투자 의사결정에 활용하기 위한 노력은 계속되고 있다.

 

실제로 사람들의 투자 의사결정 과정을 들여다보면,

뉴스나 커뮤니티 등 정보에 의존하는 경향이 크다는 것을 확인할 수 있다.

온라인상에서 텍스트 형태로 전달된 정보는 머신러닝/딥러닝 NLP기술에 의해 활용될 수 있는 여지가 크다.

 

NLP 감성 분석(sentiment analysis)에 많이 활용되는 알고리즘 중에 BERT가 있다.

BERT란, 2018년 구글이 발표한

"BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding"

라는 논문에서 사용된 모델이자, Bidirectional Encoder Representations from Transformers의 줄임말이다.

 

BERT에 대한 설명은 이미 너무 많으니...(Google에 BERT만 쳐도 엄청난 양의 정보가...^^)

생략하고,

 

오늘 소개할 FinBERT는 금융 관련 뉴스 데이터를 기반으로 훈련시킨 BERT 모델이라고 보면 된다.
1,800만개의 의학 생명 논문을 학습해 개발한 AI모델인 BioBERT가 각광을 받자,

금융권에서 BERT의 활용을 위해 만든 모델이다.

 

자세한 설명은

https://www.slideshare.net/taeseonryu/fin-bert-paper-review

 

Fin bert paper review !

구글에서 만든 BERT 언어 모델이 나오면서 NLP 분야는 상당한 발전을 이룰 수 있었습니다 그리고 금융권 또한 대량의 Financial 텍스트 데이터를 축적하고 있습니다. 하지만 그 사전 훈련된 금융관련

www.slideshare.net

 

나름 잘 정리된 슬라이드쉐어가 있으니 참고 바란다.

 

 

국내 주식보다는 영문 텍스트를 활용했기 때문에, 해외 주식 투자 의사결정에 활용하는 것이 좋을 것이다.

https://medium.com/mlearning-ai/financial-text-classification-with-deep-learning-using-finbert-51a73b393a08

 

Financial Text Classification With Deep Learning Using FinBERT

This article is a comprehensive overview of the application of the FinBERT pre-trained model on financial text data classification tasks

medium.com

 

간단한 코드 구현에 대한 예시도 친절하게 설명되어 있다. 

 

개인적으로도 텍스트 데이터를 활용한 투자 의사결정에 관심이 많아,

기본적인 매매 시스템을 만들고 있는데,

성과가 괜찮다면 나중에 공개를...^^ (할 수 있기를 ㅠㅠ)

 

 

 

728x90

 

책 소스코드가 있는 github 주소는 아래와 같습니다:)

 

깃헙 주소:

github.com/quant4junior/algoTrade

728x90

+ Recent posts