FinGPT 3

  • #3954980
    K2 108.***.75.202 113

    요즘 제가 작업 중인 FinGPT 3판 아이디어 소개해봅니다.

    사람들 아이디어가 다 비슷하게 가는 거 같습니다. FinGPT 3판에서 (공개/회사 프로젝이 아니라 홈프로젝입니다) 작업 중인 것은, 요즘 유행하는 용어로 표현하면 “mcp” 도구를 스스로 만들어 확장하는 retrospective prediction “AI agent” 입니다.

    예컨대 이렇게 동작하는 것이죠. 최초에 “9/7일 기준 이전 15일치 뉴스를 참고해 TSLA의 1주일 후 주가를 예측해” 라는 프롬프트로 주가 예측을 시작합니다.

    Iteration 1.
    Prompt 1: 9/7일 기준 이전 15일치 뉴스를 참고해 TSLA의 1주일 후 주가를 예측해
    Prediction 1: 예측 UP, 이유: 어쩌고저쩌고
    Retrospective analysis 1: 실제값 DOWN, 15일전부터 1주일후까지의 뉴스를 검토한 결과 예측이 틀린 이유는 중국 ev sales 데이터에 대한 분석미 미비하고, 공급망 충격에 대한 고려가 부족했음. 두 가지 도구 생성하겠습니다 (tool_china_ev_sales.py, tool_car_supply_chain_analysis.py). TSLA용 prompt가 위 추가 도구들을 사용하도록 업데이트 합니다.

    Iteration 2.
    Prompt 2: 9/7일 기준 이전 15일치 뉴스를 참고해 TSLA의 1주일 후 주가를 예측해. (추가된 도구 사용을 지시하는 문장 추가됨)
    Prediction 2: 예측 DOWN, 이유: 어쩌고저쩌고
    Retrospective analysis 2: 실제값 DOWN. 예측이 맞았음. 추가 개선 필요없음.

    주가 예측 요구사항에 대해 시스템이 스스로 기능과 성능을 향상시킨 후 추론 능력을 높입니다. iteration들이 끝나고 나면 super prompt와 새 tool들이 생성되어 있습니다.

    프로토타입을 돌려보고 있는데 이 자동 확장되는 도구의 목록이 참 흥미롭습니다. AI가 스스로 그 도구를 자동 확장하는데, 종목별로 자동 확장된 도구의 목록이 다릅니다. 아래는 확장된 도구의 예입니다. 일부는 TSLA용이고, 일부는 ORCL용인 식이죠.

    tool_analyst_ratings.py
    tool_broad_market_sentiment_analyzer.py
    tool_china_ev_sales.py
    tool_daily_stock_price.py
    tool_financial_risk_assessor.py
    tool_finnhub_news.py
    tool_insider_activity_tracker.py
    tool_macro_growth_sensitivity.py
    tool_sector_performance_monitor.py
    tool_sector_sentiment_analyzer.py
    tool_sector_trends.py

    predict agent와 retrospect agent가 둘이서 예측, 보완, 예측, 보완을 계속 반복해서 과거 시점에서 어떤 과거 정보를 참조했어야 최선의 주가 예측을 할 수 있었을지를 서로 대화하며 prompt와 도구목록이 자동 확장됩니다. 최종적으로 티커별로 최적화된 super prompt와 tool들이 생성되는 거죠. 이 도구들은 기능 검증을 위해 llm을 이용하도록 초판이 자동으로 만들어지지만 결국 손으로 하나씩 api 써서 non-llm facts로 채워야 하고요. 안 그러면 거짓말 위에 서 있는 추론 시스템이 만들어집니다.

    이게 사실 ChatGPT, Gemini 등 온라인 서비스들이 이미 해주는 거 같은데? 라고 말할 수 있는데, 맞아요. 그거 정확히 맞습니다. Deep Thinking 모델이라는 것들이 하는 일이에요. 그런데 비용 문제가 있어서 이걸 대량으로 온라인에서 돌리질 못해요. 그리고 내가 원하는 facts들을 모조리 수거하는 일도 불가능합니다.

    제 현실의 문제점은, 한달에 한 종목 pick up 하기도 버거운 상태거든요. 제 눈도 2개밖에없고, 모니터도 2개밖에 없고, 손도 2개. 뉴스 따라잡기도 힘들고. 누가 초기 분석해 놓으면 거기에 반응해서 거래 전략 세우는 늦은 반응. 다 문제죠.

    현재의 proof-of-concept 목표는, test 데이터에 최적화 시키는 것이고요. 그 다음 unseen 데이터로 어느 정도 generalization을 하는 과정을 거쳐야겠죠. 일단은 최적화 먼저.

    이게 되더라도, 월가 트레이더들이 쓰는 bloomberg 터미털에 훨 못 미치는 정보력이겠지만, 월가의 자동 거래 시스템보다 훨 느리겠지만, 그래도 개인이 그런 도구를 사용할 수 있는 날은 영원히 오지 않을 것이므로, 목마른 놈이 우물 판다고 필요한 사람이 부족하나마 스스로 만들어서 써야죠.

    거짓말 덜 하는 종목별 전문가 5000개 가지는 날 곧 오리라 믿습니다.

    • 궁금한 12.***.210.107

      월스트릿에서 쓰는 인공지능 algorithm trading system은 과연 백전백승의 승률을 기록하는지?
      백전백승이 아니라면 승률은?

      별로 아는 것 없는 내 생각으론
      그런 시스템도 별로 신통치 않을 듯.
      스피드와 정보처리에선 인간들이 범접할 수 없겠지만,
      주가를 움직이는 변수가 너무도 많기에 인간들보다 별로 나을게 없을 듯.
      초단기 승부에서나 인간을 앞서고, 중기, 장기로 갈수록 인간에 대한 우월성이 사라질듯.

      Scalping 에선 분명 압도적일 것이라는 추측은 가능.

      • K2 108.***.75.202

        어느 문장에 코멘트를 해볼까 생각하다가 업계가 어느 위치에 서 있는가를 아는 게 가장 바탕이 되는 얘기가 될 것 같아서, 그것 먼저 답을 합니다.

        금융권의 AI 사용에 대해서 말씀드리자면. AI 구현 방법론에 여러 계층이 있어요. AI 안에 ML (machine learning), ML 안에 DL (deep learning), DL 안에 Gen AI (generative AI).

        ML/DL:

        ML과 DL은 이미 금융권 뿐만 아니라 전 산업에서 광범위하게 사용되고 있는 성숙한 기술이고요. 금융권에서도 씁니다. 다만 그걸 트레이딩의 엔진으로 쓸만큼 정확도가 높지 않아요. 틀렸을 경우 책임질 수도 없고 무엇보다 틀린 경우 다시 교정하는 게 너무 어렵습니다. 왜냐하면 지금 production에 deploy 돼 있는 게 그때까지 가능한 모든 데이터를 모아 훈련시킨 거니까요. 더 낫게 만들 수 없어요. 그런데 그 점수가 별로 높지 않아요. 이게 지난 70년간 ML/DL이 실업무 완전 도입에 대부분 실패하고 보조 도구로만 쓰이는 이유입니다.

        그러니까 ML/DL은 트레이딩에 쓸 수는 없고 좀 실패해도 되는 분야, 사기 탐지, 칩입 탐지 같은 보안 분야, 대출심사의 1차 필터링, 신용카드발급 1차 필터링같은 곳에 적극적으로 도입이 돼 있습니다. 모델을 훈련할 때 false positive 와 false negative 라는 오류(고등학교 수학에서 배우는 제1종의 오류, 제2종의 오류 그겁니다) 중 한쪽을 집중적으로 더 잘 줄이도록 훈련시킬 수 있어요. 두 가지 오류를 다 제거하여 전체적으로 다 잘하게 만드는 건 극도로 어렵지만, 예를 들면 false negative (즉 사기를 놓치는 경우)를 최소화하는 식으로 한쪽에 가중치를 두면, 사람이 하나하나 하는 것보다 압도적으로 잘 하게 만들 수 있거든요.

        Gen AI:

        Gen AI는 어느 단계냐 하면, 당연히 트레이딩에 못 쓰죠. 금융권에서 사용하는 어떤 모델이라는 것은, 수학적 정의와 비슷한 엄격함을 요구합니다. 이 모델의 in/out이 무엇이냐가 정의가 돼야 모델로 인정을 받고 그걸 비즈니스에 사용할 수 있어요. Gen AI 결과는 랜덤이기 때문에 트레이딩에 못 씁니다. 원래 ‘모델’로 안 하던 거, 예를 들면 리서치에는 쓸 수 있어요, 보고서 작성에 쓸 수 있어요.

        Gen AI는 그러면 뭐하는데 쓰냐? 월가 돈 많아요. Gen AI 도입에 총력전입니다. 모든 분야에 Gen AI 도입 검토와 테스트를 하고 있죠. 인력의 생산성이 수십~수백배 단위로 올라가는 분야가 속속 나오고 있습니다. 아다시피 그렇게 올라간 생산성 덕분에 개발자 cut, 중간매니저 cut, HR cut, 고객대응팀 cut, 애널리스트 cut, … 말로 업무를 하는 직종의 인력 가지치기 하는데에도 사용이 되고 있고요. 2026년은 AI로 인한 생산성 혁신이 시작되는 해입니다.