金融×データ 経営×データ

Dockerを用いた経営・金融情報の解析環境の構築

背景・目的

老後2000万円問題などの心配から資産運用をする方々が増えているというニュースをよく目にします(2024年3月現在).資産運用の方法は様々ですが,多くの方々がRelative Strength Index(RSI)やMoving Average Convergence Divergence(MACD)といったテクニカル指標を多少は参考にされるのではないでしょうか?証券会社が独自に開発しているツールではとてもきれいにグラフが表示でき,さらに取引も可能です.一方で,株価情報を自身で解析する場合,証券会社のツールでは機能不足な点が多いのが現状です.

また,経営課題を数値解析する際には一般的にExcelを用いる例が多いようですが,Excelだけでは高度な計算を行うのは難しいと思われます.

昨今では,様々なプログラミング言語が開発されています.その中でもPythonは人気が高く初心者にも手が出しやすいプログラミング言語のひとつだと思います.一方で環境構築ではライブラリのインストールではpipやanacondaなど,どのツールを使えば良いのか?から悩む初心者の方も多いようです.

そこで,株価情報や経営課題の分析だけに集中ができるようにある程度の機能を備えたデータ解析環境を構築できるDockerfileを作成しました.

Dockerを用いた株価情報の解析環境

今回は,Docker Compose(複数のコンテナを定義し実行する Docker アプリケーションのためのツール)を用いた方法で環境構築をしています.詳細は,下記のGitHubのリポジトリを見ていただければ幸いです.

この解析環境では,pandas-datareader,yfinance,yahooqueryやmplfinanceといった株価解析に関係するライブラリだけでなく,xgboost,lightgbm,statsmodelsやprophetといった予測モデルなどの構築に使えるライブラリも入っています.さらに,予測モデルの結果を解釈するためのライブラリとしてshapやpdpboxも入っています.また,バックテスト用にBacktesting.pyも入っています.

経営課題という点では,最適化ライブラリであるPuLPをはじめ,多目的最適化に使えるPymooなども入っています.

本サイトで示す解析結果は,基本的にこの環境を用いて作成しています.

まとめ

本記事では,株価情報や数値データを用いた経営課題の解析環境について解説しました.このライブラリも追加したほうが良いなどのアドバイスは,コメントやお問い合わせからご連絡いただけますと幸いです.

-金融×データ, 経営×データ
-, , , ,