財務データETL基盤の個人開発

165 Views

November 17, 25

スライド概要

就労訓練中に個人で作成したデータ基盤とETL、可視化までの一気通貫アプリケーションです。

Aizack

@ykokubo09

スライド一覧

システムエンジニア、テクニカルサポートを経て、就労移行支援を通じた就労訓練中。データエンジニアを目指した学習中です。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.6M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.1M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.1M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

各ページのテキスト

財務データETL基盤の設計・開発プロジェクト 2025年10月 NeuroDive横浜島崎啓一

目次財務データETL基盤の設計・開発プロジェクト経験を軸に、私の学習・訓練についてご紹介いたします。 1. 自己紹介 6. 開発・学習における工夫 2. プロジェクトの実施背景 7. 苦労した点と解決策 3. プロジェクトの目的と成果 8. コスト削減効果の試算 4. アプリケーション全体設計 9. 想定している企業 5. 技術スタックと実装の詳細 10. まとめ：今回実践できたこと

1. 自己紹介名前：島崎啓一（しまざきけいいち）経歴：システムエンジニア（顧客：デジタルマーケティング企業）、テクニカルサポート職を経験趣味：読書、サイクリング、技術者コミュニティで学ぶこと Neuro Diveでの専門 : データ分析データの集め方やデータ分析基盤の仕組みデータベース、クラウド

2. プロジェクトの実施背景：原体験（1）業務での失敗体験（2）私生活での成功体験「正確性が重要な作業はコンピューターに任せた方が良い」「生データは単体では価値を発揮できず、加工・継続的な管理を通して価値を発揮する」 ● システムエンジニアとして作業時、私のミスでお客様のサーバー、 Webサイトをダウンさせてしまった ● 人間の正確性や集中には限界がある ● 糖尿病治療で-25kgの減量、血糖値は正常範囲で管理できている（血糖値に関して投薬は不要） ● 血糖値、血圧、体重など生データを記録、体重は「除脂肪体重」に加工して管理した

3. プロジェクトの目的と成果目的成果 (1)分析者にとって利用しやすいデータ基盤構築 1. (2)データ分析関連職に求められるスキルセットの体系的な理解と習得を目指す・実務を想定した拡張性を考慮した設計するデータ取得・加工・可視化まで一貫で行うアプリケーションを開発したこと 2. Microsoft Data Foundation資格の取得 3. Docker/Git/uv/Ruffなど開発環境の標準化 4. 開発したアプリケーションの効果・価値を試算・データエンジニアリングの工程を経験するしたこと・現場に必要な技術を調べ・考え・実践する年間120万円・30時間削減

3. プロジェクトの目的と成果データエンジニアに関わるスキルセット自己評価 1. Python、SQLなどのプログラム言語の基本的使い方 1. ○ 本プロジェクトで実践 2. クラウドインフラの初歩的な知識（Associate資格） 2. △ 資格取得の学習中 3. クラウドのデータ関連発展資格、派生資格 3. 4. データエンジニアリング分野のツールを学ぶ 4. △ GitとLinter、テストは経験 5. データ基盤のアーキテクチャに関する知識 5. △ 資格学習を通じて学習中 × 経験なし FAQ >【中途採用】未経験の職種に応募することはできますか？ - 風音屋より引用

https://kazaneya.com/5626ce973fad491cba761be91593e2c4#block-b2bdba1e35d4478e82fa18c7e342e6c7

4. アプリケーション全体設計データ取得データ保存・加工データの可視化金融庁EDINETのAPIに接続し、財務 CSVデータをDataFrameで変換・加工し、 Streamlitフレームワークでコードベースデータを CSV形式で収集します。データベースに格納します。データの整のダッシュボードを作成。 DataFrameを合性を保ちながら、分析に適した形式直接活用でき、バージョン管理も可能に変換します。にしています。

アプリケーション全体設計：構成図画像はClaudeにて作成

5. 技術スタックと実装の詳細 Python (Pandas, SQLAlchemy) PostgreSQL データ処理の中核技術として、業界標準の Pandasライブラリをリレーショナルデータベースによるデータ管理。正規化された活用。APIアクセス、 CSV取り込み、前処理、データベース操スキーマ設計により、データの整合性と拡張性を確保してい作まで一貫した実装を行いました。ます。 Streamlit Docker, Ruff, uv Pythonベースのフレームワークで、コードによる柔軟な UI構築開発環境の標準化により、誰の PC環境でも開発可能にしていとGitによるバージョン管理を実現しています。ます。WindowsPCとMacで動作を確認できており、実務でのチーム開発を想定しています。

10.

6. 開発・学習における工夫 AI活用複数の学習リソース活用開発環境の標準化生成AIをコーチ、レビューワー、先輩エンジ不明点があれば、複数の情報源を活用しシステムエンジニア時代の環境構築の苦ニアの役割で活用し、技術力の向上を加速て理解するまで調査。失敗から学び、改労を教訓に、Dockerによる開発環境の標させました。重要なのは、AIに丸投げせず、善を繰り返すことで、理解を深めました。準化を実践しました。基盤開発エンジニア自己学習のツールとして活用した点です。を目指す上で、開発環境の再現性確保は【活用した学習リソース例】 ● ● ● 必須スキルと理解しています。要件や設計は必ず文書化し、議論 ● 公式ドキュメントの前提を統一 ● Udemy Business 「なぜ?」を深掘りし、理解するまで ● 書籍 ● Dockerでの開発環境を管理壁打ちを継続 ● IT支援員さん ● uvでPythonの仮想環境を管理アウトプットには作成者である自分 ● 技術ブログ, コミュニティ ● Ruffでコード解析、構文エラー等をが責任を持つ姿勢 ● Youtube など【標準化の例】事前に発見

11.

7. 苦労した点と解決策 1 2 3 5月〜6月 7月 9月〜10 月当初の目標設定の見直し設計時の実データ確認不足による手戻り作業中盤での大幅な設計変更課題：未経験のGoogle Cloudによる構築を課題：実データの確認が一部おろそかにして課題：最初の設計は変更や拡張に弱い密結目指していたが、目標期間内での実現が困おり、設計上の欠陥が実装中に判明した。合な設計上のアンチパターンとなっていた。難と判断。解決：クラウドを使った本格的な構築は次回以降に延期。その代わり、開発環境の標準化を取り入れ、基礎的な技術を把握するステップアップを図った。解決：設計の修正という手戻りが発生。設計時から実データの観察し、最適な設計を目指す重要性を痛感。解決：方針転換により作業期間が1ヶ月以上延びたが、クラスや関数の役割分担を明確に分離する設計変更を行い、拡張性と保守性の高い設計に変更できた。

12.

8. コスト削減効果の試算 120万円 30時間年間コスト削減年間工数削減データ収集・加工作業の自動化によデータ取得から可視化までの自動化り、月給相当で 4人分の人件費を削により、レポート作成時間を大幅に短減。繰り返し作業の効率化により、分縮可能です。析担当者がより高度な業務に集中できます。削減効果の算出根拠 • 担当者の時給換算：約2500円 ※データアナリスト職の求人票より算出 • 手動データ収集・加工作業：1社あたり30分と仮定 • 作業回数：年間20回と仮定

13.

9. 想定している企業と職種某地銀グループ金融DX企業職種：データレイクエンジニア職種：データエンジニア業務内容業務内容 • データ基盤の設計・構築・運用 • データ基盤の設計・構築・運用 • 部門連携によるデータ連携の要件定義 • 生成AI導入における顧客支援 • データパイプラインの構築と最適化 • SaaSデータ分析サービスのデータパイプライン設計・構築・運用本プロジェクトで実践した APIからのデータ取得、データベース設計、 ETL処理の経験は、データレイク構築業務に直結します。 Pythonを中心としたデータパイプライン設計・構築を経験している点が業務と直結しています。

14.

10. まとめ：今回実践できたこと (1)実務を想定した学習姿勢とスキルセット (2)ビジネス課題を理解する力データパイプライン構築を実現し、戦力となる技術力を習得しました。単なる技術習得にとどまらず、コスト削減効果の試算や業務効率化の視点 Pythonによるデータ処理、データベース設計、可視化ツールの活用など、を持ち、技術をビジネス価値に変換する思考力を身につけています。データエンジニアに求められる幅広いスキルセットを保有しています。 (3)自走力 (4)品質と拡張性への意識公式ドキュメント、技術コミュニティ、生成AIなど多様なリソースを活用し、課テスト実装、Docker環境構築、Gitによるバージョン管理など、保守性と拡題を自力で発見・解決する力を実証しました。失敗から学び、粘り強く取張性を考慮した開発を実践。実務でのチーム開発を想定した開発を行っり組む姿勢は、実務での成長にも直結します。ておりました。今後の展望データベースやクラウドインフラ技術や、IaC・CI/CDのような自動化技術も学ぶ予定です。そして、データエンジニアとしてデータ利活用のための環境整備を技術でサポートしていきたいと考えています。