2023-10-28 –, track 5
日本企業はすでにデジタル化の道を進んでおり、社内には有用なデータが蓄積されています。次はこれらを社会の動きと結びつけ、効率化と価値を創造する段階です。本トークでは、ここでPythonが役立つことを示します。
社会の動きを示すデータはすでにオープンデータとして整備されています。その中にはビジネスに使いやすいデータセットもあります。Pythonの充実したエコシステムを活用すれば、これらのデータを簡単に分析し、企業価値の創出を始めることができます。Colab、Panel、plotly、pandasなどを駆使して、Pythonの分析エコシステムの強みを最大限に生かし、企業価値向上につなげることを提案します。
具体的には、ビジネスに活用しやすいデータセットの紹介と、実際に気象データ・地下鉄の乗車数・仮想売上データをPythonで分析し、企業価値を向上させる方法の提案を行います。
企業がデジタル化を進める中で、社内データの利用は一般化してきました。次のステップは、これらのデータを社会の動きと組み合わせることです。ここで重要となるのが、オープンデータの活用です。しかし、ビジネスに使いやすいオープンデータは限られています。そこで役立ちそうなオープンデータの紹介と、Pythonのエコシステムを用いてどのようにしてオープンデータを企業価値創造につなげるか、その方法と技術を提案します。
Pythonの使い方:
このプレゼンテーションでは、Pythonのエコシステムの様々なツールを使用します。
Google Colab: Pythonのコードをブラウザ上で書き、実行できるクラウドベースのJupyterノートブック環境です。Colabを使ってデータ分析のワークフローを共有し、視覚化します。
Panel: データの可視化とインタラクティブな探索を可能にする高レベルのパッケージで、ダッシュボードやアプリを作成します。Panelを使って動的なデータ可視化を作成し、分析結果を視覚的に表現します。
Plotly: 高度なインタラクティブなデータ可視化を可能にするライブラリです。Plotlyを用いて、データの特徴やパターンを視覚的に明確にします。
Pandas: データの前処理と探索的データ分析のためのツールです。Pandasを用いてデータのクリーニング、変換、集約を行います。
これらのツールを組み合わせて使用することで、データの前処理から可視化、分析、予測までの一連のデータサイエンスのワークフローを実現します。具体的な使用方法とコード例を紹介することで、オーディエンスがこれらのツールを自身のデータ分析タスクにどのように適用できるかを理解するのを助けます。
オーディエンスに伝えたいこと:
Pythonが企業のデジタルトランスフォーメーションを推進する強力なツールであることを理解してもらいたい。また、Pythonを用いて社内データと社会の動きを示すオープンデータを組み合わせることで、新たなビジネスインサイトを生み出し、企業価値を創造する可能性を示します。
タイムテーブル(15分):
イントロダクション (2分)
デジタルトランスフォーメーションとPythonの役割について簡単に説明
データとPythonのエコシステム (3分)
日本企業のデジタル化とその中での社内データの重要性
企業価値の向上に使えるオープンデータの紹介
Pythonのエコシステム(Colab、Panel、plotly、pandas、sklearn)とその活用方法について概説
実例紹介と分析 (6分)
実際の気象データ、地下鉄のデータ、仮想売上データを用いた分析の紹介
これらのデータをPythonのエコシステムを用いてどのように分析し、価値を引き出すかを実演
コロナ禍の影響の観察と考察 (3分)
上記のデータに見られるコロナ禍の影響についての考察
まとめ(1分)
トーク内容をまとめる
京都在住。合同会社長目経営。データ分析のためにアラフォーからPythonを書き始め、その後ウェブアプリを作ったり、いろいろPythonを使ってやって楽しんでいる。共著にPythonインタラテクィブ・データビジュアライゼーションがある。