AOKI's copy&paste archive

高専から駅弁大学から東工大を経て大企業へ 浅く広い趣味とかキャリアの日記を

Exploring Data Set for Tableau Public

はじめに

 

ややネガティブな発言からにはなるが、背景としては上記の通り。

社内のネットワークを起点とした、普遍的なTableauの研修中。

 

概要

DATA Saber - Journey of Expanding Data Intelligence

 

本研修の概要等は上記に詳しい。

詳細はそちらに譲るとして、自分なりに養子をまとめるなら、、

要はTableauの勉強会であり、マーケティング施策の1つである。

 

そこで用意されたデータセットをお題に沿って可視化するものと、自身で新たなデータの可視化を提案する課題に二分される。要は先述の前者と後者に該当する。

前者は先駆者も多くおり、自分自身で試行錯誤する比率が高いので、ここでの取り扱いは軽くする。

www.youtube.com

 

そこで後者を集中的に取り扱う。これはコミュニティポイントという独自施策の課題として明文化されている。

Tableau関連のブログ記事の投稿    Tableauに関連するブログ記事を書き、そのURLをTwitterでシェアする。    10pt / 4週間以内に3回投稿

 

ところで上記のような動画もVlog的にカウント対象なのだろうか。

 

個人の目的

せっかくの初回なので、技術的なことは軽めにファンダメンタルズ的なことに今回は比重を置きたい。

ここでブログとして最も重要とも思えるのは、個人の目的、考えではないだろうか。

単刀直入にぶっちゃけてしまえば、汎用性のあるスキルを得るためだ。終身雇用も崩壊しつつある今、普遍的なスキルを磨く重要性は高い。

そこで国に認められた一般的な資格などを有する機運は高まっていると思う。せっかくなのでそれぞれの長所短所をまとめてみたい。

Data Saberの利点:資格の欠点

  • 応用性:直ちに現場へ還元できる
  • 独自のコミュニティが整備されている
  • 特に弊社の他業種との人脈機会にも:役員発表機会もあるとか?
  • 完走できずとも価値が担保されやすい
  • 物珍しい

資格の利点:Data Saberの欠点

  • 履歴書に書きやすい:普遍性が高い
  • 結果主義:0 or 1
  • Data SaberやTableauの知名度
  • Tableauのライセンス料:これは会社負担でむしろ個人的には得

 

とはいえ、折を見て3年以内くらいを目標に基本情報は取りたい。

 

方法

gaaaon.jp

 

引用の通りブログが手法に提示されているものの、その内容はかなり自由らしい。

正直書き手としてもどこまでがカウント対象なのか難しいところではある。

ひとまずそこそこの読み応えは担保したく思うが。

とはいえ、Tableauについて知らない人も多いだろうし、Data Saberという施策はさらにだ。そのため第1回はあまり深い内容には入り込めないだろう。

 

前置きは以上にして、具体的に何をするかだ。

基本的にVizをまとめ、その手法を記載し、せっかくなのでその考察も記載するといったところか。

しかし大前提のデータの入手が案外難しい。

データは21世紀の石油とも言われ、安価、とりわけ無料というものも限られる。仮に購入してもそれを世間一般に公開できるかも別問題だ。

 

分析対象

そのためまずは手軽な国勢調査等の統計データを扱いたいと思う。

同様のことは大学の研究における、研究背景の視覚化にも行っていたので、とっつきやすくもある。

 

あるいはせっかくなので社会的要請が比較的高いトピックも選んでみたい。

例えばジェンダーバイアスとか。

 

仮説として地方ほど保守的そうなので、この地方さもうまい具合に定義させつつ、相関とかを追ってみたい。

産業構造、女性の社会進出、出生率、最終学歴、上京:人口移動とか色々な切り分け方がある。

www.e-stat.go.jp

www.e-stat.go.jp

 

ただ、試験的に色々データを入れて試してみたところ、以下のようなエラーも出てしまったりしたので、やはり元データの形式や特徴を把握しつつ、うまく整形しながら分析する必要がありそうだ。

政府統計のファイルの厄介な特徴として、都道府県欄に横幅調整の謎の空白があったり、セル結合されていたり、おかしなサマライズがあるのは、そこでざっくり見ていての不満になる。特に前者については、気にすることのほどでないし、セルの書式調整で対応して欲しい。DB形式もあるのがせめてもの救いとも言えるが、この環境ではデジタルトランスフォーメーション等も前途多難だ。

 

その他:分析対象候補等:バックグラウンドを活かすためにも土木系多め

日本の水力エネルギー量|資源エネルギー庁

全国道路施設点検データベース ~ 損傷マップ ~

Twitter可視化システムを作ってみたら日本に笑顔が溢れていた話 - NTT Communications Engineers' Blog

小売物価統計調査 小売物価統計調査(構造編) 年次 2021年 | ファイル | 統計データを探す | 政府統計の総合窓口

https://www.tepco.co.jp/forecast/html/images/juyo-2021.csv

鉄道遅延情報のjson

GitHub - MuseumofModernArt/collection: The Museum of Modern Art (MoMA) collection data

Pokemon with stats | Kaggle