AOKI's copy&paste archive

高専から駅弁大学から東工大を経て大企業へ 浅く広い趣味とかキャリアの日記を

駆け出しエンジニア

現状エンジニアへ転向する気はないのだが、ポートフォリオ的にも復習的にもまとめてみるのは悪くないかなと思い

主要な用語とかを自分なりにまとめてみる

1年前の知識を元に書くので誤りがありうる点は要注意

 

言語

Java

最も一般的な言語。

Pythonと比べると変数宣言やら{}やらを厳密に書かなければならない煩雑さがあるが、複雑な機能を実装するには却って明示的で便利なんだろうなあと感じた

Pythonとかでも書けるには書けるらしいが、上記の理由もあってかマイナーらしい

PC, Androidアプリ向け。

Kotlin

Android専用

書いたことはないので詳細不明

Swift

iOS専用

書いたことはないので詳細不明

基本的な機能は同じはず、多分

SQL

データベースを触る言語。

Javaはもう1年触ってないが、SQLは現在の業務でもしばしば用いる

CRMシステムのデータの抽出や分析の業務において

もちろんビジネス総合職なので使うまでもない業務が多いが、明示的に効率的に作業するにあたり知っておくに越したことはない

現在はVlookの代用的に専らJoinを主として使っているが、Webアプリだと4大命令がメインだったかなあ。実装するものにも依るだろうけど

  • Select
  • Insert
  • Update
  • Delete

HTML

ブラウザを表示させるやつ

ChromeでもF12で見れる。モダンなサイトはクソ長くてとても読んでいられないが

aタグ<a, href="link.com">link is here<a/>のような具合で、リンクをつけられるのが特徴

ただのHTMLだとあまり面白みもないが、Javaなどからパラメータを渡すことで動的に表示できる。詳細後述

Javascript

HTMLもJavaも応用できるなんかすごいやつ

前者を攻略してからでないと使いこなせない印象

そんな感じでふんわり知識しかない

CSS

HTMLをキレイにするもの

具体的には文字色やフォントを指定する

これがないと、2000年初頭を思わせるようなただの白地に黒字の殺風景なサイトしか作れない

Bootstrap

CSSをさらに伸ばしたやつ

PythonのModuleよろしく、CSSの大まかなキレイにするセットがあるので便利

モダンなデザインが詰まっているとも言えるか

 

Webアプリケーション

ざっくり言えばブラウザでログインするサイト全般

  • SNS
  • EC
  • その他プラットフォーム

MVC

Model, View, Controllerの3つをまとめて読んだ形式の略称

www.youtube.com

Model

データをもらったり受け取ったりするのを制御する

バックエンドの肝

View

フロントエンドの肝

HTMLを介してModelで得たデータ等を表示し人間と橋渡しする

HTMLと実際に繋がるのはここ

アカウント名やお気に入り登録されたデータはバックエンドからもらって、それをHTMLの変数の欄に入れ込む

静的なHTMLでは対応できないので、HTML側にも変数の枠を作っておく

<p th:text="${accountname}">

Controller

名前の通り全体を制御する

サイトは入れ子の構造になっているので、そうした階層ごとの移動も補助する

例えば検索ボックスに入力して検索ボタンを押したら、検索結果のページを出すとか

検索結果は検索用語により異なるので、Javaによる動的な実装が不可欠

Javaだと@Controller, @RequestMappingを使っていた

この@の本質は結局最後まで理解しきれなかったが

Entity

ModelやQueryとの棲み分けというか境界の定義が正直難しい

要は変数の枠的な認識

Modelが計算式的なものだとして、Entityがその変数の枠で、その中身はQueryによってDBから取得される的な

Query

SQLの文章

予め要件は決まっているので、それに合わせて文字列変数などを随時使いつつ、定型化されたデータの具体の扱いを行う

 

GIT

コードを共有するサイト

会社のものを公開して問題になったことも以前にあったなあ

どうしてもWebアプリや他の複雑なプログラミングを1人で全部やるのは難しいので、役割分担して協力するためのツール

Clone

DNAのクローンと同じ

誰かがクラウドに上げたコードを丸パクリでコピペしてくること

そういうことができるので企業秘密を公開してはならない

とはいえそれでは社内では共有できないので、パスワードを使ったり限定公開的な機能を駆使したりする

Branch

それぞれの作業者や機能ごとに分けておくためのレイヤー的概念

AさんがContollerを触るならA Branchで作業して、Bさんは同時期にViewをB Branchで作業して混乱を避ける

Fetch

Branchを統合すること

下記のPull, Pushとセット的な概念

Pull

BranchをDLすること

Push

BranchをULすること

Conflict

Branchがうまく分けられていないことに生じる厄介事

Fetchする段階でされる側とする側で情報の競合、齟齬があることにより生まれる

 

先の例で言えば、AさんがViewを少し触ってしまうと、B Brachとの矛盾が生じる

そこでどちらかに決めろと言われる

 

他にわかりやすい例を出すなら、他のクライドファイル共有サービスが挙げられる

例えばパワーポイントをチームで編集するのにDropBoxを使っていたとき、CさんとDさんで同時にローカルで編集すると、後に保存する方は当初の名前では保存できない

これは自動的にConflictを解消させている

GITはそこを任意でどうするか個別に聞いてくれる親切さというか厄介さがある

 

これが面倒なのでBranchでの作業・責任分界は重要

 

後記

書いていると意外と忘れていたり、具体的でないと伝えにくいこともあった

空き時間を見て、ローカルで小規模に再度実装してみてもいいかもしれない

その時にははてなのコードを見やすくする機能も活用しまくりたい

 

またこれの対象読者層的な初心者には以下の動画とかもおすすめ

上述のものといい英語で恐縮だが、日本語の動画は個人的に低質に見えて。。

さすが覇権言語、競争による力学に優れる

 

www.youtube.com

 

基本情報取れるかな?

 

あと当時は超基本的な設定はお膳立てされていた

それらも一気通貫で自分でやってみれれば、かなり実力には繋げられそうだ

localhostの知識とかも曖昧なままやってたからね。。

 

参考:過去記事

 

pytho.hatenablog.com

 

pytho.hatenablog.com

 

何をそんなに焦っている?

キャリアのテーマ

 

社会人歴1.5年が経った。

社風もあってか体感同期の2割が去った。

理由は様々だ。弊社に対するポジネガ色々な意見も聞いた。

ちなみに私自身はしばらくやめるつもりはない、かな。

 

また辞める辞めない問わず、スキルアップには皆余念がない印象だ。

これ自体はいいことだ。

私自身もその一環としてITスキルを伸ばした。

 

pytho.hatenablog.com

 

長期的には基本情報か応用情報も取りたく思う。

同期にも勤めながら監査系の資格を虎視眈々と狙う人もいる。

 

Tableauの研修が終わって、会社の仕事も色々と一段落つき、冷静に考え直す時間があった。

そうして直近を振り返り、未来を思考すると、何をそんなに焦っていたのかと思い直す。

 

弊社の給与テーブルにおいて、居座ることにどれだけのメリットがあるかは確かに疑問ではある。

とはいえ数十年のスパンで物事を考えてもいいように思う。

近視眼的すぎる思考ではまた詰みかねない。

 

なぜ会社を辞めなければならないのか、在籍しながら勉強して準備をしてもいいのではないか。

確かに同期には部署によってはかなりブラックなところもある。

ただ私みたいに比較的ホワイトなところもあるのだから、会社としてやりようはある。逃げるのも一手だが、その選択をする人間に未来はあるのか。

人事に相談するなり、上長あるいはさらにその上の上長に掛け合ってみてもいいだろう。

結局、人を納得させられれば、それは普遍的なスキル足り得るだろう。

 

そもそも大企業なのだから基本的には有利な条件が揃っている。

事業においても発注者的優越的立場にある。あえて逆境に行くのは勇気があってすごいが、正直効率的とは思えない。特にスキルが未熟な今の時期は。

 

pytho.hatenablog.com

 

私自身、社内・社外の転職を今まで考えていないでもないが、結局転職したところで未だ下っ端にしかなり得ない実感があるからこそ、動くに動けない。

この辺は妙に冷静というか素直に。

 

ここまで書いてはいるものの、危機感は理解できる。

特に総合職として何でも屋をしていると、特化したスキルがどうしてもつきにくい。

結局、本社企画系としてデータを扱っていようとも、周囲がExcelベースなので自身のスキルアップは見込めない。

体験談としてPythonの分析結果は複数部署で既に棄却されている。

これは私のストーリーテリングの不足もあるものの、社内的にこれでコミュニケーションを取る前提知識が圧倒的に欠けている証左でもある。

こういうフラストレーションは理解できる。しかしながら、やはりこれは自身のストーリーテリングの能力不足として、協働の道を探るべきと考える。

もちろん凄腕エンジニアのもとでデータサイエンスをしたら、大いに勉強になるだろうから羨ましいが、そこは総合職として入った呪縛のようなものだろう。

 

ただそうした中、結局社内外のアセットを利用出来るだけし尽くして、スキル開発を狙えば十分でないだろうか。

本もあるし、社内に同様のコンテンツを学ぶ同志もいるだろう。

最近ではUdemyやネットのコミュニティもある。

いささか同等感には欠けるものの、社内にはマクロを始め自動化スキルをバラマキ共有している。

あるいは先輩のPowerShellは大いに参考にさせてもらった。

 

ちなみに今後の個人的なホットトピックは、PowerAutomateとPyTorchとAlteryxだ。

後者のノーコード的なサービスは、ライティング能力に欠けるビジネス総合職組織にまさしくという感じで、若干嫌悪感もあるのだが。

 

とはいえここからは牛歩で行こうと思う旨を宣言してしまおうと思う。

これまでの学生時代含め、今までの過ごし方が真面目すぎた。

おかげで安寧の地:大企業総合職を得られたとは思う。もちろんここから成長すべきなのは最もだが、これまでのペースで続けていたらば、人生の本来的な目的である楽しみを失いかねない。お金という手段が目的化しつつある。

 

実際に積読積みゲーもたくさんあるし、他の買い控えしている娯楽もたくさんある。

社会人となり金銭的な余裕が生まれ、時間的余裕が犠牲になっている今、ウェルビーイングに最大に資する活動にベットしたい。

などなど

 

そこで話は回帰して、別にさらなるスキル開発をすぐに行う必要はなくて、再来年くらいでもいいのではないだろうか。

勤め続ける限りにおいて、能力は微量ながら向上するのだから。

 

この点、修士でやや高齢(とはいえMax2年)で入社した分、同期と若干の価値観や体力の相違もあるかもしれないと思ったり。

秋分の日の船旅

 

9/22 Thu.

会社

荷物が多め

通常勤務

横須賀美術館

昨年のふるさと納税の飲食券が期限間近だったので利用

定価で8000円ほど

美味

再訪あり

通常展、企画展は訪問済み

その際にレストランも利用しようとしたものの当時は予約が埋まっており当日受付できず撤退

横須賀新港

全体的にとてもキレイ

ROROされる車両も多数

9/23 Fri.

秋分の日

太平洋沿岸航路

終日、東京九州フェリー

荒天から昼過ぎより晴天

ちょうど台風を回避

この頃静岡を中心に東日本で荒天

パブリックスペースもキレイで広い

昼用の空間があるため、雑魚寝席でも満足できる

私は個室

とはいえその個室も若干いびきが貫通。。。

甲板上は強風

おかげでメガネを紛失し高知沖に沈む

また洋上で整えるのが最大の強みだと思った

サウナと露天風呂の大浴場を備えているため、サウナ浴びたあと冷水シャワーを被って、露天で海風を浴びるスキームが無限にできる

イメージ交通機関は水の管理、特に量の担保が難しい印象だったが、あまり困ってなさそうなのが意外だった

門司港

ほぼ丸一日がかりで夜に到着

下船

この時間から観光は不可なので同じ北九州市内のホテルで明かす

高速船で頑張ってもこれなのは如何ともし難い。。

若松

あまり地図で調べなかったら若松、なかなか遠かった

九州のゴールデンゲートブリッジ

公共交通としての船

なかなか立派なアンカレッジ

いずれも明朝の写真

9/24 Sat.

ゼンリンミュージアム

小倉の最大の目的

主題図としてのテーマの違いが面白かった

企画展は福岡と博多の関係の歴史

これがなければ興味も持たない知り得ない話だったので為になった

が、都道府県名にマイナーな名前が置かれたのは、弱めの地域では特に顕著だったのでわりかし普遍的な話だったかも

それと通常展に関しては、どうしても西洋に寄っていてそこに伊能忠敬ら日本が混ざり合っていく感じ

資料として仕方ないかもしれないが、もっと全世界津々浦々のも見てみたかった

再建か当時のままか知らんけど裏手には小倉城があり周囲が公園として整備されており風光明媚

北九州市はやんちゃな成人式のイメージしかなかったが文化的ヒエラルキーが高く意外

広報的にももったいないだろうにと思った

門司港駅

小倉第二の目的地

明治的な趣を残し最高

軍港として重視された歴史は

あたりとも共通し、それらの既視感も感じながら、やはり再び感傷に浸った

 

pytho.hatenablog.com

 

pytho.hatenablog.com

 

いつでもおしゃれなスタバ

ディズニーしかり西洋風の建物は夕方が映えるね

現役跳ね橋

NTT西日本の施設

体験型の電話ネットワーク機器

仕組みが視覚的にも明快なほど原始的で勉強になった

今はこれもデジタル化か

障害多いけど

関門海峡関門トンネル

海峡が狭すぎて土木的凄みは低め

インパクトで言えば明石海峡大橋やレインボーブリッジに軍配が上がる

ただ地学的に面白さは現地なればこその体験

海峡を目の前にしながらこの高低差の山々という複雑性

こちらは節タイトルにもした跳ね橋

可動橋として橋の動くダイナミズムは凄い

これも人道橋なのでそこそこって感じもあるのだが

海峡ミュージアム

大スクリーンで映像と音声の演出も

こちらは源平の人形

ここで気付かされたがこの海峡歴史的にも要衝である

かねてより地学的に交通結節点なので当たり前ではあるが


山陽新幹線

本来であればここから大阪まで再度夜行フェリーの予定

しかし送迎のバス停を間違え、それに気づくのがギリギリで結局乗るのを逃す

そのため仕方なく山陽新幹線に乗車し大阪に前日入り

フェリー料金がビジホと同等なので、新幹線の約2万が緊急で無駄な出費

車内のWi-Fiがまったく使い物にならなくイライラだった

新大阪

そんなわけでビジホ

9/25 Sun.

玄武洞

ここからは大阪起点にサイコロきっぷを利用

出目は餘部城崎温泉

行きは姫路但馬線経由の特急はまかぜ

寺前から北がかなりローカルというか非電化の秘境区間だった

一旦城崎温泉駅で途中下車

昼頃着いたがまだチェックインできないので自転車を借り南下し観光

玄武岩の語源の玄武洞

ここで柱状節理の風致と地学を博物館で楽しむ

直近の地学に関する社会問題の論文も

読めたので軽く目を通したがややアカデミズムに欠ける記述の印象も受けた

ちと人間臭さが強いというか言い方悪いが

直近でも科博で宝石展があったがそのような感じ

玄武洞玄武岩がアピールポイントだが、ここはこの地域に焦点を当てた1階と広範なアウトリーチ的自然科学分野に分かれた構造

前者は玄武洞のほか、近所の金山銀山や産出鉱物、地形の成り立ちの説明など

山陰もジオパーク指定を受けているようだが、直近の旅行先の伊豆、七滝も柱状節理などは似ている

 

pytho.hatenablog.com

 

それだけ地学的に恵まれた国土とも言えるか

風致や温泉など

おかげで地震噴火の災害リスクも高いが

 

後者は上記の宝石類のほか、化石も

ただ化石はレプリカもそこそこ多かった

玄武岩の落石はシャレにならないですからね

写真の通り冷え固まる過程で曲がったのか、崖がせり出したりもしているのは凄い

城崎温泉

もうこの2つの写真がなんというかエモい

日本の昭和的原風景感

映画の中のような

踏切の反対側は、、

宿泊先はそこそこの高級宿

本来は一週間前に行きたかったが、ここの予約がうまくとれなかったため、全日程がずれ込んだ

いつでも有給は取れるので特に問題ではないが

日曜泊にすることで需要の分散にも貢献できただろうし

それでいうと日曜の城崎は昼も賑わっていて夜もそこそこだったが、月曜の昼はかなり静かだった

閉まっている店もしばしばあったり

城崎名物

  • 但馬牛
  • 香住蟹
  • 香住鶴:オプションの日本酒
  • 刺し身
  • 煮付け

季節のおかず

  • 前菜のサンマ・栗

全体的に高級宿だけあって味もサービスもよかった

気になった点を強いていくつか挙げると:これは旅館のアンケートにも回答

  • しょっぱいおかずはご飯と食べたかった
  • ご飯を待ちながら前菜を先に食べたら主菜が冷めてしまった
  • 内湯が小さめ:外湯めぐりで補いうる
  • 浴衣の帯の糸がテロテロ
  • Wi-Fiが不安定
  • 下座のほうがむしろ景色がいい

特に夜の雰囲気がいいですね

ありきたりな作られた日本感がないこともないが

倉敷、佐倉、栃木とかに似ている感

とはいえ景観が陳腐だとしても、独自の外湯めぐりが制度として非常に優れている

支払いはQRコードで一元化もされているため、タオル類さえ持てば財布も不要

ただし各温泉の自販機に電子マネーは備え付けられていないため、コーヒー牛乳が飲みたい場合は小銭だけでも持たなければならない

やや不便

 

城崎温泉外湯主観Tier

  1. 鴻の湯
    広く空いている
    露天も非常に開放的
  2. 御所の湯
    景観が優れている
  3. 一の湯
    歌舞伎形式の建築が優れている
    全体的に広い
  4. 柳湯
    雰囲気がいい
    檜風呂なのか自然的で江戸時代感
  5. まんだら湯
    壺湯が面白い
  6. 地蔵湯
    強みに欠ける
  7. さとの湯:評価対象外

 

9/26 Mon.

有給

城崎文芸館

志賀直哉を読もうと思いました

温泉×文芸に強みを出そうとしているらしい

ちょうど伊豆の踊り子の以前の旅行に似ている

あれは温泉地というよりかは温泉宿があやかっている感じだったが

マーケティングとして数年に一度、オリジナル文学も現地限定販売しているとのことで数点購入

湊かなえと絵本はあまり興味がなかったので一旦保留

餘部駅

きっぷ最終目的地

感想としてはそこまで時間をかけていくほどの観光地でもないというのが率直なところ

城崎のおまけが位置づけ的にちょうどいい

全撤去されたと思いこんでいたが、一部は残されていた

新しい橋はエクストラドーズド橋

いかにもという感じ

リアス海岸の複雑な地形によりスパンを飛ばすなら吊り橋か斜張橋

しかし強風の事故があったため、変形量が大きいこれらの形式はそぐわない

とはいえ桁橋ができる桁高でもない

高速道路にありがちなラーメンでもよかったとも思うが

既設橋があり分割工事が必要だったことを鑑みれば、剛体を作れないのも厳しい

そして必然的にエクストラドーズド橋が導かれる

併設された道の駅にはこれらの土木的説明や地元の歴史、事故の資料等があった

とはいえそこしか訪れるところがないので、滞在時間は長くとも2時間に抑えるべき

でないと飽きる

くっそローカルなのでこのあたりは計画性を持たないと終わり

私は割りと終わってた

とはいえ城崎も1晩で十分感はあるのが難しく惜しいところ

水族館?方面に行ってみてもよかったかもしれない


会社

夕方から業務時間外向けのイベントがあったので帰りがけリモート参加

帰りは嗜好を変えつつ利便性を鑑み、福知山・宝塚経由の特急きのさき

大阪は10時頃着だったろうか

しかし既にラストオーダーを過ぎており飯を食いはぐれている

最悪コンビニもありだったが幸い地下?のマックが空いていたのでここで済ます

 

9/27 Tue.

大阪駅1H

大阪の上りサンライズは日付変わってからの発車

とはいえ当日は動物との衝突だとかで1時間延

待合室でヒーローモードのラスボスと戦う

サンライズ出雲

乗車

昼に最後の外湯に入ったものの、午後中探索しそこそこ暑かったせいで汗ばんでいたのでシャワーに入りたいところではあったが、残念ながらシャワーカードはいずれも売り切れ

泣く泣く京都付近で眠りにつく

熱海駅

朝、遅延を知らせるおはよう放送

昨晩の遅延は回復できなかったらしい

とのことで新幹線への振替が無料らしい

確かに1時間遅れで到着すると会社はピッタリくらいになってしまう

ましてや東海道線のラッシュの筋にうまく入り込まねければ、遅延が拡大するリスクもあり、それを会社に遅刻理由に上げるのはやや不味そうだ

そのためまだ寝ていたかったが急いで荷物を整理し乗り換え

会社

新幹線は品川で下車

大井町経由で8時頃にはつけた

会社で朝食を済ます

これも乗り換えへのインセンティブに働いた

この点は月曜有給にした甲斐ありだ

非常に内部的な話になるが

お土産配り

通常勤務

社会人ワークショップ

先週末、会社のCXOも交えて、社会貢献:ボランティア的活動に参加したので、簡単に感想のメモをまとめる。学生以来のワークショップとしてはしゃいでいた。



pytho.hatenablog.com

 

インクルーシブ・包括性において一般に平等が重んじられるのに対し、結果的に本人の自主性、自由が強調されたのは興味深い。
自由で個人を尊重した経営は近年成功事例も多い。GoogleNetflixが代表的だ。同じく若いTech系の企業としてシナジーや実現性も高いだろう。

 

  • 自由な組織について

NO RULES(ノー・ルールズ) 世界一「自由」な会社、NETFLIX

 マネジメントの常識を覆す次世代型組織の出現

  • 人事制度について:Google

ワーク・ルールズ! 君の生き方とリーダーシップを変える [ ラズロ・ボック ]

不道徳な経済学 転売屋は社会に役立つ (ハヤカワ文庫NF)

 

pytho.hatenablog.com

 

冒頭の自由さは、リベラルからリバタリアンへの変化と言える。直近の先進的な取り組みとしてリベラルが台頭してきた中、リバタリアンのコンテクストから施策を試みるのも面白いだろう。
そもそもとしては上記の前提知識も含めたものとして、就労規則撤廃という私の過激意見に大きく依拠したのはやややりすぎた感もある。
とはいえ、リベラルにハードクレーマーの奴隷となって禁止を列挙する不自由な公園より、自由とそれに伴った責任の教育機会も包摂する訪問先:あそびーばーの哲学・理念の方が健全だろう。個人の感想にはなるが、危険やリスクを敬遠する余り、社会全体が過保護な印象もあり、その揺り戻し・是正としての社会保障の一部の断捨離も合意が得られるだろう。ただし完全なアナーキズムには賛同しきらない。
さらに政治的な文脈を蛇足すると、弊社の労働者権利(・福利厚生:一般のJTC比)の弱さも1つトピックになりうるかもしれない。フラストレーションの蓄積やパワーバランスの是正が、背景の力関係に隠れているかもしれない。
主題に女性に焦点があたっていない点は、全体を通した課題感があった。しかし女性のペインが起点であることを強調した上で、女性や弱者全般を包括したインクルーシブな提案の文脈を担保できれば、筋は通せるだろう。
またチームの関心がキャリア観に寄っていたものの、訪問先が子供向けの機関だったため、訪問中の軸がややブレ気味だった点も否定しきれない。子供から学んだ経緯や家族観をやや強調してもいいかもしれない。
最後に余談だが、現地の高校教師と話す機会が多かった。社会人になり子供もいなければ接触機会がないので、そもそもが会社による機会の提供としてありがたかった。そこで地理必修化が話題になり思い出された。私自身は業務上において、GISに関連した社内アセットの可視化や戦略策定を行っている側面もある。そこで出張授業や講義資料に資する情報を提供できる可能性も感じられた。なかなか会社に閉じこもっていると、その一面的な価値しか見つめられないのは残念だ。もっとも社内機密の扱いには十分な注意が必要なのもまた事実でもある。
こうした経験も通じて、やはり東京はリベラルで多様性を訴えつつも、その実務においては予想以上にこれを実現できていないことを痛感した。地方のコミュニティの方が、個人の特性に応じて越境的な能力を発揮し、小さな社会だからこそ風通しや顔見知りが多く、多様性も担保されやすいように感じられた。

UIJターンの分析:世田谷と気仙沼の比較ケーススタディ

これまではそれぞれ概要になっていたので、今回はもう少し深掘りする方向を意識しつつ記載したい。

 

前回リンク

pytho.hatenablog.com

 

pytho.hatenablog.com

 

概要

今回トピックにするのは、下記の気仙沼と世田谷の人口データを比較したもの。

いい具合にフォーマットがズレてくれていたので、ブルシット気味な無駄仕事、もといデータクレンジング、データエンジニアリングも意識しつつからの、データサイエンスに繋げられた一貫的なフローもそれはそれで尊いだろう。やや皮肉だが。

 

元データ

まずはすべての処理前の生の元データの一部を示す。

表形式になっているだけいいのだが、カラムの設定等に地域差がありすぎて使いにくいことこの上ない。

 

町丁 総数 0~4歳 5~9歳 10~14歳 15~19歳 20~24歳
総数 433,723 482,485 17,239 16,355 19,198 18,366 18,941 17,893 17,970 16,807 24,855 26,279
  世田谷地域 119,314 133,240 4,676 4,554 4,965 4,884 4,499 4,370 4,217 4,069 6,756 7,300
    池尻まちづくりセンター 11,584 12,508 467 473 443 442 399 400 334 324 621 597
      池尻1丁目 824 686 34 40 48 37 43 55 39 38 53 40
      池尻2丁目 2,145 2,346 68 64 80 76 57 52 49 44 109 96

 

   年齢  地区 0~4 5~9 10~14 15~19 20~24
気仙沼        171        191        240        261        352
       156        172        217        267        298
       327        363        457        528        650
鹿折          69          82          84        111          94
         74          72          90          97        104
       143        154        174        208        198

 

その地域内だけであれば、それに併せて作業すればいいが、今回のような統合においては実質的に不可能とも言える。

今回はこの手間もあって2地域のみとした。これが人力で対応できる実質的限界点にも思えるからだ。もちろん無限のリソースがあれば不可能ではなかろうが。

 

そもそも住民基本台帳ベースなのだろうから、それ自体を匿名化して公表するか、あるいはそこからのサマライズのルールを全国的に統一すべきだろう。現実性としては後者の方が高いか。また忙しいとされる役所業務の負担軽減にもなりそうだ。

 

ソースデータの整形

こうした形式をExcel等で確認した後、Tableauで使いやすいように読み込みの形式等をうまい具合に指定する。

もっとも最適化されたDB等であればこの作業は不要だ。

まずはデータインタープリターのチャックボックスを入れて不要な見出しを削除する。

 

ピボット

具体的にはデータがそれぞれ不要に横長になっているので、ピボットでこれを縦に変換する。

 

属性 年齢 性別 町丁 1 町丁 2 町丁 3 階級最小値 人口 総数 女 総数 男
0~4歳 女 0~4       0 16,355 482,485 433,723
0~4歳 男 0~4       0 17,239 482,485 433,723
100歳以上 女 100       100 496 482,485 433,723
100歳以上 男 100       100 75 482,485 433,723

 

 

地区 年齢 性別 人口 合計
気仙沼 0~4 171 7,007
気仙沼 10~14 240 7,007
気仙沼 15~19 261 7,007
気仙沼 20~24 352 7,007

 

 

右端に総数・合計という変なデータがあるが、これは無視する。

気になるようであれば、データソース段階で削除してもいい。大規模なデータである場合も、作業の軽量化のために削除したほうがいいだろう。

 

属性分割

これで気仙沼のデータは属性の切り分けがうまくいった。しかし世田谷は属性に年齢と性別の両方が含まれてしまっており、扱いにくいことこの上ない。そこで数式を用いて、分割を図る。

今回の場合はキレイに空白があるので、ここの前後で切り分ける。

年齢

SPLIT(TRIM( SPLIT( [属性], " ", 1 ) ),"歳",1)

性別

SPLIT(TRIM( SPLIT( [属性], " ", 1 ) ),"歳",1)

 

補足:名称変更

ここまでの作業で、年齢、性別ごとの階級値に切り分けられた。市区ごとにカラム名が異なっており、ブレンディングや単純に見るときの項目名の違いが誤解の元となる懸念があるので、この段階でフィールド名も統一して変更しておこう。

複数市区を比較するにあたり、上記の分割のロジック組みとフィールド名変更が厄介なのは前述したとおりだ。

 

余談:前処理の負担

くどいようだがデータソースのキレイさによっては、以上の作業はしばしば不要だ。データクレンジング、データエンジニアリングの面倒さを痛感させられる。

 

3-1:ビッグデータの活用と分析に至るプロセス - ppt download

https://slidesplayer.net/slide/14246648/

 

GUI操作でViz作成

シート

ここまで来れば後はTableauの特徴の簡単なGUI操作により一瞬だ。

今回は人口をトピックにしたので、せっかくなので人口ピラミッドを作ってみたい。本来であればBinを設定するところだが、サマライズされた統計データなので不要だ。

それぞれの領域にドラッグアンドドロップするだけなので、細かい補足は不要だろう。

年齢を縦軸とし、横軸をメジャーバリューの人口とする。ここで先述の通り総数はおかしなデータが入ったままなので無視する点に要注意だ。

 

 

元のデータの時点で合計にはなっているが、ひとまず合計を選んでおくこととしよう。平均でも表示内容は変わらないと思っていたら変わる。。!詳細は確認できていないが、条件に該当する変なセルがある分、平均として割る数にカウントされるものがありそうな気がする。簡単な分、ビジュアライズされるとミスに気づきにくいのは、便利さの代償として注意しなければならない。

そしてフィルターに性別を指定し、社会的にコンセンサスのとれている、男を青、女を赤に色付ける。また地域の項目もあるので、ここを市区全体になりつつ、総数のカラムが入らないように調整する。

 

 

男も基本的に同様だが、ピラミッドとして左右対称にしなければならない。今回は横着にメジャーにマイナスをつけた。

 

ダッシュボード

あとはこれをダッシュボードで同じようにくっつけてしまえば完成だ。最後の反転処理等が雑なものの、欲しい情報の粒度に応じてはこれくらいの手抜きは許されてほしいところだ。

 

 

ピラミッドのルールに従って左右に男女、ついでに上下に市区を比較した。本来的には集合横棒等の方が比較しやすいが、市区で一旦データがサマられてしまっている以上、それを解凍して再構成するのは骨が折れる。

 

あるいは町目のデータもあるので、これとツリーマップを組み合わせて人口構成の比率を可視化しつつ、ブレイクダウンしやすくできるのもTableauの強みだ。

 

2市区比較

ここまででも大した成果になっていない割には手間がかかって疲れている。とはいえこれだけなら、最後のダッシュボードを除きExcelでも十分にできそうな内容を変に苦労したにすぎない印象も強いだろう。

そこで簡単であるが、地区をクロスさせて比較を試みた。

 

 

人口ピラミッド違法建築

 

まずは人口ピラミッドの原理に反するところもあるが、左右:男女で市区を変えてみた。世田谷は40台がピークで働き盛りかつ、子育ても活発であろうことがうかがえる。子供は相対的にはやや少ないが、国内では多い方に思える。ここはそのデータも入れるべきところではある。

また20歳で値が大きく飛んでいる。おそらく大学、社会人として上京による流入が多いことを示すだろう。このあたりは都内特別区での違いも気になるところではある。

反対に気仙沼は70歳代の団塊がピークだ。やはり地方の高齢化が顕在化している。またアラサーで凹んでおり結婚を期にした流出が深刻そうだ。これは意外にも男女差はあまり見られない。このあたりのジェンダー観は案外フラットでリベラルなのかもしれない。凹みの反動でティーンがややピークにも見える。将来的な政策課題として、ここの世代をなるべく流出させない努力も非常に重要だろう。

こうした経時変化においては、各年代ごとのデータを収集したコーホート分析が有効だ。さすがに同一市区においてデータ形式が変わっているとは思えないので、これは追加分析のしがいもありそうだ。

 

散布図

 

 

世代ごとに散布図にしてみた。分かりやすくその階級最小値:数式で~前をとったでラベル表示と大きさ変更をしている。さらにこれを自動のクラスタリングにかけた。クラスター数も自動で適切な数に調整される。もちろんマニュアルで操作もできる。このあたりはPythonのK-meansとも遜色ないレベルだ。

図上にコメントしたようにこのクラスタリングはまさにライフステージにキレイに分かれている。これほどクリティカルで有効そうなクラスターもそうない。これは日本人全体で共有している実感ともそう変わらないだろう。

要は地方は高齢化が深刻で都会に比べその数が多く、反対に現役世代は都会に集中してしまっている。

しかし今回の分析で興味深いのは被扶養者、黄色のクラスターだ。子供や前期高齢者の地域差はあまり大きくない。ここに日本の活路がありそうだ。定年後のセカンドキャリアや育児支援だ。

とはいえ今回は2都市でしか比較しておらず、世田谷も特別区では高齢者や富裕層が多いイメージがありやや例外的な印象も否めない。そうした面は今後の課題とも言える。

だが以上、データ成形の苦労に対応するインサイトは得られたと考える。読者も動的変化を見つつ、洞察を深めてもらいたい。

 

感想

やはりデータ成形が大変だった。こういうルール作りが何かと誰もやりたがらないが大切だ。とはいえ、ただの印象の話が一部データに裏打ちできたのは嬉しい。

地方都市としての仙台や都内でも例えば新宿区との比較ともしてみたかったものの、リソース的に余力がなくできなかったのは残念だった。

また今回は2都市の比較の中でも人口のみになってしまった。漁業が得意で天然資源の豊かな地域の代表として、1次産業を筆頭とした経済活動の差分も出したかった。これらも下記のリンクで同様にあるので、折を見て取り組みたいところだ。

最後にVizとしては比較的標準的なものに落ち着いたが、三角関数等を駆使して、既存の枠組みに捕らわれない表現にも挑戦したいと所信表明したところで、今回は筆を置くこととする。

 

参考文献

データは各市区の役場22/7/13現在の最新の統計データを利用しています。

気仙沼市統計書(令和2年版) - 気仙沼市役所

世田谷区統計書 令和3年版(2021)【Excel形式】 | 世田谷区ホームページ