データマネジメントとデータガバナンスのコンサルタント。イタリア好き。歴史好き。ギャバン、「新九郎、奔る!」推し。

Joined November 2008
220 Photos and videos
日本にデータマネジメントの考え方を広めた貢献者と言ったら、1975年第1回VLDB(大規模データベース)国際会議でピーター・チェンがERモデルの基礎となる概念を発表した同じ場で実装独立の概念データモデルを用いて開発したプラント会社のエンジニアリングDB事例を発表した椿正明先生、ISO11179でメタデータレジストリ標準の規定に貢献された堀内一先生、T字型ER記法を開発してデータ中心のシステム開発を提唱した佐藤正美先生、ザックマンのEnterprise Architectureの考えを基にデータ中心のEAを発案しただけでなく、さらにデータマネジメントが海外で提唱され始めた初期に国内大手企業で実際に取り組み、日本での普及を見越してDMBOK初版を翻訳し、DAMA日本支部設立に尽力された黒澤基博先生、ERWINユーザ会を通じて海外のデータモデリングノウハウを積極的に日本に紹介したDAMA日本支部初代会長松本聡先生、またデータマネジメントの元になりつつより厳密な情報資源管理の普及と実践に取り組まれた諸先輩方、DOA(データ中心アプローチ)開発で国内大手企業の基幹システムの初期の開発に取り組まれたエンジニアの方々、その方法論を現代で実践的に昇華させようと尽力されているDOBAグループの方たちを挙げないわけにはいきません。 日本の初期の基幹システム構築は、少ないメモリとコンピューティングリソースを最大限に活かすために、データだけで無くハードとソフトの専門的な知識も必要とされていました。そのため多くの日本初のデータ管理手法が生まれました。今のデータマネジメントの手法よりもより厳密で精緻なものが求められた時代であり、データマネジメントの多くの方法論はこうした諸先輩たちのノウハウに由来しています。
3
61
63,308
シアトル・データガイことBenjamin Rogojanさんの記事、今回もおもしろい。一節を抄訳。『きっと、「データはソースシステムや、あるいはかなり未加工の状態でそのままにしておいて、それをAIに処理させればいいじゃないか」と言っている人は大勢いるだろう。ええ、2010年にそれを試したことがありますね。「スキーマ・オン・リード」と呼ばれていました。結果は散々でした。それに、トークンのコストも天文学的な額に跳ね上がるでしょう。だから、ラボの人たちは喜ぶでしょうね。』 seattledataguy.substack.com/…

1
5
578
Dataversityの無料カンファレンス、Data Architecture Onlineが7/23早朝に開催されます。今回、ビル・インモンさんと、「データエンジニアリングの基礎」という本で日本の若手データエンジニアに多大な影響を与えたジョー・レイスさんが講演者に含まれています。日本時間で7月23日(木) 0:00 am - 6:30 amとちょっときつい時間ですが、たぶん登録者向けに録画公開されます。後日、有志で鑑賞会とかやりたいですね。 dataarchitectureonline.com/
6
665
chira as データマネジメント専門家 retweeted
初めてディベートを教わったとき印象深かったこと。 辞書を渡されて「用語と意味はこの辞書に準拠すること」と言われました オントロジーの活用には辞書通りに語ることが必須ですが、日本では言葉遊びこそが和歌以来の伝統。 ここは意識的に身につける必要があるでしょう
Jun 9
今語るのがめっちゃ怖いのですが、私は俺らが向き合いたかったことにようやく社会が気づき始めているAI時代だからこそデータエンジニアがちゃんとオントロジーとは?に向き合って正面から語っていくべきだと信じています。 zenn.dev/dely_jp/articles/da…
2
3
585
#ソンマ発掘】G7のイタリアということはありますが、大学の予算が減額され、ウクライナでの戦争以後、現地の物価がものすごくあがっている面も大きく影響しています。現地で支払わなければならない、雇用・施設維持・食費など全て上がっています。もう、昔みたいに気軽に外食に出られません。
東京大学の発掘調査隊で資金難になるなら、他の海外発掘調査隊はもっと厳しい状況なんでしょうか?
1
4
428
東京大学の発掘調査隊で資金難になるなら、他の海外発掘調査隊はもっと厳しい状況なんでしょうか?
#ソンマ発掘】 ご寄付いただける場合は、東京大学基金 utf.u-tokyo.ac.jp/project/pj…よりお願いいたします。 古代ローマの遺跡発掘、資金難でピンチ 東京大、緊急支援を呼びかけ:朝日新聞 asahi.com/articles/ASV651RGP…
1
1
899
古代ローマに関心のある方、イタリアに興味のある方、寄付しませんか?
#ソンマ発掘】 ご寄付いただける場合は、東京大学基金 utf.u-tokyo.ac.jp/project/pj…よりお願いいたします。 古代ローマの遺跡発掘、資金難でピンチ 東京大、緊急支援を呼びかけ:朝日新聞 asahi.com/articles/ASV651RGP…
1
416
#ソンマ発掘】 ご寄付いただける場合は、東京大学基金 utf.u-tokyo.ac.jp/project/pj…よりお願いいたします。 古代ローマの遺跡発掘、資金難でピンチ 東京大、緊急支援を呼びかけ:朝日新聞 asahi.com/articles/ASV651RGP…
6
6
1,357
chira as データマネジメント専門家 retweeted
セマンティックレイヤーで「問いに答える」を整えた延長線上に、「事業を動かす」は生えてこない ボトムアップでデータ基盤を整えてきた立場ほど、思考の切り替えが要る データエンジニアが下流から離れ、事業を回す側に踏み込めるか? 自分もテック 業務部門を担当に つまり、やりがいしかない!
Jun 9
今語るのがめっちゃ怖いのですが、私は俺らが向き合いたかったことにようやく社会が気づき始めているAI時代だからこそデータエンジニアがちゃんとオントロジーとは?に向き合って正面から語っていくべきだと信じています。 zenn.dev/dely_jp/articles/da…
1
2
29
5,589
"ナレッジグラフは学ぶ価値があり、活用すべきものだろうか? もちろん、ツールキットに加え、理にかなう場面で活用すべきだ。しかし、それがデータ活用の究極の解決策か? いいえ。そんなものは存在しない。派閥的な対立を排除すれば、この議論は他の同様の議論と同様、ほとんど意味をなさない。" ジョー・レイスさんの記事の一文。私もそう思う。そして彼の説く「Mixed Model Arts」に、古いけど磨き込んだグローブで参戦しているつもり。 practicaldatamodeling.substa…

2
9
718
親子のコミュニケーションですら、情報とデータの伝達に大きな齟齬が起きるこの世界。まして、構造化されず、ルールによって統制されていない情報やデータを基にしてビジネスを推進・成功させるのは、実はかなり高度なこと。これができる人間の価値は高い。LLMが同じことを実行するには、高価なコンピュータ資源が必要で、リスクを回避するにはいくら投資しても不安は残る。そんな投資はいつまでも続かないので、コンピュータ資源への投資と合わせて、情報やデータをコンピュータが理解しやすい構造に落とし、その構造とルールを逸脱するものがないか監視し、統制するデータマネジメントは、今後もいつまでも必要なんじゃないかと思う。
8
632
LLM向けに、出版社は漢和辞典のコンテンツを整備、販売してはどうかしら(妄想)
メタデータ管理が海外で盛んなのは、その国の第一言語に対して国民の理解度がばらついていること、多くの国が表音文字を使っていて表意文字でないことも関係しているんじゃないかなと妄想。アメリカだと、英語の表現が社会階層と出身民俗背景で全然違う。表意文字なら伝えたいことの概念、コンセプトを文字で伝えられるけど、表音文字だとそれもできないし。なので海外では、「このデータはこういう名前で、その名前はこういう意味なんだよ」というビジネスメタデータの管理が大事になる。
432
メタデータ管理が海外で盛んなのは、その国の第一言語に対して国民の理解度がばらついていること、多くの国が表音文字を使っていて表意文字でないことも関係しているんじゃないかなと妄想。アメリカだと、英語の表現が社会階層と出身民俗背景で全然違う。表意文字なら伝えたいことの概念、コンセプトを文字で伝えられるけど、表音文字だとそれもできないし。なので海外では、「このデータはこういう名前で、その名前はこういう意味なんだよ」というビジネスメタデータの管理が大事になる。
1
16
2,027
chira as データマネジメント専門家 retweeted
これに尽きる。
6月3日開催「第22回デジタル社会推進会議幹事会 合同会議」の資料が公開されました digital.go.jp/councils/socia…
53
380
66,730
chira as データマネジメント専門家 retweeted
Replying to @chira
今のアプローチは、トップダウンで正しいビジネスボキャブラリーを規定するのではなく、現場のドメイン知識が埋まったテキスト (メールやチャットなど含む) からをLLMなどの支援をうけてグラフなどトポロジー構造を作るボトムアップ型のアプローチになっているようです。LLMで100%は難しいですが、LLMが8割、人間2割みたいな感じでしょうか。この点で人間がボトルネックの状況は解消しようとしてると思います。
2
9
925
MDMの伝道師、水谷さんが、Linkedinで同じようなことをもっときちんとまとめられてました。 linkedin.com/posts/satoshi-m…
最近のオントロジーやセマンティクスへの関心は、15年前のメタデータ管理で注目されていたビジネスボキャブラリーを用いた複数テーブルの紐づけや、30年前のISO11179の値ドメイン(Value Domain)や概念ドメイン(Conceptual Domain)によるカラム管理と、基本的な発想は同じだと思うんです。ビジネス用語と物理DBの紐づけと、それによるビジネス部門メンバのデータ活用を目指していたところが。ではなぜ過去の値ドメインやビジネスボキャブラリーが浸透しなかったのか。ビジネス部門がその取組みに継続して協力してくれなかったから。ではどうすれば協力してくれるのか、そこを今考えないと、現在の関心も技術トレンドのひとつで終わってしまう。
1
3
1,979
最近のオントロジーやセマンティクスへの関心は、15年前のメタデータ管理で注目されていたビジネスボキャブラリーを用いた複数テーブルの紐づけや、30年前のISO11179の値ドメイン(Value Domain)や概念ドメイン(Conceptual Domain)によるカラム管理と、基本的な発想は同じだと思うんです。ビジネス用語と物理DBの紐づけと、それによるビジネス部門メンバのデータ活用を目指していたところが。ではなぜ過去の値ドメインやビジネスボキャブラリーが浸透しなかったのか。ビジネス部門がその取組みに継続して協力してくれなかったから。ではどうすれば協力してくれるのか、そこを今考えないと、現在の関心も技術トレンドのひとつで終わってしまう。
2
10
39
5,558
chira as データマネジメント専門家 retweeted
Replying to @chira
そこで出番がデータモデラーの育成です。データモデルの内製化というのですかね。
1
1
455
chira as データマネジメント専門家 retweeted
ほとんどのビジネス知識やセマンティクスは、Excelという地層の中に眠っています。 発掘して修復して選別して陳列するのは大変なので、普通は「脱Excel」と言いながらExcelを避けるものです。 Excelに飛込み、制覇できるのがFDEじゃないかなあ。
FDEって、ビジネス知識をどっぷり理解した上で改善まで考えられて、データのセマンティクスまで体系化できて、アプリ実装までできる人なんじゃないですかね。データスチュワードどころか、ビジネス自体の推進もやればできるエンジニアであり、コンサル。そんな人材、Palantirはじめごく一部の企業しか確保できないんじゃないですかね。データガバナンス体制の構築と新規ビジネスプロセスの定義、関係者の調整だけでいっぱいいっぱいの自分は、FDEになるのは難しそう。
4
14
2,913
全社データ基盤、なかでも全社データウェアハウスの構築目的は、「全社でのAI利活用推進」のようなふわっとしたものではいけない。それでは構築後の基盤へのデータ収集と、基盤の利活用が進まない。目的の背景であるビジネステーマが絞り込まれていないと、そもそもどのデータを全社基盤に集めるのかが決まらないから。それでも構築したいなら、経営層のトップダウンでの構築とデータ収集が必要です。そしてその分、経営層にデータリテラシー=データマネジメントの意義の理解と日常的なデータに基づく意思決定、が求められます。そんな人、滅多にいないです。
1
7
51
4,810