数据建模入门(データモデリング基礎知識/日本語)

IT革命時代においてはデータが非常に重要な役割を担当しています。
SEとして、データモデリングに必要となる知識、技術を学ぶことが必要だと思います。
三連休に、データモデリングの基礎知識を勉強しました。皆さんと共有致しますね。
使った参考書は『10日で覚えるデータモデリング(入門教室)』です。
その本のメリットは、基礎知識の解説だけではなくて、DBMS環境を準備してくれて、操作しながら、データモデリングを深く理解できることです。
では、勉強した内容をご紹介させていただきます。

目次
1.理論データモデルの作成
(1).エンティティの定義
(2).リレーションシップ
(3).主キーの定義
(4).依存関係・非依存関係
2.理論データモデルの検証
(5).第1正規化
(6).第2正規化
(7).第3正規化
(8).ドメインの定義と制約の設定
3.物理データモデルの作成
(9).物理データモデルの作成
(10).テーブルの作成
理論データモデルは、RDBMS製品の種類などから独立したデータモデルです。それに対して、物理データモデルは、特定のRDBMS製品に依存したデータモデルです。
まずは、理論データモデルの作成から話しましょう。

==============
1.理論データモデルの作成
(1).エンティティ
 ①定義:現実世界に存在する物体や出来事を写し取った概念です。
   例えば、会社の所要している建物や、お客という役割を担う人、注文
 ②操作手順
  ▪︎業務説明と画面イメージから名詞を抜き出す
  ▪︎名詞が業務で重要な管理対象かどうかを判定する
  ▪︎異音同義語、同音異義語を見つける
  ▪︎名詞を整理する
   ・重要ではない名詞を削除
   ・重要ではない管理対象の名詞を削除
   ・異音同義語を一つの名詞に統一する
   ・同音異義語を別の名詞として区別する
   ・名詞をレベルごとに分ける
    →レベルA:複数の情報や複雑な情報を持つ名詞
    →レベルB:単一の情報や単純な情報を持つ名詞
   ・エンティティ候補の名称をチェックする
   ・エンティティを確定する
(2).リレーションシップ
  ①定義:業務を行う際に発生する、エンティティ間の関係の一種です。
   例えば、
   ・包含関係
    従業員が営業エリアを担当する
   ・協調関係
    従業員が顧客に連絡する
  #エンティティのインスタンスはエンティティの実例を指す。
   例:従業員エンティティのインスタンス
    埼玉一郎、東京二郎
  ②種類
   ▪︎1:0
  ▪︎1:1
▪︎1:N(N>=0)
▪︎1:N(N>0)
▪︎M:N
  ③名前
   動詞句を使う。
   例:記入する
(3).主キー
  エンティティのインスタンスを1つだけ識別するための属性です。 
 
 ▪︎複合キー
  複合の属性で成り立つ主キーを複合キーと呼びます。
  例えば、成績エンティティのインスタンスは、学籍番号と科目コードの値の組合せによって識別できます。
  ちなみに、属性の定義は、エンティティを厚生するデータ項目です。 
   例:顧客エンティティの属性は氏名、電話番号、住所、メールアドレスです。
   インスタンスはエンティティ、あるいは属性の値です。
▪︎外部キー
 リレーションシップの相手のエンティティが持つ属性です。
▪︎主キーの値は変更できない
(4).依存関係・非依存関係
リレーションシップには、相手のエンティティのインスタンスが”あらかじめ存在しないといけない”場合と”あらかじめ存在しなくてもよい”場合があります。前者を依存関係と呼び、後者を非依存関係と呼びます。

==================
2.理論データモデルの検証
なぜ、理論データモデルの検証するのか。
 RDBMSでは、テーブルでデータを管理します。この場合、このテーブルは不適切であってはいけません。不適切なテーブルとは、データの更新時などに問題の発生する可能性があるテーブルです。例えば、同じデータ項目が複数ある場合に、ある箇所は更新したが、別の箇所は更新しなかったという事態が起こリえます。
(5).第1正規化
 ①単純な繰り返し項目を除く
  エンティティの繰り返し項目を見つけ、繰り返し項目を取り除きます。繰り返し項目とは、エンティティに2回以上登場する属性です。
 ②M:Nのリレーションシップを除く
(6).第2正規化
 主キーが複合キーである場合に、主キーの一部だけでは非キー属性が識別できる状態を解消する作業です。
(7).第3正規化
 非キー属性だけで属性(これも非キー属性)が識別できる状態を解消する作業です。
(8).ドメインの定義と制約の設定
 ①ドメイン
  ▪︎属性のデータ型、桁数、値の範囲などを定義するものです。
 ②参照制約
  参照制約とは、リレーションシップで結ばれたエンティティ動詞に関わる業務ルールです。
  参照制約には、RESTREUCTルール、CASCADEルール、SET NULLルール、SET DEFAULTルールがあります。
  
=================
3.物理データモデルの作成
(9).物理データモデルの作成
理論データモデルのエンティティ、属性、リレーションシップは最終的に、RDBMSのテーブル、カラム、外部キーに変換されます。
ただし、物理データモデルを作成する際には、システムの性能を上げるために非正規化が行われる場合もあります。しかし、非正規化を行うことにより、システムの性能を下げてしまうこともあります。
(10).テーブルの作成
SQL文を作成し、データベースを作成します。さらに、データベースにデータを追加してみます。
以上です。

你可能感兴趣的:(数据分析师)