วันอาทิตย์ที่ 7 ตุลาคม พ.ศ. 2561

บทที่4

โครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศ

Information Technology Infrastructure

ฐานข้อมูลและระบบสารสนเทศ



ฐานข้อมูล

          ฐานข้อมูลเป็นระบบจัดเก็บข้อมูลด้วยคอมพิวเตอร์ ซึ่งมีวัตถุประสงค์เพื่อบำรุงรักษาข้อสารสนเทศ (Maintain information) ให้สามารถนำมาใช้ได้ตามต้องการ ซึ่งมีรายละเอียดต่างๆ ดังนี้
          ข้อมูล (Data) หมายถึง ข้อเท็จจริงเกี่ยวกับเรื่องใดเรื่องหนึ่งที่อยู่ในรูปของตัวเลขหรือสัญลักษณ์ต่างๆที่ยังไม่ผ่านการประมวลผล ซึ่งข้อมูลอาจจะได้มาจากการสังเกต การรวบรวม การวัด ข้อมูลเป็นไปได้ทั้งข้อมูลตัวเลขหรือสัญลักษณ์ใดๆ ที่สำคัญจะต้องมีความเป็นจริงและต่อเนื่อง ตัวอย่างของข้อมูล เช่น คะแนนสอบ ชื่อนักเรียน เพศ อายุ เป็นต้น
          ฐานข้อมูล (Database) หมายถึง กลุ่มของข้อมูลที่มีความสัมพันธ์กัน นำมาเก็บรวบรวมเข้าไว้ด้วยกันอย่างมีระบบและข้อมูลที่ประกอบกันเป็นฐานข้อมูลนั้น ต้องตรงตามวัตถุประสงค์การใช้งานขององค์กร เพื่อให้สามารถใช้ข้อมูลเหล่านั้นร่วมกันอย่างรวดเร็วและมีประสิทธิภาพ

ปัญหาของการจัดการข้อมูล
  • ระบบข้อมูลที่มีประสิทธิภาพให้ผู้ใช้ถูกต้องทันเวลาและข้อมูลที่เกี่ยวข้อง
  • ข้อมูลที่ถูกต้องปราศจากข้อผิดพลาด
  • ข้อมูลที่เป็นประโยชน์สำหรับผู้มีอำนาจตัดสินใจเมื่อจำเป็น
  • ข้อมูลที่เกี่ยวข้องมีความเกี่ยวข้องเมื่อเป็นประโยชน์และเหมาะสมกับประเภทของงานและการตัดสินใจเมื่อต้องการ
  • หลายธุรกิจไม่มีข้อมูลที่ถูกต้องทันเวลาหรือมีความเกี่ยวข้อง เนื่องจากข้อมูลในระบบสารสนเทศของพวกเขาได้จัดสรรและบำรุงรักษาได้ไม่ดี
ลำดับชั้นข้อมูล


          ลำดับชั้นข้อมูล หมายถึง การจัดระบบข้อมูลอย่างเป็นระบบซึ่งมักอยู่ในรูปแบบลำดับชั้น องค์กรข้อมูลเกี่ยวข้องกับอักขระ ฟิลด์ ระเบียน ไฟล์ และอื่นๆ แนวคิดนี้เป็นจุดเริ่มต้นเมื่อพยายามที่จะดูว่าอะไรทำให้ข้อมูลขึ้นและข้อมูลมีโครงสร้างหรือไม่ 
  • ฟิลด์ กลุ่มของอักขระคำหรือจำนวนที่สมบูรณ์
  • ระเบียน กลุ่มของฟิลด์ที่เกี่ยวข้องที่อธิบายถึงเอนทิตี้ (บุคคล สถานที่หรือสิ่งที่ต้องเก็บข้อมูลใดๆไว้)
  • ไฟล์ กลุ่มของระเบียนที่มีประเภทเดียวกัน
  • ฐานข้อมูล  กลุ่มของไฟล์ที่เกี่ยวข้อง
ปัญหาเกี่ยวกับข้อมูลแบบแผนสิ่งแวดล้อม
  • ข้อมูลซ้ำซ้อนและไม่สอดคล้องกัน 
  • ความซ้ำซ้อนของข้อมูล คือ การมีข้อมูลซ้ำในระบบไฟล์ข้อมูลหลายชุด เพื่อเก็บข้อมูลเดียวกันมากกว่าหนึ่งสถานที่ ซึ่งนำไปสู่ของเสียทรัพยากรการจัดเก็บ
  • ข้อมูลไม่สอดคล้องกัน คือ แอททริบิวต์เดียวกันอาจมีค่าที่แตกต่างกันและยังนำโดยข้อมูลซ้ำซ้อน

การพึ่งพาข้อมูลของโปรแกรม
  • การพึ่งพาข้อมูลโปรแกรม หมายถึง การมีข้อมูลที่มีความสัมพันธ์กันเก็บไว้ในไฟล์และโปรแกรมเฉพาะที่ต้องการ อัพเดตและบำรุงรักษาไฟล์เหล่านั้น ซึ่งจะมีการเปลี่ยนแปลงโปรแกรมต้องมีการเปลี่ยนแปลงข้อมูลในไฟล์แบบดั้งเดิม สภาพแวดล้อมการเปลี่ยนแปลงใดๆ ในโปรแกรมซอฟต์แวร์ได้ ต้องการการเปลี่ยนแปลงข้อมูลที่เข้าถึงโดยโปรแกรมนั้น
  • ขาดความยืดหยุ่น
  • ระบบไฟล์แบบดั้งเดิมสามารถจัดกำหนดการตามกำหนดเวลาได้ รายงานหลังจากความพยายามในการเขียนโปรแกรมที่กว้างขวาง แต่ไม่สามารถส่งรายงานเฉพาะกิจหรือตอบสนองต่อความคาดหมายได้ต่อความต้องการของข้อมูลได้ทันท่วงที
  • การรักษาความปลอดภัยที่ไม่ดี
  • การจัดการข้อมูลอาจไม่มีทางรู้ว่าใครเข้าถึงหรือแม้แต่การเปลี่ยนแปลงข้อมูล
  • ขาดการแบ่งปันข้อมูลและการใช้งาน
  • หากผู้ใช้พบค่าที่แตกต่างกัน พวกเขาอาจไม่ต้องการใช้ระบบเหล่านี้ เพราะความถูกต้องของข้อมูลไม่สามารถไว้ใจได้
ระบบการจัดการข้อมูล (DBMS)

          ระบบการจัดการฐานข้อมูล (Database Management System) หรือที่เรียกว่า ดีบีเอ็มเอส (DBMS) คือ ซอฟต์แวร์สำหรับบริหารและจัดการฐานข้อมูล เปรียบเสมือนสื่อกลางระหว่างผู้ใช้และโปรแกรมต่างๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูล ซึ่งมีหน้าที่ช่วยให้ผู้ใช้เข้าถึงข้อมูลได้ง่าย สะดวก และมีประสิทธิภาพ การเข้าถึงข้อมูลของผู้ใช้อาจเป็นการสร้างฐานข้อมูล การแก้ไขฐานข้อมูลหรือการตั้งคำถามเพื่อให้ได้ข้อมูลมา โดยผู้ใช้ไม่จำเป็นต้องรับรู้เกี่ยวกับรายละเอียดภายในโครงสร้างของฐานข้อมูล เปรียบเสมือนเป็นสื่อกลางระหว่างผู้ใช้และโปรแกรมต่างๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูลซึ่งต่างจากระบบแฟ้มข้อมูลที่หน้าที่เหล่านี้เหล่านี้จะเป็นหน้าที่ของโปรแกรมเมอร์

หน้าที่ของระบบการจัดการฐานข้อมูล
  1. แปลงคำสั่งที่ใช้จัดการกับข้อมูลภายในฐานข้อมูล ให้อยู่ในรูปแบบที่ฐานข้อมูลเข้าใจ
  2. นำคำสั่งต่างๆ ซึ่งได้รับการแปลแล้ว ไปสั่งให้ฐานข้อมูลทำงาน เช่น การเรียกใช้ (Retrieve) จัดเก็บ (Update) ลบ (Delete) เพิ่มข้อมูล (Add) เป็นต้น
  3. ป้องกันความเสียหายที่จะเกิดขึ้นกับข้อมูลภายในฐานข้อมูล
  4. รักษาความสัมพันธ์ของข้อมูลภายในฐานข้อมูลให้มีความถูกต้องอยู่เสมอ
  5. เก็บรายละเอียดต่างๆ ที่เกี่ยวข้องกับข้อมูลภายในฐานข้อมูลไว้ในพจนานุกรมข้อมูล (Data Dictionary) ซึ่งรายละเอียดเหล่านี้มักจะถูกเรียกว่า เมทาดาต้า (Metadata) ซึ่งหมายถึง "ข้อมูลของข้อมูล"
  6. ดูแลการใช้งานให้กับผู้ใช้ ในการติดต่อกับตัวจัดการระบบเเฟ้มข้อมูลได้
  7. ควบคุมการใช้ข้อมูลพร้อมกันในระบบคอมพิวเตอร์ที่ใช้อยู่ปัจจุบัน โปรแกรมการทำงานมักจะเป็นแบบผู้ใช้หลายคน (Multi User) 
  8. ควบคุมระบบความปลอดภัยของข้อมูลโดยป้องกันไม่ให้ผู้ที่ไม่ได้รับอนุญาติเข้ามาเรียกใช้หรือแก้ไขข้อมูลในส่วนป้องกันเอาไว้พร้อมทั้งสร้างฟังก์ชันในการจัดทำข้อมูลสำรอง
  9. ควบคุมการใช้ข้อมูลในสภาพที่มีผู้ใช้พร้อมๆ กันหลายคน โดยจัดการเมื่อมีข้อผิดพลาดของข้อมูลเกิดขึ้น
ความท้าทายด้านข้อมูลขนาดใหญ่

ข้อมูลขนาดใหญ่มีลักษณะดังนี้
  • ปริมาณ : ข้อมูลขนาดใหญ่คือชุดของข้อมูลใดๆ ที่มีขนาดใหญ่มากที่องค์กรเป็นเจ้าของจะต้องเผชิญกับความท้าทายในการจัดเก็บหรือประมวลผลข้อมูล ในความเป็นจริงแนวโน้ม เช่นอีคอมเมิร์ชความคล่องตัวสื่อทางสังคมและอินเทอร์เน็ตของสิ่งต่างๆ (loT) กำลังสร้างข้อมูลมากกว่าเกือบทุกองค์กรอาจเป็นไปตามเกณฑ์นี้
  • ความเร็ว : หากองค์กรของคุณกำลังสร้างข้อมูลใหม่อย่างรวดเร็วและต้องตอบสนองในเวลาจริง คุณมีความเร็วที่เกี่ยวข้องกับข้องมูลขนาดใหญ่ องค์กรส่วนใหญ่ที่เกี่ยวข้องกับอีคอมเมิร์ช สื่อสังคมออนไลน์หรือloT เป็นไปตามหลักเกณฑ์นี้สำหรับข้อมูลขนาดใหญ่
  • ความหลากหลาย : หากข้อมูลของคุณอยู่ในรูปแบบที่ต่างกัน จะมีความหลากหลายที่เชื่อมโยงกับข้อมูลขนาดใหญ่


          ทั้งสามสักษณะนี้ทำให้เกิดความท้าทายหลายอย่างที่องค์กรประสบในการริเริ่มข้อมูลขนาดใหญ่ของตน บางส่วนที่พบมากที่สุดของความท้าทายข้อมูลขนาดใหญ่มีดังนี้
  1. การจัดการกับการเติบโตของข้อมูล
  2. สร้างข้อมูลเชิงลึกในเวลาที่เหมาะสม
  3. สรรหาและรักษาความสามารถด้านข้อมูลขนาดใหญ่
  4. รวมแหล่งข้อมูลที่แตกต่างกัน
  5. การตรวจสอบข้อมูล
  6. การรักษาความปลอดภัยข้อมูลขนาดใหญ่
  7. ความต้านทานองค์กร
โครงสร้างพื้นฐานระบบธุรกิจอัจฉริยะ
  • คลังข้อมูลและData Marts 
  • คลังข้อมูลเป็นฐานข้อมูลที่เก็บข้อมูลปัจจุบันและข้อมูลทางประวัติศาสตร์ที่น่าสนใจ ที่อาจจะเกิดขึ้นกับผู้มีอำนาจตัดสินใจ ตลอดทั้งคลังสินค้า คลังข้อมูลของบริษัท
  • คลังข้อมูลปัจจุบันและประวัติจากการดำเนินงานหลายระบบและปรับโครงสร้างข้อมูลเพื่อการจัดการ การรายงานและการวิเคราะห์
  • ดาต้ามาร์ทเป็นเซตย่อยของคลังข้อมูลซึ่งประกอบด้วยสรุปหรือเน้นมากของข้อมูลขององค์กร จะอยู่ในฐานข้อมูลที่แยกต่างหากสำหรับประชากรเฉพาะของผู้ใช้
  • Hadoop ดป็นซอฟต์แวร์โอเพ่นซอร์สที่จัดการโดยอาร์ปาเช่ ฟังก์ชันซอร์ฟแวร์ ที่ให้การกระจาย ประมวลผลข้อมูลจำนวนมากในราคาไม่แพง คอมพิวเตอร์แบ่งปัญหาข้อมูลขนาดใหญ่ลงไปย่อย ปัญหากระจายไปในหมู่ถึงหลายพันคน  โหนดการประมวลผลทางคอมพิวเตอร์ราคาไม่แพงและรวมกันแล้วผลลัพธ์เป็นชุดข้อมูลขนาดเล็กที่สามารถวิเคราะห์ได้ง่ายขึ้น
  • คอมพิวเตอร์ในหน่วยความจำ
  • การประมวลผลในหน่วยความจำช่วยให้ชุดข้อมูลมีขนาดใหญ่มาก ข้อมูลที่มีขนาดเท่ากับข้อมูลของข้อมูลหรือข้อมูลขานดเล็ก คลังสินค้าเพื่ออาศัยอยู่ในหน่วยความจำทั้งหมด ธุรกิจที่ซับซ้อน การคำนวณที่ใช้เวลาหลายชั่วโมงหรือหลายวันสามารถทำได้เสร็จสมบูรณ์ภายในไม่กี่วินาท่และยังสามารถทำงานได้บนอุปกรณ์มือถือ (ดูเซสชันกาารโต้ตอบในวันที่เทคโนโลยี)

ฐานข้อมูลและเว็บ
  • ในหลายบริษัทใช้เว็บเพื่อทำข้อมูลบางอย่างในฐานข้อมูลภายในที่มีให้สำหรับลูกค้าและธุรกิจพาร์ทเนอร์
  • ในสภาพแวดล้อมแบบไคลเอ็นต์ / เซิร์ฟเวอร์ DBMS อาศัยอยู่โดยเฉพาะคอมพิวเตอร์ที่เรียกว่า เซิร์ฟเวอร์ฐานข้อมูล DBMS ได้รับ SQL ร้องขอและให้ข้อมูลที่จำเป็น การโอน Middleware ข้อมูลจากฐานข้อมูลภายในองค์กรกลับไปที่เว็บเซิร์ฟเวอร์สำหรับการจัดส่งในรูปแบบของเว็บให้กับผู้ใช้
















แหล่งอ้างอิง
http://www.elfhs.ssru.ac.th/nutthapat_ke/file.php/1/GE/unit_6.pdf
https://en.wikipedia.org/wiki/Data_hierarchy
http://www.pongkorn.net/?article:194


ไม่มีความคิดเห็น:

แสดงความคิดเห็น

บทที่8

Decision Support System ระบบสนับสนุนการตัดสินใจ ระบบสนับสนุนการตัดสินใจ คือ ระบบที่ช่วยในการตัดสินใจเกี่ยวกับการจัดการ การรวบรวมข้อม...