บิ๊กดาต้า เทคโนโลยี ใช้ในการรวบรวมจัดการและสร้างข้อมูลเชิงลึก

บิ๊กดาต้า เทคโนโลยี ใช้ในการรวบรวมจัดการและสร้างข้อมูลเชิงลึก เมื่อข้อมูลมีปริมาณมากจึงต้องอาศัยระบบประมวลผลที่มีประสิทธิภาพ สามารถรองรับปริมาณข้อมูลที่มีอยู่อย่างมหาศาล เบื้องต้นการเก็บข้อมูลแบบ Big Data นี้ สามารถนำไปวิเคราะห์ข้อมูลในด้านต่างๆ เพื่อนำไปวางแผน และตัดสินใจ ในการดำเนินธุรกิจ หรือช่วยเพิ่มโอกาสในการทำธุรกิจให้ก้าวหน้ามากขึ้น

Big Data เกิดขึ้นได้อย่างไร?
Big Data เป็นคำศัพท์ใหม่ที่เพิ่งเริ่มใช้ในช่วงปี 1990 โดยมี John Mashey ผู้ที่ทำให้คำนี้เป็นที่รู้จักขึ้นมา ซึ่งปกติแล้ว Big Data จะเป็นข้อมูลที่มีปริมาณที่ใหญ่มากโดยที่ซอฟท์แวร์รุ่นเก่าไม่สามารถประมวลผลได้ หรือสามารถประมวลผลได้แต่ใช้เวลานาน โดย Big Data จะมีทั้งข้อมูลที่มีโครงสร้าง กึ่งมีโครงสร้าง และไม่มีโครงสร้าง ขนาดของ Big Data ก็จะมีการเพิ่มขนาดของข้อมูลขึ้นไปเรื่อยๆ จากปัจจุบันที่มีขนาดข้อมูลหลายพัน Terabytes ก็จะมีการเพิ่มขนาดเป็น Zettabytes

การทำงานของ Big Data ต้องอาศัยเทคนิคและเทคโนโลยีสมัยใหม่ที่สามารถรองรับข้อมูลที่มีขนาดใหญ่ ซับซ้อน และหลากหลายได้ โดยในปี 2018 ได้มีการนิยาม Big Data ใหม่ว่า “Big Data คือ เครื่องมือที่ใช้ในการจัดการกับข้อมูล”

ลักษณะสำคัญของ Big Data
Big Data จะต้องมีลักษณะสำคัญ 4V ดังต่อไปนี้ จึงจะเรียกได้ว่าเป็น Big Data

1. ปริมาณ (Volume)
คือ ปริมาณข้อมูลที่สามารถผลิตและจัดเก็บไว้ได้จะต้องขนาดที่ใหญ่มากเพียงพอ ซึ่งปริมาณของข้อมูลจะเป็นข้อบ่งบอกได้ถึงคุณภาพและประสิทธิภาพของข้อมูลภายในนั้น และสามารถนำไปพิจารณาต่อได้ว่าข้อมูลที่มีอยู่เหล่านั้น ถือเป็น Big Data หรือไม่

2. ความหลากหลาย (Variety)
คือ ความหลากหลายของประเภทของข้อมูล โดยสามารถเพิ่มประสิทธิภาพในการนำข้อมูลไปวิเคราะห์ต่อยอดได้ ไม่ว่าจะเป็นข้อมูลที่เป็นตัวหนังสือ, รูปภาพ, ข้อมูลเสียงที่ถูกบันทึกไว้, วีดีโอหรือไฟล์ประเภทอื่นจากหลากหลายแหล่งที่มา ก็สามารถเป็นส่วนหนึ่งในการเพิ่มประสิทธิภาพการทำงานของ Big Data ได้

ซึ่งจะเป็นข้อมูลจากทุกฝ่ายไม่ว่าจะเป็นการเงิน ฝ่ายขาย การตลาด ลูกค้าสัมพันธ์ บัญชี รวมถึงตัวหนังสือที่อาจเป็นบทสนทนาระหว่างแผนก หรือระหว่างบริษัท ซึ่งอาจเป็นข้อความจาก Social Media รวมถึง URLs ที่มีข้อมูลเข้ามาอยู่ในทุกวัน

3. ความเร็ว (Velocity)
คือ ความเร็วในการประมวลผลและผลิตข้อมูลขึ้นมาเพื่อให้ทันกับความต้องการของผู้ใช้งาน ซึ่ง Big Data คือข้อมูลที่ได้มาแบบ Real-Time และประมวลผลอยู่ตลอดเวลา แตกต่างจาก Small Data ที่ไม่สามารถทำได้

Big Data จะมีความถี่ในการประมวลผลที่มากกว่า การบันทึกข้อมูลที่มากกว่า และเผยแพร่ข้อมูลที่มากกว่า ข้อมูลของ Big Data ที่มีอัตราการเพิ่มขึ้นของข้อมูลที่มีการเพิ่มขึ้นได้อย่างรวดเร็ว โดยไม่ว่าจะเป็น

-ข้อมูลตัวอักษรการสนทนา
-ข้อมูลการบันทึกเสียง
-ข้อมูลการถ่ายภาพวีดีโอ
-ข้อมูลอัตราการสั่งซื้อสินค้า
-ข้อมูลโปรโมชั่นต่างๆ

ซึ่งหากมานั่งดูแล้วจะถือว่าเป็นข้อมูลที่มีอยู่มาก และมีการอัปเดทเคลื่อนไหวอยู่ตลอดเวลา

4. คุณภาพของข้อมูล (Veracity)
คือ คุณภาพของข้อมูลที่สามารถนำไปวิเคราะห์ข้อมูลต่อไปได้อีก เป็นข้อมูลที่ยังไม่ผ่านการประมวลผลอยู่ในรูปแบบของข้อมูลดิบซึ่งสามารถนำไปประมวลผลต่อไปได้ และเป็นข้อมูลที่มาจากหลากหลายแหล่งไม่ว่าจะเป็น Facebook, Youtube, Twitter ซึ่งข้อมูลจากแหล่งเหล่านี้ยากที่จะสามารถควบคุมคุณภาพรวมถึงการคัดกรองข้อมูล และความน่าเชื่อถือของข้อมูล จึงต้องนำข้อมูลเหล่านี้เข้าสู่กระบวนการทำ Data Cleansing

นอกจาก 4V ที่เป็นลักษณะสำคัญของ Big Data นี้แล้วก็ยังมีลักษณะข้ออื่นๆ ที่สามารถบ่งบอกได้ว่าเป็น Big Data เช่นเดียวกัน ได้แก่

Scalability คือ ขนาดของข้อมูลทั้งหมดที่มีที่ต้องสามารถขยายขนาดได้อย่างรวดเร็ว
Relational คือ ความเกี่ยวข้องกันของข้อมูล ข้อมูลที่มีความเกี่ยวข้องกันอยู่จะสามารถทำให้การประมวลผลสามารถทำได้ดีมากยิ่งขึ้น