Testing untuk volume/isi data pada server
Big Data mengacu pada volume data yang besar, yang tidak
dapat diproses menggunakan basis data tradisional. Ketika kami memiliki jumlah
data yang wajar kami biasanya menggunakan database relasional tradisional
seperti Oracle, MySQL, SQL Server untuk menyimpan dan bekerja dengan data.
Namun ketika kami memiliki volume data yang besar maka database tradisional
tidak akan dapat menangani data.
Big Data Volume
Database tradisional baik dalam bekerja dengan data
terstruktur yang dapat disimpan dalam baris dan kolom. Namun, jika kita
memiliki data tidak terstruktur yang tidak mengikuti struktur maka menggunakan
database relasional bukan merupakan pilihan yang tepat.Dalam hal Big data, kami
memiliki data dalam jumlah besar yang bisa dalam format apa pun seperti gambar,
file datar, audio, dll. Yang struktur dan formatnya mungkin tidak sama untuk
setiap record.Test Ukuran data besar,
volume data yang dibuat dari waktu ke waktu, mungkin jauh lebih besar
dibandingkan dengan basis data tradisional. Ini akan sulit ditangani dengan
basis data tradisional.
Data besar dicirikan oleh 3 V - Volume, Kecepatan, dan
Varietas
v Volume: Volume data yang dikumpulkan adalah organisasi
besar dan berasal dari sumber yang berbeda seperti sensor, pembacaan meter,
transaksi bisnis dll
v Kecepatan: Data dibuat dengan kecepatan tinggi dan harus
ditangani dan diproses dengan cepat. Instrumen seperti perangkat IOT, tag RFID,
Smart meter dan lainnya mengarah pada pembuatan data otomatis dengan kecepatan
yang belum pernah terjadi sebelumnya
v Ragam: Data tersedia dalam semua format. Dapat berupa
audio, video, numerik, teks, email, gambar satelit, sensor atmosfer dll
Contoh Dan
Penggunaan Data Besar
Menyimpan data tanpa menganalisanya untuk mendapatkan
wawasan yang bermakna dari data akan menjadi pemborosan sumber daya. Sebelum
kita melihat pengujian data besar, akan berguna untuk memahami bagaimana
penggunaannya di dunia nyata.
Media sosial
Situs media sosial menghasilkan data dalam jumlah besar
dalam bentuk gambar, video, suka, posting, komentar, dll. Tidak hanya data yang
tersimpan di platform data besar, mereka juga diproses dan dianalisis untuk
menawarkan rekomendasi pada konten yang mungkin Anda sukai.
Ada 310 juta pengguna aktif bulanan di Twitter
Sebanyak 1,3 miliar akun telah dibuat di Twitter
Setiap hari 500 juta tweet dikirim oleh pengguna yaitu
sekitar 6000 tweet per detik
Lebih dari 618.725 tweet dikirim dalam satu menit selama
final Piala Dunia FIFA pada tahun 2014
Facebook
Ada 1,9 miliar pengguna aktif bulanan di Facebook
Lebih dari 1,28 miliar pengguna masuk ke Facebook setiap
hari
350 juta foto diunggah setiap hari
510.000 komentar dan 293.000 status diperbarui setiap
menit
4 petabyte data baru dihasilkan setiap hari
Video sehari-hari menghasilkan 8 miliar penayangan
Instagram
700 juta orang menggunakan Instagram setiap bulan
40 miliar foto telah dibagikan di Instagram
Pengguna menyukai 4,2 miliar gambar setiap hari
95 juta foto diunggah setiap hari
Ini adalah kasus penggunaan data besar karena, ada jutaan
situs web yang beriklan di Facebook dan ada miliaran pengguna. Menyimpan dan memproses informasi ini untuk menampilkan
iklan yang tepat kepada pengguna yang tepat tidak dapat diselesaikan oleh basis
data tradisional dalam jumlah waktu yang sama.
Format data dalam Big Data
Satu pertanyaan umum yang ditanyakan orang adalah -
mengapa kita tidak dapat menggunakan basis data relasional tradisional untuk
data besar. Untuk menjawab ini, pertama kita perlu memahami format data yang
berbeda dalam data besar.
Format data dalam big data dapat diklasifikasikan menjadi
tiga kategori. Mereka:
1. Data Terstruktur
2. Data Semi Terstruktur
3.
Data tidak
terstruktur
Format Big Data
Tidak ada komentar:
Posting Komentar