Apa itu DATA BESAR? Pengenalan, Jenis, Karakteristik, Contoh

Isi kandungan:

Anonim

Sebelum kita memperkenalkan pengenalan kepada Big Data, anda harus terlebih dahulu mengetahui

Apa itu Data?

Kuantiti, watak, atau simbol di mana operasi dilakukan oleh komputer, yang mungkin disimpan dan dihantar dalam bentuk isyarat elektrik dan direkodkan pada media rakaman magnetik, optik, atau mekanikal.

Sekarang, mari kita pelajari pengenalan Big Data

Apa itu Big Data?

Big Data adalah kumpulan data yang jumlahnya besar, namun berkembang dengan cepat mengikut masa. Ini adalah data dengan ukuran dan kerumitan yang begitu besar sehingga tidak ada alat pengurusan data tradisional yang dapat menyimpannya atau memprosesnya dengan cekap. Data besar juga merupakan data tetapi dengan ukuran yang besar.

Dalam tutorial ini, anda akan belajar,

  • Apa itu Data?
  • Apa itu Big Data?
  • Contoh Data Besar
  • Jenis Data Besar
  • Ciri-ciri Data Besar
  • Kelebihan Pemprosesan Data Besar

Contoh Data Besar

Berikut adalah beberapa contoh Big Data-

The Bursa Saham New York menjana kira-kira satu terabyte data perdagangan baru setiap hari.

Media Sosial

Statistik menunjukkan bahawa 500 + terabyte data baru diserap ke dalam pangkalan data laman sosial Facebook , setiap hari. Data ini dihasilkan terutamanya dari segi muat naik foto dan video, pertukaran mesej, memberi komen dll.

Enjin Jet tunggal dapat menghasilkan 10 + terabyte data dalam 30 minit waktu penerbangan. Dengan ribuan penerbangan setiap hari, penjanaan data mencapai banyak Petabyte.

Jenis Data Besar

Berikut adalah jenis Data Besar:

  1. Berstruktur
  2. Tidak berstruktur
  3. Separa berstruktur

Berstruktur

Segala data yang dapat disimpan, diakses dan diproses dalam bentuk format tetap disebut sebagai data 'terstruktur'. Selama jangka masa, bakat dalam sains komputer telah mencapai kejayaan yang lebih besar dalam mengembangkan teknik untuk bekerja dengan data semacam itu (di mana formatnya terkenal sebelumnya) dan juga memperoleh nilai darinya. Namun, pada masa ini, kami meramalkan masalah ketika ukuran data tersebut berkembang secara besar-besaran, ukuran tipikal sedang marah banyak zettabyte.

Adakah awak tahu? 10 21 bait sama dengan 1 zettabyte atau satu bilion terabyte membentuk zettabyte .

Melihat angka-angka ini, seseorang dapat dengan mudah memahami mengapa nama Big Data diberikan dan membayangkan cabaran yang terlibat dalam penyimpanan dan pemprosesannya.

Adakah awak tahu? Data yang disimpan dalam sistem pengurusan pangkalan data relasional adalah salah satu contoh data yang 'tersusun' .

Contoh Data Berstruktur

Jadual 'Pekerja' dalam pangkalan data adalah contoh Data Berstruktur

ID pekerja Nama Pekerja Jantina Jabatan Gaji_In_lacs
2365 Rajesh Kulkarni Lelaki Kewangan 650000
3398 Pratibha Joshi Perempuan Pentadbir 650000
7465 Shushil Roy Lelaki Pentadbir 500000
7500 Shubhojit Das Lelaki Kewangan 500000
7699 Priya Sane Perempuan Kewangan 550000

Tidak berstruktur

Segala data dengan bentuk yang tidak diketahui atau struktur diklasifikasikan sebagai data tidak berstruktur. Selain ukurannya yang besar, data yang tidak tersusun menimbulkan banyak cabaran dari segi pemprosesannya untuk memperoleh nilai darinya. Contoh khas data tidak berstruktur adalah sumber data yang heterogen yang mengandungi gabungan fail teks, gambar, video dan lain-lain. Kini organisasi hari ini mempunyai banyak data yang tersedia tetapi sayangnya, mereka tidak tahu bagaimana memperoleh nilai daripadanya sejak data ini dalam bentuk mentah atau format tidak berstruktur.

Contoh Data Tidak Berstruktur

Hasilnya dikembalikan oleh 'Carian Google'

Separa berstruktur

Data separa berstruktur boleh mengandungi kedua-dua bentuk data. Kita dapat melihat data separa berstruktur sebagai bentuk terstruktur tetapi sebenarnya tidak didefinisikan dengan contoh definisi jadual dalam DBMS hubungan. Contoh data separa berstruktur adalah data yang ditunjukkan dalam fail XML.

Contoh Data Separa Berstruktur

Data peribadi disimpan dalam fail XML-

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Pertumbuhan Data selama ini

Harap maklum bahawa data aplikasi web, yang tidak tersusun, terdiri daripada fail log, fail sejarah transaksi dan lain-lain. Sistem OLTP dibina untuk berfungsi dengan data berstruktur di mana data disimpan dalam hubungan (jadual).

Ciri-ciri Data Besar

Data besar dapat dijelaskan dengan ciri-ciri berikut:

  • Isipadu
  • Kepelbagaian
  • Halaju
  • Pemboleh ubah

(i) Volume - Nama Big Data itu sendiri berkaitan dengan ukuran yang sangat besar. Ukuran data memainkan peranan yang sangat penting dalam menentukan nilai daripada data. Juga, sama ada data tertentu benar-benar dapat dianggap sebagai Data Besar atau tidak, bergantung pada jumlah data. Oleh itu, 'Volume' adalah satu ciri yang perlu dipertimbangkan semasa berurusan dengan Big Data.

(ii) Varieti - Aspek Big Data seterusnya adalah kepelbagaiannya .

Varieti merujuk kepada sumber yang heterogen dan sifat data, baik yang tersusun dan tidak terstruktur. Pada hari-hari sebelumnya, spreadsheet dan pangkalan data adalah satu-satunya sumber data yang dipertimbangkan oleh kebanyakan aplikasi. Pada masa ini, data dalam bentuk e-mel, foto, video, alat pemantauan, PDF, audio, dan lain-lain juga dipertimbangkan dalam aplikasi analisis. Pelbagai data tidak berstruktur ini menimbulkan masalah tertentu untuk penyimpanan, perlombongan dan menganalisis data.

(iii) Kecepatan - Istilah 'halaju' merujuk kepada kepantasan penjanaan data. Seberapa cepat data dihasilkan dan diproses untuk memenuhi permintaan, menentukan potensi sebenar dalam data.

Big Data Velocity berkaitan dengan kelajuan aliran data dari sumber seperti proses perniagaan, log aplikasi, rangkaian, dan laman media sosial, sensor, Peranti mudah alih, dll. Aliran data sangat besar dan berterusan.

(iv) Pemboleh ubah - Ini merujuk kepada ketidakkonsistenan yang dapat ditunjukkan oleh data pada masa-masa, sehingga mengganggu proses untuk dapat mengendalikan dan mengurus data dengan berkesan.

Faedah Pemprosesan Data Besar

Keupayaan memproses Big Data membawa pelbagai faedah, seperti-

    • Perniagaan boleh menggunakan kecerdasan luar semasa mengambil keputusan

Akses ke data sosial dari mesin pencari dan laman web seperti facebook, twitter memungkinkan organisasi mengatur strategi perniagaan mereka.

    • Perkhidmatan pelanggan bertambah baik

Sistem maklum balas pelanggan tradisional digantikan dengan sistem baru yang dirancang dengan teknologi Big Data. Dalam sistem baru ini, Big Data dan teknologi pemprosesan bahasa semula jadi digunakan untuk membaca dan menilai tindak balas pengguna.

    • Pengenalpastian awal risiko terhadap produk / perkhidmatan, jika ada
    • Kecekapan operasi yang lebih baik

Teknologi Big Data dapat digunakan untuk membuat area pementasan atau zona pendaratan untuk data baru sebelum mengenal pasti data apa yang harus dipindahkan ke gudang data. Selain itu, penyatuan teknologi Big Data dan gudang data seperti itu membantu organisasi untuk memuatkan data yang jarang diakses.

Ringkasan

  • Definisi Big Data: Big Data didefinisikan sebagai data yang berukuran besar. Bigdata adalah istilah yang digunakan untuk menggambarkan kumpulan data yang berukuran besar dan berkembang pesat seiring berjalannya waktu.
  • Contoh analisis Big Data merangkumi bursa saham, laman media sosial, enjin jet, dll.
  • Data Besar mungkin 1) Terstruktur, 2) Tidak Berstruktur, 3) Separuh struktur
  • Volume, Variety, Velocity, and Variability adalah beberapa ciri Big Data
  • Perkhidmatan pelanggan yang lebih baik, kecekapan operasi yang lebih baik, Pengambilan Keputusan yang Lebih Baik adalah beberapa kelebihan Bigdata