Sebelum kita memperkenalkan pengenalan kepada Big Data, anda harus terlebih dahulu mengetahui
Apa itu Data?
Kuantiti, watak, atau simbol di mana operasi dilakukan oleh komputer, yang mungkin disimpan dan dihantar dalam bentuk isyarat elektrik dan direkodkan pada media rakaman magnetik, optik, atau mekanikal.
Sekarang, mari kita pelajari pengenalan Big Data
Apa itu Big Data?
Big Data adalah kumpulan data yang jumlahnya besar, namun berkembang dengan cepat mengikut masa. Ini adalah data dengan ukuran dan kerumitan yang begitu besar sehingga tidak ada alat pengurusan data tradisional yang dapat menyimpannya atau memprosesnya dengan cekap. Data besar juga merupakan data tetapi dengan ukuran yang besar.
Dalam tutorial ini, anda akan belajar,
- Apa itu Data?
- Apa itu Big Data?
- Contoh Data Besar
- Jenis Data Besar
- Ciri-ciri Data Besar
- Kelebihan Pemprosesan Data Besar
Contoh Data Besar
Berikut adalah beberapa contoh Big Data-
The Bursa Saham New York menjana kira-kira satu terabyte data perdagangan baru setiap hari.
Media Sosial
Statistik menunjukkan bahawa 500 + terabyte data baru diserap ke dalam pangkalan data laman sosial Facebook , setiap hari. Data ini dihasilkan terutamanya dari segi muat naik foto dan video, pertukaran mesej, memberi komen dll.
Enjin Jet tunggal dapat menghasilkan 10 + terabyte data dalam 30 minit waktu penerbangan. Dengan ribuan penerbangan setiap hari, penjanaan data mencapai banyak Petabyte.
Jenis Data Besar
Berikut adalah jenis Data Besar:
- Berstruktur
- Tidak berstruktur
- Separa berstruktur
Berstruktur
Segala data yang dapat disimpan, diakses dan diproses dalam bentuk format tetap disebut sebagai data 'terstruktur'. Selama jangka masa, bakat dalam sains komputer telah mencapai kejayaan yang lebih besar dalam mengembangkan teknik untuk bekerja dengan data semacam itu (di mana formatnya terkenal sebelumnya) dan juga memperoleh nilai darinya. Namun, pada masa ini, kami meramalkan masalah ketika ukuran data tersebut berkembang secara besar-besaran, ukuran tipikal sedang marah banyak zettabyte.
Adakah awak tahu? 10 21 bait sama dengan 1 zettabyte atau satu bilion terabyte membentuk zettabyte .
Melihat angka-angka ini, seseorang dapat dengan mudah memahami mengapa nama Big Data diberikan dan membayangkan cabaran yang terlibat dalam penyimpanan dan pemprosesannya.
Adakah awak tahu? Data yang disimpan dalam sistem pengurusan pangkalan data relasional adalah salah satu contoh data yang 'tersusun' .
Contoh Data Berstruktur
Jadual 'Pekerja' dalam pangkalan data adalah contoh Data Berstruktur
ID pekerja | Nama Pekerja | Jantina | Jabatan | Gaji_In_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Lelaki | Kewangan | 650000 |
3398 | Pratibha Joshi | Perempuan | Pentadbir | 650000 |
7465 | Shushil Roy | Lelaki | Pentadbir | 500000 |
7500 | Shubhojit Das | Lelaki | Kewangan | 500000 |
7699 | Priya Sane | Perempuan | Kewangan | 550000 |
Tidak berstruktur
Segala data dengan bentuk yang tidak diketahui atau struktur diklasifikasikan sebagai data tidak berstruktur. Selain ukurannya yang besar, data yang tidak tersusun menimbulkan banyak cabaran dari segi pemprosesannya untuk memperoleh nilai darinya. Contoh khas data tidak berstruktur adalah sumber data yang heterogen yang mengandungi gabungan fail teks, gambar, video dan lain-lain. Kini organisasi hari ini mempunyai banyak data yang tersedia tetapi sayangnya, mereka tidak tahu bagaimana memperoleh nilai daripadanya sejak data ini dalam bentuk mentah atau format tidak berstruktur.
Contoh Data Tidak Berstruktur
Hasilnya dikembalikan oleh 'Carian Google'
Separa berstruktur
Data separa berstruktur boleh mengandungi kedua-dua bentuk data. Kita dapat melihat data separa berstruktur sebagai bentuk terstruktur tetapi sebenarnya tidak didefinisikan dengan contoh definisi jadual dalam DBMS hubungan. Contoh data separa berstruktur adalah data yang ditunjukkan dalam fail XML.
Contoh Data Separa Berstruktur
Data peribadi disimpan dalam fail XML-
Prashant Rao Male 35 Seema R. Female 41 Satish Mane Male 29 Subrato Roy Male 26 Jeremiah J. Male 35
Pertumbuhan Data selama ini
Harap maklum bahawa data aplikasi web, yang tidak tersusun, terdiri daripada fail log, fail sejarah transaksi dan lain-lain. Sistem OLTP dibina untuk berfungsi dengan data berstruktur di mana data disimpan dalam hubungan (jadual).
Ciri-ciri Data Besar
Data besar dapat dijelaskan dengan ciri-ciri berikut:
- Isipadu
- Kepelbagaian
- Halaju
- Pemboleh ubah
(i) Volume - Nama Big Data itu sendiri berkaitan dengan ukuran yang sangat besar. Ukuran data memainkan peranan yang sangat penting dalam menentukan nilai daripada data. Juga, sama ada data tertentu benar-benar dapat dianggap sebagai Data Besar atau tidak, bergantung pada jumlah data. Oleh itu, 'Volume' adalah satu ciri yang perlu dipertimbangkan semasa berurusan dengan Big Data.
(ii) Varieti - Aspek Big Data seterusnya adalah kepelbagaiannya .
Varieti merujuk kepada sumber yang heterogen dan sifat data, baik yang tersusun dan tidak terstruktur. Pada hari-hari sebelumnya, spreadsheet dan pangkalan data adalah satu-satunya sumber data yang dipertimbangkan oleh kebanyakan aplikasi. Pada masa ini, data dalam bentuk e-mel, foto, video, alat pemantauan, PDF, audio, dan lain-lain juga dipertimbangkan dalam aplikasi analisis. Pelbagai data tidak berstruktur ini menimbulkan masalah tertentu untuk penyimpanan, perlombongan dan menganalisis data.
(iii) Kecepatan - Istilah 'halaju' merujuk kepada kepantasan penjanaan data. Seberapa cepat data dihasilkan dan diproses untuk memenuhi permintaan, menentukan potensi sebenar dalam data.
Big Data Velocity berkaitan dengan kelajuan aliran data dari sumber seperti proses perniagaan, log aplikasi, rangkaian, dan laman media sosial, sensor, Peranti mudah alih, dll. Aliran data sangat besar dan berterusan.
(iv) Pemboleh ubah - Ini merujuk kepada ketidakkonsistenan yang dapat ditunjukkan oleh data pada masa-masa, sehingga mengganggu proses untuk dapat mengendalikan dan mengurus data dengan berkesan.
Faedah Pemprosesan Data Besar
Keupayaan memproses Big Data membawa pelbagai faedah, seperti-
- Perniagaan boleh menggunakan kecerdasan luar semasa mengambil keputusan
Akses ke data sosial dari mesin pencari dan laman web seperti facebook, twitter memungkinkan organisasi mengatur strategi perniagaan mereka.
- Perkhidmatan pelanggan bertambah baik
Sistem maklum balas pelanggan tradisional digantikan dengan sistem baru yang dirancang dengan teknologi Big Data. Dalam sistem baru ini, Big Data dan teknologi pemprosesan bahasa semula jadi digunakan untuk membaca dan menilai tindak balas pengguna.
- Pengenalpastian awal risiko terhadap produk / perkhidmatan, jika ada
- Kecekapan operasi yang lebih baik
Teknologi Big Data dapat digunakan untuk membuat area pementasan atau zona pendaratan untuk data baru sebelum mengenal pasti data apa yang harus dipindahkan ke gudang data. Selain itu, penyatuan teknologi Big Data dan gudang data seperti itu membantu organisasi untuk memuatkan data yang jarang diakses.
Ringkasan
- Definisi Big Data: Big Data didefinisikan sebagai data yang berukuran besar. Bigdata adalah istilah yang digunakan untuk menggambarkan kumpulan data yang berukuran besar dan berkembang pesat seiring berjalannya waktu.
- Contoh analisis Big Data merangkumi bursa saham, laman media sosial, enjin jet, dll.
- Data Besar mungkin 1) Terstruktur, 2) Tidak Berstruktur, 3) Separuh struktur
- Volume, Variety, Velocity, and Variability adalah beberapa ciri Big Data
- Perkhidmatan pelanggan yang lebih baik, kecekapan operasi yang lebih baik, Pengambilan Keputusan yang Lebih Baik adalah beberapa kelebihan Bigdata