30 Soalan Temuduga Hbase Teratas & Jawapan

Anonim

Muat turun PDF

Berikut adalah soalan yang sering diajukan dalam wawancara untuk penyegar baru dan juga pembangun HBase yang berpengalaman.

1) Terangkan apa itu Hbase?

Hbase adalah sistem pengurusan pangkalan data berorientasikan lajur yang berjalan di atas HDFS (Hadoop Distribut File System). Hbase bukan kedai data hubungan, dan tidak menyokong bahasa pertanyaan berstruktur seperti SQL.

Di Hbase, node induk mengatur pelayan kluster dan rantau untuk menyimpan bahagian jadual dan mengoperasikan data.

2) Terangkan mengapa menggunakan Hbase?

  • Sistem penyimpanan berkapasiti tinggi
  • Reka bentuk diedarkan untuk memenuhi meja besar
  • Kedai Berorientasikan Tiang
  • Berskala Melintang
  • Prestasi & Ketersediaan yang tinggi
  • Matlamat asas Hbase adalah berjuta-juta lajur, ribuan versi dan berbilion baris
  • Tidak seperti HDFS (Hadoop Distribut File System), ia menyokong operasi CRUD masa nyata secara rawak

3) Sebutkan apakah komponen utama Hbase?

  • Zookeeper: Ia melakukan penyelarasan antara klien dan Hbase Maser
  • Hbase Master: Hbase Master memantau Region Server
  • RegionServer: RegionServer memantau Wilayah
  • Wilayah: Ini berisi di penyimpanan data memori (MemStore) dan Hfile.
  • Jadual Katalog: Jadual katalog terdiri daripada ROOT dan META

4) Terangkan apa yang terdiri daripada Hbase?

  • Hbase terdiri daripada satu set jadual
  • Dan setiap jadual mengandungi baris dan lajur seperti pangkalan data tradisional
  • Setiap jadual mesti mengandungi elemen yang ditentukan sebagai Kunci Utama
  • Lajur Hbase menunjukkan atribut objek

5) Sebutkan berapa banyak arahan operasi di Hbase?

Perintah operasi dalam Hbases adalah kira-kira lima jenis

  • Dapatkan
  • Letak
  • Padam
  • Imbas
  • Kenaikan

6) Terangkan apa itu WAL dan Hlog di Hbase?

WAL (Write Ahead Log) serupa dengan log MySQL BIN; ia mencatat semua perubahan berlaku dalam data. Ini adalah fail urutan standard oleh Hadoop dan menyimpan HLogkey's. Kekunci ini terdiri daripada nombor berurutan dan juga data sebenar dan digunakan untuk memainkan semula data yang belum berterusan setelah pelanggaran crash server. Jadi, secara tunai kegagalan pelayan WAL berfungsi sebagai talian hayat dan mengambil data yang hilang.

7) Bilakah anda harus menggunakan Hbase?

  • Saiz data sangat besar: Apabila anda mempunyai banyak dan berjuta-juta rekod untuk beroperasi
  • Reka Bentuk Lengkap: Semasa anda memindahkan RDBMS ke Hbase, anda menganggapnya sebagai reka bentuk semula yang lengkap dan hanya sekadar menukar port
  • Perintah SQL-Less: Anda mempunyai beberapa ciri seperti transaksi; gabungan dalaman, lajur yang ditaip, dll.
  • Pelaburan Infrastruktur: Anda perlu mempunyai kelompok yang cukup agar Hbase benar-benar berguna

8) Di Hbase apa itu keluarga lajur?

Keluarga kolum merangkumi unit asas penyimpanan fizikal di Hbase yang mempunyai ciri seperti pemampatan.

9) Terangkan apa itu kekunci baris?

Kekunci baris ditentukan oleh aplikasi. Oleh kerana kekunci gabungan telah ditentukan sebelumnya oleh tombol baris, ini membolehkan aplikasi menentukan urutan urutan yang diinginkan. Ia juga membolehkan pengelompokan sel secara logik dan memastikan bahawa semua sel dengankeykey yang sama terletak bersama pada pelayan yang sama.

10) Terangkan penghapusan dalam Hbase? Sebutkan apakah tiga jenis penanda batu nisan di Hbase?

Apabila anda memadamkan sel di Hbase, data sebenarnya tidak dihapus tetapi penanda batu nisan ditetapkan, menjadikan sel yang dihapus tidak kelihatan. Hbase yang dipadam sebenarnya dikeluarkan semasa pemadatan.

Terdapat tiga jenis penanda batu nisan:

  • Penanda penghapusan versi: Untuk penghapusan, ia menandakan versi lajur tunggal
  • Penanda hapus lajur: Untuk penghapusan, ia menandakan semua versi lajur
  • Penanda hapus keluarga: Untuk penghapusan, ia menandakan semua lajur untuk keluarga lajur

11) Terangkan bagaimana Hbase benar-benar menghapus baris?

Di Hbase, apa sahaja yang anda tulis akan disimpan dari RAM ke cakera, penulisan cakera ini adalah pemadatan larangan yang tidak berubah. Semasa proses penghapusan di Hbase, proses pemadatan utama menghapus penanda sementara pemadatan kecil tidak. Dalam penghapusan normal, ia menghasilkan penanda batu nisan yang dihapus - data penghapusan yang mereka wakili akan dikeluarkan semasa pemadatan.

Juga, jika anda memadam data dan menambahkan lebih banyak data, tetapi dengan cap waktu lebih awal daripada cap waktu batu nisan, Mendapat lebih lanjut mungkin disamarkan oleh penanda hapus / batu nisan dan oleh itu anda tidak akan menerima nilai yang dimasukkan sehingga selepas pemadatan utama.

12) Terangkan apa yang berlaku jika anda mengubah ukuran blok keluarga lajur pada pangkalan data yang sudah dihuni?

Apabila anda mengubah ukuran blok keluarga lajur, data baru menempati ukuran blok baru sementara data lama tetap dalam ukuran blok lama. Semasa pemadatan data, data lama akan mengambil ukuran blok baru. Fail baru kerana ia dibuang, mempunyai ukuran blok baru sedangkan data yang ada akan terus dibaca dengan betul. Semua data harus diubah ke ukuran blok baru, setelah pemadatan utama berikutnya.

13) Sebutkan perbezaan antara Pangkalan Data Hbase dan Relasional?

Hbase Pangkalan Data Perhubungan
  • Ia tidak mempunyai skema
  • Ia adalah kedai data berorientasikan lajur
  • Ia digunakan untuk menyimpan data yang tidak dinormalisasi
  • Ia mengandungi jadual yang jarang dihuni
  • Pembahagian automatik dilakukan di Hbase
  • Ia adalah pangkalan data berasaskan skema
  • Ia adalah kedai data berorientasikan baris
  • Ia digunakan untuk menyimpan data yang dinormalisasi
  • Ia mengandungi meja nipis
  • Tidak ada peruntukan atau sokongan terbina dalam untuk pembahagian

14) Apakah kelas HBaseFsck?

Terdapat nama alat yang dipanggil kembali tersedia di HBase, yang dilaksanakan oleh kelas HBaseFsck. Ia menawarkan beberapa suis baris perintah yang mempengaruhi kelakuannya.

15) Apakah struktur utama HBase?

Kekunci baris dan kekunci Lajur adalah dua struktur kunci terpenting yang digunakan dalam HBase

16) Bincangkan bagaimana anda boleh menggunakan penapis di Apache HBase

Penapis Dalam Shell HBase. Ini diperkenalkan di Apache HBase 0.92 yang membantu anda melakukan penyaringan sisi pelayan untuk mengakses HBase melalui shell HBase atau barang bekas.

17) Struktur sintaks sokongan HBase seperti SQL ya atau Tidak?

Tidak, sayangnya, sokongan SQL untuk HBase tidak tersedia buat masa ini. Namun, dengan menggunakan Apache Phoenix, kita dapat mengambil data dari HBase melalui pertanyaan SQL.

18) Apakah maksud pemadatan dalam HBase?

Pada saat penulisan masuk yang berat, mustahil untuk mencapai prestasi yang optimum dengan memiliki satu fail per kedai. HBase membantu anda menggabungkan semua HFiles ini untuk mengurangkan bilangan biji cakera untuk setiap bacaan. Proses ini dikenali sebagai Pemadatan dalam HBase.

19) Bagaimana anda akan melaksanakan gabungan di HBase?

HBase, tidak menyokong penyertaan secara langsung tetapi menggunakan pekerjaan MapReduce, pertanyaan bergabung boleh dilaksanakan dengan mengambil data dengan bantuan jadual HBase yang berbeza.

20) Terangkan JMX mengenai HBSE

Java Management Extensions atau JMX adalah status eksport aplikasi Java adalah standard untuknya.

21) Apakah kegunaan MasterServer?

Master break membantu anda untuk menetapkan wilayah ke pelayan wilayah juga. Ia juga membantu anda menangani pengimbangan beban yang kami gunakan MasterServer.

22) Tentukan Istilah Berjimat Cermat

Apache Thrift ditulis dalam C ++. Ia menyediakan penyusun skema untuk pelbagai bahasa pengaturcaraan seperti C ++, Perl, PHP, Python, Ruby, dan banyak lagi.

23) Mengapa menggunakan kelas HColumnDescriptor?

Perincian mengenai keluarga lajur seperti tetapan mampatan, Bilangan versi, disimpan. Di HColumnDescriptor.

24) Apakah sel dalam HBase?

Sel dalam HBase adalah unit terkecil dari jadual Hbase. Ini membantu anda menyimpan sekeping data dalam bentuk tuple {baris, lajur, versi}

25) Apakah itu penapis Bloom?

HBase menyokong Bloom Filter membantu anda meningkatkan keseluruhan hasil kluster. Penapis Bloom HBase adalah mekanisme cekap ruang untuk menguji sama ada HFile merangkumi sel baris atau baris kol.

26) Beritahu saya mengenai jenis Operasi HBase?

Jawapan Dua jenis Operasi HBase adalah:

  • Baca Operasi
  • Tulis Operasi

27) Apakah penggunaan HBase HMaster?

Tanggungjawab utama tuan adalah:

  1. Menyelaraskan pelayan wilayah
  2. Fungsi pentadbir

28) Teknik mana yang boleh anda gunakan di HBase untuk mengakses HFile secara langsung tanpa bantuan HBase?

Untuk mengakses HFile secara langsung tanpa menggunakan HBase, kami menggunakan kaedah HFile.main ().

29) Bolehkah pelayan wilayah berada di semua DataNodes?

Ya, Pelayan Wilayah berjalan pada pelayan yang sama dengan DataNodes

30) Namakan penapis yang menerima ukuran halaman sebagai parameter di HBase

Penapis bernama PageFilter menerima ukuran halaman sebagai parameter.

Dokumen ini telah disusun dengan alat penukar HTML segera.