Böyük verilənlərdə Impala nədir?
Böyük verilənlərdə Impala nədir?

Video: Böyük verilənlərdə Impala nədir?

Video: Böyük verilənlərdə Impala nədir?
Video: #ReqemliOL - Böyük verilənlər bazası nədir? 2024, Bilər
Anonim

İmpala Apache Hadoop kimi çoxluqlu sistemlər üzərində açıq mənbəli kütləvi paralel emal sorğu mühərrikidir. O, Google-un Dremel kağızı əsasında yaradılmışdır. Hadoop Paylanmış Fayl Sisteminin (HDFS) üstündə işləyən sorğu mühərriki kimi interaktiv SQL-dir. İmpala HDFS-dən əsas yaddaş kimi istifadə edir.

Bununla əlaqədar olaraq, Impala və pətək nədir?

Apache Arı şanı SQL-in-Hadoop üçün effektiv standartdır. İmpala Google Dremel-dən sonra hazırlanmış açıq mənbəli SQL sorğu mühərrikidir. Cloudera İmpala HBase və HDFS-də saxlanılan məlumatların emalı üçün SQL mühərrikidir. İmpala istifadə edir Arı şanı megastore və sorğu edə bilərsiniz Arı şanı birbaşa masalar.

Bundan əlavə, hansı daha yaxşıdır pətək və ya Impala? Apache Arı şanı interaktiv hesablamalar üçün ideal olmaya bilər İmpala interaktiv hesablamalar üçün nəzərdə tutulub. Arı şanı toplu əsaslı Hadoop MapReduce isə İmpala edir daha çox MPP verilənlər bazası kimi. Arı şanı mürəkkəb növləri dəstəkləyir, lakin İmpala etmir. Apache Arı şanı səhvlərə dözümlüdür, halbuki İmpala xətaya dözümlülüyünü dəstəkləmir.

Həmçinin soruşdular ki, biz niyə Impala istifadə edirik?

İmpala yaddaşdaxili məlumatların işlənməsini dəstəkləyir, yəni verilənlərə daxil olur/analiz edir edir məlumat hərəkəti olmadan Hadoop məlumat qovşaqlarında saxlanılır. Bacararsan məlumatlara giriş Impala istifadə edərək SQL kimi sorğular. İmpala digər SQL mühərrikləri ilə müqayisədə HDFS-də məlumatlara daha sürətli çıxış təmin edir.

Böyük verilənlərdə pətək nədir?

Apache Arı şanı a data üçün anbar sistemi data ümumiləşdirmə və təhlil və böyük sorğu üçün data açıq mənbəli Hadoop platformasındakı sistemlər. O, çox böyük həcmli sənədlərin asan icrası və işlənməsi üçün SQL-ə bənzər sorğuları MapReduce işlərinə çevirir. data.

Tövsiyə: