Parket məlumat formatı nədir?
Parket məlumat formatı nədir?

Video: Parket məlumat formatı nədir?

Video: Parket məlumat formatı nədir?
Video: Parket ustası (±994705804858) 2024, Noyabr
Anonim

Apache Parket pulsuz və açıq mənbəli sütun yönümlüdür data saxlama format Apache Hadoop ekosisteminin. Əksəriyyəti ilə uyğun gəlir data Hadoop mühitində çərçivələrin işlənməsi. Effektivliyi təmin edir data kompleks idarə etmək üçün təkmilləşdirilmiş performansa malik sıxılma və kodlaşdırma sxemləri data toplu olaraq.

Sadəcə olaraq, parket fayl formatı nədir?

Parket , açıq mənbə fayl formatı Hadoop üçün. Parket iç-içə məlumat strukturlarını düz sütun şəklində saxlayır format . Məlumatların sıra yönümlü yanaşmada saxlandığı ənənəvi yanaşma ilə müqayisədə, parket saxlama və performans baxımından daha səmərəlidir.

Bundan əlavə, parket nə üçün istifadə olunur? Parket Hadoop ekosistemindəki istənilən layihə üçün açıq mənbəli fayl formatıdır. Apache Parket CSV və ya TSV faylları kimi sıra əsaslı fayllarla müqayisədə məlumatların səmərəli, eləcə də performanslı düz sütunlu saxlama formatı üçün nəzərdə tutulmuşdur.

Bundan əlavə, parket formatı məlumatları necə saxlayır?

DATA BLOK Hər blokda parket fayldır saxlanılır sıra qrupları şəklində. Belə ki, data bir parket fayl çoxlu sıra qruplarına bölünür. Bu sıra qrupları, öz növbəsində, sütundakı bir sütuna uyğun gələn bir və ya bir neçə sütun parçasından ibarətdir data təyin edin. The data səhifələr şəklində yazılmış hər bir sütun parçası üçün.

Parket insanlar tərəfindən oxuna bilərmi?

ORC, Parket və Avro da maşındır- oxunaqlı ikili formatlar, yəni fayllar mənasız görünür insanlar . Əgər ehtiyacın varsa insan - oxunaqlı JSON və ya XML kimi formatda istifadə etsəniz, yəqin ki, ilk növbədə Hadoop-dan niyə istifadə etdiyinizi yenidən nəzərdən keçirməlisiniz.

Tövsiyə: