Data Catalog AWS nədir?
Data Catalog AWS nədir?

Video: Data Catalog AWS nədir?

Video: Data Catalog AWS nədir?
Video: ETL | AWS Glue | AWS S3 | Load Data from AWS S3 to Amazon RedShift 2024, Bilər
Anonim

The AWS Yapışqan Məlumat kataloqu bütün məlumatlarınız üçün struktur və əməliyyat metadata saxlamaq üçün mərkəzi depodur data aktivlər. Verilən üçün data təyin etsəniz, onun cədvəl tərifini, fiziki yerini saxlaya, bizneslə əlaqəli atributları əlavə edə və bunun necə olduğunu izləyə bilərsiniz data zamanla dəyişmişdir.

Bunu nəzərə alaraq, AWS yapışqan məlumat kataloqu nədir?

The AWS Glue Məlumat Kataloqu istinadlar ehtiva edir data çıxarış, çevirmə və yükləmə (ETL) işlərinizin mənbələri və hədəfləri kimi istifadə olunur AWS yapışqan . Tipik olaraq, inventar almaq üçün bir tarama aparırsınız data sizin data mağazalar, lakin metadata cədvəllərinizə əlavə etməyin başqa yolları da var Məlumat kataloqu.

Yuxarıdakılardan başqa, AWS yapışqanında quraşdırıla bilərmi? AWS yapışqan serversizdir, ona görə də heç bir infrastruktur yoxdur təyin edin yuxarı və ya idarə et. Sən bacarmaq da istifadə edin AWS yapışqan API əməliyyatları ilə interfeys AWS yapışqan xidmətlər. Tanış inkişaf mühitindən istifadə edərək Python və ya Scala Apache Spark ETL kodunuzu redaktə edin, sazlayın və sınayın.

Həmçinin bilmək lazımdır ki, məlumat kataloqu nədir?

A məlumat kataloqu təşkilatlara böyük həcmdə məlumatların tapılmasına və idarə olunmasına kömək etmək üçün nəzərdə tutulmuş metaməlumatların idarə edilməsi vasitəsidir data – cədvəllər, fayllar və verilənlər bazaları daxil olmaqla – ERP, insan resursları, maliyyə və e-ticarət sistemlərində, eləcə də sosial media lentləri kimi digər mənbələrdə saxlanılır.

AWS yapışqan nə üçün istifadə olunur?

AWS yapışqan tam idarə olunan çıxarış, çevirmə və yükləmə (ETL) xidmətidir ki, bu da müştərilərin analitika üçün məlumatlarını hazırlamasını və yükləməsini asanlaşdırır. Siz bir neçə kliklə ETL işi yarada və işlədə bilərsiniz AWS İdarəetmə Konsolu.

Tövsiyə: