Spark Scala-da DataFrame nədir?
Spark Scala-da DataFrame nədir?

Video: Spark Scala-da DataFrame nədir?

Video: Spark Scala-da DataFrame nədir?
Video: 21. How to create dataframe in Spark using Scala 2024, Noyabr
Anonim

A Spark DataFrame aqreqatları süzgəcdən keçirmək, qruplaşdırmaq və ya hesablamaq üçün əməliyyatları təmin edən və istifadə edilə bilən adlanmış sütunlarda təşkil edilmiş məlumatların paylanmış toplusudur. Qığılcım SQL. DataFrames strukturlaşdırılmış məlumat fayllarından, mövcud RDD-lərdən, Hive-dakı cədvəllərdən və ya xarici verilənlər bazalarından tikilə bilər.

Eynilə, siz soruşa bilərsiniz ki, Scala-da DataFrame nədir?

Adlandırılmış sütunlarda təşkil edilmiş paylanmış məlumat toplusu. A DataFrame Spark SQL-də əlaqəli cədvələ ekvivalentdir. Bir sütun seçmək üçün məlumat çərçivəsi , tətbiq üsulundan istifadə edin Scala və Java-da col.

Scala-da işıqlandırmanın istifadəsi nədir? ( yanır edir istifadə olunur in Qığılcım hərfi dəyəri yeni sütuna çevirmək üçün.) Çünki concat sütunları arqument kimi qəbul edir yanır olmalıdır istifadə olunur burada.

Yuxarıdakılardan əlavə, qığılcımda RDD ilə DataFrame arasındakı fərq nədir?

Spark RDD API-lər - An RDD Dayanıqlı Paylanmış Datasets deməkdir. Bu qeydlərin yalnız oxunan bölmə toplusudur. RDD əsas məlumat strukturudur Qığılcım . Spark-da DataFrame tərtibatçılara daha yüksək səviyyəli abstraksiyaya imkan verən paylanmış məlumat toplusuna struktur tətbiq etməyə imkan verir.

Spark-da Column ilə nə edir?

Sütun ilə qığılcım () funksiyası edir Mövcud DataFrame sütununun adını dəyişmək, dəyəri dəyişdirmək, məlumat növünü çevirmək və həmçinin bacarmaq yeni sütun yaratmaq üçün istifadə oluna bilər, bu yazıda, I olacaq ilə tez-tez istifadə olunan DataFrame sütun əməliyyatları vasitəsilə sizə yol göstərin Scala və Pyspark nümunələri.

Tövsiyə: