Mündəricat:

PySpark toplamaq nədir?
PySpark toplamaq nədir?

Video: PySpark toplamaq nədir?

Video: PySpark toplamaq nədir?
Video: What Is Apache Spark? 2024, Noyabr
Anonim

Toplayın (Fəaliyyət) - Datasetin bütün elementlərini sürücü proqramında massiv kimi qaytarın. Bu, adətən, məlumatların kifayət qədər kiçik bir hissəsini qaytaran filtrdən və ya digər əməliyyatdan sonra faydalıdır.

Bu şəkildə PySpark nədir?

PySpark Proqramlaşdırma. PySpark Apache Spark və Python-un əməkdaşlığıdır. Apache Spark, sürət, istifadə rahatlığı və axın analitikası ətrafında qurulmuş açıq mənbəli klaster hesablama çərçivəsidir, Python isə ümumi təyinatlı, yüksək səviyyəli proqramlaşdırma dilidir.

Həmçinin, PySpark-da xəritə nədir? Qığılcım Xəritə Transformasiya. A xəritə Apache Spark-da transformasiya əməliyyatıdır. Bu, RDD-nin hər bir elementinə aiddir və nəticəni yeni RDD kimi qaytarır. Xəritə N uzunluqlu RDD-ni N uzunluqlu digər RDD-yə çevirir. Giriş və çıxış RDD-lərində adətən eyni sayda qeydlər olacaq.

Bu şəkildə, PySpark-da SparkContext nədir?

PySpark - SparkContext . Reklamlar. SparkContext hər hansı bir giriş nöqtəsidir qığılcım funksionallıq. Hər hansı bir işlədiyimiz zaman Qığılcım proqram, əsas funksiyası olan bir sürücü proqramı başlayır və sizin SparkContext burada işə başlayır. Sürücü proqramı daha sonra işçi qovşaqlarındakı icraçılar daxilində əməliyyatları yerinə yetirir.

PySpark versiyasını necə yoxlaya bilərəm?

2 Cavablar

  1. Spark shell Terminalını açın və əmr daxil edin.
  2. sc.version Və ya spark-submit --version.
  3. Ən asan yol əmr satırında sadəcə "qığılcım qabığını" işə salmaqdır. O, göstərəcək.
  4. Spark-ın cari aktiv versiyası.

Tövsiyə: