Mündəricat:

Siyahıdan PySpark DataFrame-i necə edə bilərəm?
Siyahıdan PySpark DataFrame-i necə edə bilərəm?

Video: Siyahıdan PySpark DataFrame-i necə edə bilərəm?

Video: Siyahıdan PySpark DataFrame-i necə edə bilərəm?
Video: An Intro to Markov chains with Python! 2024, Dekabr
Anonim

Dəstlər siyahısından DataFrame yaratmaq üçün bu addımları izləyirəm:

  1. Yaradın a siyahı tuples. Hər dəstdə yaşı olan şəxsin adı var.
  2. Yaradın bir RDD siyahı yuxarıda.
  3. Çevirmək hər cərgə bir sıra.
  4. Yaradın a DataFrame sqlContext köməyi ilə RDD-də createDataFrame tətbiq etməklə.

Bunu nəzərə alaraq, DataFrame-i Python-da siyahıya necə çevirmək olar?

  1. Addım 1: DataFrame.to_numpy() istifadə edərək Dataframe-i iç-içə Numpy massivinə çevirin, yəni,
  2. Addım 2: 2D Numpy massivini siyahılar siyahısına çevirin.
  3. Addım 1: Sətirləri sütunlara, sütunları isə sətirlərə çevirmək üçün dataframe-i köçürün.
  4. Addım 2: DataFrame.to_numpy() funksiyasından istifadə edərək Dataframe-i yuvalanmış Numpy massivinə çevirin

Bundan əlavə, qığılcım DataFrame nədir? A Spark DataFrame aqreqatları süzgəcdən keçirmək, qruplaşdırmaq və ya hesablamaq üçün əməliyyatları təmin edən və istifadə edilə bilən adlanmış sütunlarda təşkil edilmiş məlumatların paylanmış toplusudur. Qığılcım SQL. DataFrames strukturlaşdırılmış məlumat fayllarından, mövcud RDD-lərdən, Hive-dakı cədvəllərdən və ya xarici verilənlər bazalarından tikilə bilər.

Həmçinin bilin, PySpark SQL nədir?

Spark SQL a Qığılcım strukturlaşdırılmış məlumatların emalı üçün modul. O, DataFrames adlı proqramlaşdırma abstraksiyasını təmin edir və paylanmış kimi də çıxış edə bilər SQL sorğu mühərriki. O, dəyişdirilməmiş Hadoop Hive sorğularını mövcud yerləşdirmələrdə və məlumatlarda 100 dəfə daha sürətli işləməyə imkan verir.

Spark DataFrames dəyişməzdirmi?

In Qığılcım bilməzsən - DataFrames var dəyişməz . istifadə etməlisən.

Tövsiyə: