Mündəricat:

Python-u Hadoop-da işlədə bilərəmmi?
Python-u Hadoop-da işlədə bilərəmmi?

Video: Python-u Hadoop-da işlədə bilərəmmi?

Video: Python-u Hadoop-da işlədə bilərəmmi?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Aprel
Anonim

Java, Scala və kimi proqramlaşdırma dilləri arasında seçim imkanı ilə Python üçün Hadoop ekosistem, əksər tərtibatçılar istifadə edir Python məlumat analitikası tapşırıqları üçün dəstəkləyən kitabxanalara görə. Hadoop axın istifadəçi yaratmağa imkan verir və icra etmək Hər hansı bir skriptlə və ya xəritəçi və/və ya reduktor kimi icra edilə bilən işlərin xəritəsi/kiçildilməsi.

Eynilə, soruşulur ki, Python Hadoop-a necə qoşulur?

Hadoop HDFS-ni Python ilə birləşdirin

  1. Addım 1: Hadoop HDFS-nin düzgün işlədiyinə əmin olun. Terminal/Command Prompt-u açın, aşağıdakı əmrlərdən istifadə edərək HDFS-nin işlədiyini yoxlayın: start-dfs.sh.
  2. Addım 2: libhdfs3 kitabxanasını quraşdırın.
  3. Addım 3: Hdfs3 kitabxanasını quraşdırın.
  4. Addım 4: HDFS ilə əlaqənin uğurlu olub olmadığını yoxlayın.

Eynilə, Python-da Hadoop nədir? Python proqramlaşdırma dünyasında demək olar ki, hər şeyi etmək üçün istifadə edilə bilən ümumi təyinatlı tam proqramlaşdırma dilidir. Hadoop böyük həcmdə verilənlərlə işləmək üçün Java-da yazılmış böyük verilənlər çərçivəsidir. Çoxsaylı onlayn institutlar var Hadoop ilə Python kimi kurslar: Analytixlabs. Edureka.

Sonradan sual yaranır ki, mən Hadoop-da Python MapReduce proqramını necə işlədə bilərəm?

Python-da Hadoop MapReduce Proqramının Yazılması

  1. Motivasiya.
  2. Nə etmək istəyirik.
  3. İlkin şərtlər.
  4. Python MapReduce Kodu. Xəritə addımı: mapper.py. Addımı azaldın: reduktor.py.
  5. Hadoop-da Python Kodunun işlədilməsi. Nümunə daxiletmə məlumatını yükləyin. Yerli nümunə məlumatlarını HDFS-ə kopyalayın.
  6. Təkmilləşdirilmiş Mapper və Reducer kodu: Python iteratorları və generatorlarından istifadə etməklə. mapper.py. reduktor.py.

Hadoop Streaming jar nədir?

Hadoop Distribution adlı Java yardımçı təmin edir Hadoop axını . A şəklində qablaşdırılır banka fayl. ilə Hadoop axını , biz icra edilə bilən skriptlə Map Reduce işləri yarada və işlədə bilərik. Hadoop axını ilə birlikdə gələn bir köməkçi proqramdır Hadoop paylanması. Böyük məlumatların təhlili üçün proqramları icra etmək üçün istifadə edilə bilər.

Tövsiyə: