The Fourth And Fifth Tools

Big Data Analytics Tools

Apache AirflowApache Parquet

Advertisements

4. Apache Airflow

An effective tool in developing the analysis steps and making them more advanced, as Airflow is considered code in the Python language.

5. Apache Parquet

Apache Parquet is a dual-column, big data-architecture designed for Hadoop that allows it to represent compressed data by controlling new codes as they appear at the column level. Parquet is a popular environment for big data analysts and is used in Spark and Kafka and Hadoop.

Advertisements

الأداتين الرابعة والخامسة من أدوات تحليل البيانات الضخمة

Apache Airflow – Apache Parquet

Advertisements

4. Apache Airflow

أداة فعالة في تطوير خطوات التحليل وجعلها أكثر تقدماً

تعتبر كود في لغة بايثون Airflow إذ أن

5. Apache Parquet

هو نسق مزدوج مخصص للعمل على أعمدة حفظ

Hadoop البيانات الضخمة والمصمم للتعامل مع بيئة

الذي يتيح له تمثيل البيانات المضغوطة من خلال

التحكم بكودات جديدة فور ظهورها على مستوى العمود

بيئة متداولة بشكل كبير Parquet كما ويعتبر

من قبل محللي البيانات الضخمة

Hadoop و Kafka و Spark علاوة على استخدامه في

Advertisements