Basic requirements for Data Scientist job role.

Advertisements

Basic requirements for Data Scientist job role.

What are the technical skills to be learned as a Data Scientist?

  1. Machine learning: it is considered as a basic stone in data science job field in addition to the basic knowledge to the math of statistic.
  2. Modeling: Numerical models empower you to make speedy computations and forecasts depending on what you definitely think about the information. Modeling is additionally a piece of ML and includes distinguishing which calculation is the most appropriate to take care of a given issue and how to prepare these models.
  3. Statistics:   statistics is the fundamental of Data Science, because it helps better reveal all insights behind the data and extract perfect results.
  4. Programming: you need to have intermediate level in programming in order to perform a successful data science project. The most common languages for data science are Python and R.
  5. 5- Data Bases: as a data scientist you need to know how the databases work, and how to deal with them.

What are the basics of machine learning algorithms that any data scientist should know?

The basic of machine learning algorithms that any data scientist should know about are:

  1. Regression: it is one of the machine learning algorithms that is considered as a supervised learning technique. The outcomes and results are continuous values like observing the increase of weigh depending on the intake calories.
  2. Decision tree: it is a supervised machine learning technique, and it is used basically for classification.
  3. Naïve Byes: it is one of the supervised learning and it is used for binary and multi-classification problems. It is all based on math of probabilities.
  4. Logistic regression: Also, it is a supervised machine learning technique, it is used when the dependent variable is binary (0/1, True/False, Yes/No), It is arranging data into discrete classes by examining the relationship from a given set of labeled data. It takes in a linear relationship from the given dataset and afterward presents a non-linearity as the Sigmoid capacity.
  5. Clustering: It is un-supervised machine learning technique, it is used to work on un-labeled data points and group all data points into clusters.
  • It was a simple explanation for the ML algorithms, we will dive in the deep of them soon later.

Advertisements

:بالعربي

ماهي المهارات التقنية التي يجب ان يتعلمها أي شخص مهتم بمجال علم البيانات؟

Advertisements

١- التعلم الالي: يعتبر التعلم الآلي الحجر الأساس في مجال الداتا ساينس بالإضافة الى معرفة اساسيات علم الإحصاء الرياضي

٢- التصميم الخوارزمي: هو الجزء الأساسي من تعلم الالة نستطيع من خلاله معرفة نوع الخوارزمية المناسب واللازم استخدامها اثناء عملية التحليل والتنبؤ

٣– رياضيات الاحصاء: هي الرياضيات القائمة عليها خوارزميات التعلم الالي حيث تساعد في كشف ما وراء الداتا للوصول لأحسن النتائج.

٤- لغات البرمجة: يجب ان تكون متوسط المستوى في أي لغة من لغات البرمجة من اجل ضمان إمكانية تنفيذ مشاريع جيدة في مجال الداتا ساينس. أسهل لغة برمجة في عصرنا الحالي هي البايثون.٥

– ٥- قواعد البيانات : كعالم بيانات عليك ان تعرف كيفية التعامل مع قواعد البيانات وكيفية الحصول على البيانات منها.

ماهي خوارزميات تعلم الالة الأساسية الواجب معرفتها لدي أي عالم بيانات؟

(سيتم ذكر أسماء الخوارزميات بالإنكليزي نظرا” لعدم توافر ترجمة لها بالعربي)

Advertisements

:Regressionخوارزمية ال

(Supervised)من الخوارزميات الشائعة في عالم الداتا ساينس تعتبر من تقنيات تعلم الالة الرقابية

بحيث تكون النتائج الناجمة عن تطبيق هذه الخوارزمية هي نتائج متوالية مثال عنها مراقبة تغير الوزن بشكل مستمر بالاعتماد على تغير كمية الحريريات الداخلة للجسم

:Decision treeخوارزمية ال

(supervised learning)هي أحد تقنيات تعلم الالة الرقابية أيضا

.وتستخدم لإعطاء نتائج تصنيفية اما نعم او لا.

:Naive Byesخوارزمية ال

(supervised learning)أيضا” هي أحد تقنيات التعلم الالي الرقابية

تعتمد بشكل أساسي على رياضيات الاحتمالات. تستخدم للحصول على نتائج ثنائية التصنيف او متعددة التصنيف

:Logistic regressionخوارزمية ال

(Supervised learning)أيضا” هي أحد تقنيات التعلم الالي الرقابية

وتكون العلاقة غير خطية بين المتغيرات Regressionثنائي التصنيف اما يس او نو وليس متتالي مثل ال Yتستخدم عندما يكون

:Clusteringخوارزمية ال

(un-labeled data) تستخدم للبيانات الغير معنونة (un-supervised learning)هي أحد تقنيات التعلم الالي الرقابية

.حيث تعتمد على جمع البيانات في مجموعات منفصلة

ـ هذا كان شرح مبسط غير مفصل عن خوارزميات تعلم الالة سنقوم لاحقا” بشرح هذه الخوارزميات وخوارزميات غيرها قريبا”.

Advertisements

2 thoughts on “Basic requirements for Data Scientist job role.

Leave a comment