Best Books for Data Science (Intermediate )

  • To advance past the junior data scientist level the key is to practice coding as much as could reasonably be expected to remain on top.
Advertisements
  • First : Python for Data Analysis is the ideal method to become more familiar with standard Python libraries like NumPy or pandas, as you need these libraries for Real-World Data analysis and visualization. So, this book is a finished composition that begins by reminding you how Python functions and investigates how to extract helpful insights from any data you may deal with as a Data Scientist.
Advertisements
  • Second: Python Data Science Handbook is an extraordinary aide through all standard Python libraries also like NumPy, pandas, Matplotlib, Scikit-learn.
  • This book is an extraordinary reference for any data-related issues you may have as a data scientist. Clean, transform and manipulate data to discover what is behind the scene.
Advertisements
  • Third: Python Machine Learning is somewhere close to transitional and master. It will request both specialists and individuals who are somewhere in the middle.

It begins delicately and afterward, continues to latest advances in AI and machine learning.

It is an Extraordinary read for any AI engineer or Data Scientist exploring different avenues regarding AI calculations!

Advertisements
  • Fourth: Active Machine Learning with Scikit-Learn and TensorFlow (the second version is out!) is a stunning reference for a mid-level data scientist.

This book covers all basics (classification methods, dimensionality reduction) and afterward gets into neural organizations and deep learning utilizing Tensorflow and Keras to assemble ML models.

  • These are some of many important books for intermediate level, if you know other books please share in comments.
Advertisements

:بالعربي

Advertisements

كما قرأنا سابقا” عن بعض الكتب التي تساعدك كمبتدئء في علم البيانات بالدخول الى هذا المجال من دون الحاجة لمعرفة اي لغة من لغات البرمجة, ولكن لتصبح متمرس اكتر لابد من البدء بتعلم لغة واحدة على الاقل وانا انصح بلغة البايثون لسهولة تعلمها.

ومن هنا لنتعرف على الكتاب التالي وهو (البايثون لتحليل الداتا) يعتبر اقتناء هذا الكتاب وقرائته طريقى مثلى للبدء بالتعرف غلى مكاتب البايثون اللازمة قي تحليل البيانات و تمثيلها مرئيا” مثل مكتبة الباندا و النمباي, حيث يتدرج في شرح المعلومات من مستوى المبتدئء وحتى مستوى متقدم اكثر.

Advertisements

الكتاب الثاني هو ( البايثون لتعلم الداتا ساينس) , يعتبر هذا الكتاب المساعد الاول لاي عالم بيانات مستجد حيث من خلاله يمكنك ايجاد الكثير من الحلول التي ممكن ان تواجهك اثناء تصحيح البيانات ومعالجتها , او تطبيق الخوارزميات وغيرها.

Advertisements

اما الكتاب الثالث فهو (البايثون لتعلم الالة) يعتبر هذا الكتاب مرجع جيد لمن هم في منتصف الطريق في رحلة تعلمهم لعلم البيانات او حتى ممن يمارسون المهنة فهو دليل شامل يتدرج من المستوى المبتدئ و حتى مستويات اعلى.

Advertisements

اما الكتاب الرابع فهو ( تعلم الالة باستخدام الكيراس و التنسر فلو) , يعتبر هذا الكتاب ايضا مهم جدا للمستويات المتوسطة في علم البيانات حيث يساعدك على تعلم مبادئء خوارزميات التصنيف و غيرها و من ثم ينتقل الى مستويات اعلى بتعلم ميادئء الشبكات العصبية والتعلم العميق باستخدام التنسرفلو و الكيراس.

المقالة القادمة ستكون لكتب المرحلة المتقدمة , اذا كان لديكم كتب اخرى قمتم بقرائتها واستفدتم منها شاركونا بالتعليقات

Advertisements

Best Books for Data Science (For Beginners)

Advertisements
  • Data Science is certainly the most sizzling business sector at this time. Pretty much every organization has a Data science position opened or will open soon. That implies, it’s the best ideal opportunity to turn into a Data Scientist or sharpen your abilities in case you’re as of now one and need to step up to more senior positions. So, to get such a valuable help in this career, I will recommend you with the most valuable books that could lead you to know more skills in Data Science. More further, books are good and necessary but 70% of your Data analysis skills comes in practicing and performing projects.
Advertisements

Data Science books for Beginners

1- In case you’re simply beginning your experience with Data Science, you should start with this book:

  • You do not need to know Python to start, this book is very helpful to start from the beginning as you’ll get a brief training in Python, learn basic math for Dat Science, and you will be able to break down data and analyzing it.
Advertisements

2- In case you’re a beginner in machine learning you will find this book very helpful:

  • you do not need to know Python as well as this book will help you to know all machine learning Algorithms and how to apply them in Python.
Advertisements

3- Finally, assuming you are looking for a good guidance of what Data Scientist mean?, then, at that point view a valuable book:

  • This book will help you to know what skills you need to obtain to turn into Data Scientist, how Data Scientists perform their jobs, or how to land your first interview for the first position.

I introduced most important books for Beginners who are taking their decision to become a Data Scientist. So, Good Luck, and it is my pleasure to share in comments some of other valuable books in Data Science for beginners that you may know about, that we can all exchange our experience.

Advertisements

( Arabic):بالعربي

:اهم الكتب في مجال علم البيانات

Advertisements

علم البيانات هو من أهم قطاعات العمل المنتشرة في العصر الحديث وخاصة في دول الغرب جميع الشركات حاليا تسعى لاستثمار البيانات المتوفرة والموجودة لديها في تحسين اداء العمل واكتشاف الثغرات و وضع خطط عمل مستقبلية تتماشى مع تحقيق اهداف الشركة ,لذلك بدأت هذه الشركات بتوظيف علماء ومحللين البيانات للتعامل مع البيانات وتوظيفها كما ذكرنا في ما يخدم مصلحة العمل.

فاذا كنت حاليا بدأت بتعلم هذا الاختصاص او تمارس هذا الاختصاص في احدى الشركات وبحاجة. الى كتب تساعدك في رحلة التعلم اليك هذا المقال الذي سنستعرض فيه اهم الكتب للمبتدئين في مجال الداتا ساينس

Advertisements

١- بداية اذا كنت مستجد في هذا المجال ولا تعرف عن الاختصاص الا اسمه يمكنك البدء بهذا الكتاب الذي يساعدك بوضع اللبنة الاولى برحلة تعلمك الجديدة ومن دون اي حاجة لمعرفة سابقة بلغات البرمجة , حيث يساعدك بتعلم الرياضيات الاساسية في مجال الداتا ساينس وكيفية تطبيقها بشكل مبسط على برنامج البايثون الذي يعتبر من اسهل لغات البرمجة

Advertisements

٢- اذا كنت من المستجدين في تعلم لغة الالة فهذا الكتاب سيساعدك كثيرا لفهم هذا المجال وفهم الخوارزميات المستخدمة في التعلم الالي و كيفية تطبيقها بخطوات بسيطة على برنامج البايثون

Advertisements

٣- اما اذا كنت تبحث عن كتاب يوفر لك معلومات عن معنى علم البيانات وماهي المهارات التي يجب ان تتعلمها للدخول في هذا المجال , او كيف يمكن ان تحصل على المقابلة الاولى التي ستوفر لك العمل المناسب فإليك هذا الكتاب

وفي ختام هذا المقال نكون قد استعرضنا اهم الكتب اللازمة للمبتدئين في مجال علم البيانات , نتمنى للجميع التوفيق و نتمنى ايضا مشاركتنا بالتعليقات عن كتب اخرى قمتم بقرائتها لتبادل الخبرات والمعرفة بين الجميع

Advertisements
Advertisements

How To Build A Career In DATA SCIENCE?

Advertisements

introduction:

Data Scientists are a blend of mathematicians, trend-spotters, and Computer Scientists. The Data Scientists’ job is to deal with huge amounts of data and complete further investigation to discover trends and gain a more profound understanding of what everything implies.

To start a career in Data Science you need some skills like analysis, machine learning, statistics, Hadoop, etc. Also, you need other skills like critical thinking, persuasive communications, and are a great listener and problem solver. 

This is an industry where plenty of opportunities are available, so once you have the education and capabilities, the positions are sitting tight for you—presently and later on.

Advertisements

Data Scientist Job Market:

These days Data is considered very valuable, organizations are utilizing the discovered insights that data scientists give to remain one step ahead of their opposition. Large names like Apple, Microsoft, Google, Walmart, and more famous companies have many job opportunities for Data Scientists.

Data science job role was discovered to be the most encouraging vocation in 2019 and has positioned one of the best 50 positions in the US.

Advertisements
  • How to start your first step?

The academic requirements for Data Science jobs are among the outstanding roles in the IT business—about 40% of these positions today expect you to hold a postgraduate education. There are also many platforms that offer to teach Data Science online like EDX, Coursera, Data world workshops, and many others.

These courses permit you to acquire deep learning about the most developed skills and techniques that Data scientists use, like Power Bi, Hadoop, R, SAS, Python, AI, and more.

Did you start your career, write in comments which is the best platform to learn the skills from your perspective?

Advertisements

بالعربي

كيف تبني خبراتك المستقبلية لتصبح خبير في مجال علم البيانات؟

Advertisements

عالم البيانات يعتبر مزيج من علم الرياضيات والمعلوماتية حيث يعتمد علم البيانات كما قرأنا سابقا على معالجة حجوم كبيرة من البيانات لاستكشاف ماوراء الداتا , مدلولاتها , والترند التي تشير اليها و بالتالي فهم ماهية الامور و كيفية حدوثها .

للبدء باختصاص الداتا ساينس لابد من اكتساب المهارات اللازمة لهذا المجال و اهمها القدرة على تحليل الامور و قراءة المخططات البيانية التحليلية وفهم مدلولاتها بالاضافة لاكتساب معلومات اولية في مبادىء الاحصاء والاحتمالات الرياضية التي تساعد كثيرا في تحليل الداتا

ايضا بالاضافة للمهارة السابقة يجب تعلم لغة برمجية تساعد اثناء عملية التحليل وتطبيق الخوارزميات او تعلم البرامج التحليلية الجاهزة متل النايم وغيره , و اما اذا كنت تتعامل مع كميات كبيرة وضخمة جدا من البيانات يجب التطرق الى المنصتين الاساسيتين للداتا الضخمة وهما سبارك و هادوب

اما لتعلم مهارات التصوير البياني او مايسمى باللغة الانكليزية فيجواليزيشن عليك التطرق الى احدى المنصتين هما تابلو و بور بي اي

ايضا بالاضافة للمهارات السابقة يجب ان يكون لديك المهارة والقدرة العالية على تحليل الامور و ربط الاحداث مع بعضها بالاضافة للمهارات الجيدة بالتواصل مع الزملاء و العمل ضمن فريق كامل متكامل لايجاد الحلول للمشاكل التي يمكن ان تواجهك اثناء عملية التحليل

يعتبر هذا المجال حاليا مجال العصر والمستقبل وبسبب النقص الكبير في اعداد الخبراء هناك توفر كبير لفرص العمل بالاضافة للرواتب الجيدة نسبيا ومهما كانت شهادتك البكالوريوس التي حصلت عليها سابقا بامكانك تعلم مهارات علم البيانات والدخول به حيث انه مجال شامل مكمل لاي اختصاص سابق ويتم تطبيقه في العديد من القطاعات ومجالات الحياة

Advertisements

سوق العمل في مجال الداتا ساينس:

ذكرنا سابقا ان العديد من الوظائف مفتوحة في مجال الداتا ساينس ولكن هناك نقص كبير بالخبراء , لكن هل سالت نفسك لماذا هذا الاقبال الشديد من قبل الشركات على هذا الاختصاص تحديدا؟

حقيقة الكثير من الشركات وخاصة الشركات الكبرى مثل غوغل, مايكرو سوفت, امازون , ابل وغيرها يعتمدون على هذا المجال لزيادة ارباحهم وتقييم منتجاتهم و وضع خطط مستقبلية لتطوير منتجاتهم من خلال دراسة اقبال الناس على شراء منتجاتهم و المنتجات المحبذة لدى الزبائن و دراسة متطلباتهم ,و كل ذلك يتم بدراسات احصائية و تحليلية طويلة الامد تحتاج خبراء حقيقين في مجال الداتا ساينس

منذ العام ٢٠١٩ اعتبر مجال الداتا ساينس من اهم القطاعات التي يجب التشجيع عليها و تعلم مهاراتها حيث اصبح هذا المجال من اوئل ال ٥٠ وظيفة الاكثر اهمية وطلبا في سوق العمل في الولايات المتحدة الامريكية

Advertisements

اذا ماهي الخطوة الاولى للبدء في هذا المجال؟

الدراسة الاكاديمية الان ضرورية جدا للدخول في هذا المجال حيث ان معظم الشركات حوالي الاربعين بالمئة منهم يطلبون اذا لم يكن تخصصك الجامعي في مجال الحاسوب او المعلوماتية ان يكون لديك على الاقل دبلوم عالي في مجال الداتا ساينس, ولكن هذا لا يعني انه عليك اكتساب الدبلوم او الماستر اولا للبدء في هذا المجال وانما يمكنك تعلم المهارات من خلال العديد من منصات الاون لاين واحتراف المهارات المطلوبة من دون دراسة اكاديمية , و من اهم هذه المنصات داتا كامب, ايدكس , كورسيرا وغيرها كثير

هل بدأتم بتعلم هذا المجال؟ اكتبولي بالتعليقات ماهي افضل المنصات التعليمية الاون لاين من وجهة نظركم وحسب تجربتكم؟

Advertisements

The Basic steps for any Data Science Project

Advertisements

As a beginner, did you ask yourself what are the basic steps for any Data Science project?

  1. Project’s idea study:

The objective of this step is to comprehend the issue by applying a study for the business problem.

For example, let’s say you are trying to predict the obesity rate in certain country. In this case, you need to comprehend the terminology used in the research industry and the main problem, and then collect enough relevant data about that meet your research. 

2- Preparing the Data:

 A data scientist should first explore the dataset to specify any missing data or data that are useless to our analysis goals. During this process, you must go through several steps, including:

Data Integration:

It is used to Resolve any struggles in the dataset and wipe out redundancies.

Data Transformation

Normalize, transform and aggregate data using ETL (extract, transform, load) methods

Data Reduction

decrease the size of the data without affecting the quality of the results

Data Cleaning

learning has many steps depending on the data quality and the mess levels. So, in this step, we perform filling in the gaps, transform the data structure from one type to another.

3-Model Planning:

After you have cleaned up the data, you should pick an appropriate model. The model you need should match with the idea of the issue—is it a regression issue, or a classification one? This part of working additionally includes an Exploratory Data Analysis (EDA) to dive more into data to reveal the insights and comprehend the connection between the variables. A few strategies utilized for EDA are histograms, box plots, bar charts, and so on.

After finishing choosing the model, split the data into training and testing data—training data to prepare the model, and testing information to validate the model. On the off chance that the testing isn’t exact, you should re-train another model. but if it is good working, you can place it into production.

The different tools utilized for modeling are:

R:

This tool can be used for normal statistical analysis and visualization

Python:

Python has great scientific libraries to apply machine learning and data analysis

SAS:

It is a great tool to perform full statistical analysis.

4- Model Building:

The following step is to create the model. Utilizing different analytical methods to discover useful information. You can quickly build models using Python packages from libraries like PandasMatplotlib, or NumPy.

5- Communication

During this step, the basic goal is to interpret our work to the stakeholders

by including details about steps taken and visualize it to make it easier to read.

6- Finalizing:

When all the team parties approve the discoveries, they get started. In this stage, the partners likewise get the last reports, code, and specialized archives.

Advertisements

:بالعربي
: الخطوات الاساسية اللازمة لتنفيذ مشروع في مجال علم البيانات-

Advertisements

.كمبتدىء في مجال علم البيانات يجب كمرحلة اولى ان يكون لديك دراية بماهية الخطوات المتبعة اثناء تنفيذ مشروع لعلم البيانات

:١- اجراء دراسة اولية لفكرة المشروع

الغاية من هذه الخطوة هو فهم الفكرة الاساسية للمشروع المراد تنفيذه من خلال المعرفة الكافية بالمصطلحات الاساسية الخاصة بالمشروع وما هي الغاية من تنفيذ المشروع

:مثال على ذلك

اذا اردنا التنبؤ بمعدل البدانة ببلد ما , في هذه الحالة يجب فهم المصطلحات الاساسية الخاصة بهذا المجال وماهي البدانة والعوامل المؤثرة في ازدياد معدل البدانة وبالتالي معرفة المتغيرات اللازم ادخالها في عملية التحليل والتي تفيدنا بالحصول على نتائج جيدة

:٢- مرحلة تحضير البيانات

كأي عالم بيانات يجب بداية استكشاف الداتا للتخلص من البيانات الغير مهم ادخالها في عملية التحليل او اذا كانت هناك بيانات مفقودة يجب التعامل معها اما بحذفها او بملئها ببيانات جديدة مشتقة من البيانات الموجودة سابقا

:يعتمد تنفيذ هذه المرحلة على عدة مراحل لاحقة

Data Integration:

تستخدم هذه المرحلة للتخلص من البيانات المكررة

Data Transformation

وهي مرحلة من مراحل معالجة البيانات تعتمد على استخلاص البيانات من قواعد البيانات معالجتهاETLتدعى هذه

واعادة تحميلها

Data Reduction

اذا كان لدينا بيانات هائلة وضخمة فيمكن التخلص من جزء من هذه الداتا او اخذ عينة منها بحيث لايتم التأثير على مدى جودة الداتا

Data Cleaning

كماذكرنا سابقا هذه المرحلة تعتمد على مدى فوضوية البيانات وعشوائيتها لنقوم باتخاذ الخطوات المناسبة لتصحيحها وجعلها جاهزة لاعطاء النتائج

:٤- التخطيط لبناء المودل

بعد عملية تصحصح البيانات عليك البدء باختيار المودل المناسب لحل المشكلة التي تواجهك حسب نوعيتها هل هيه مشكلة لتحليل بيانات متوالية او مشكلة تصنيفية بمعنى النتائج يجب ان تكون اما نعم او لا

اي عملية استكشاف البيانات لايجاد العلاقة بين المتغيرات وماهية البيانات وتوزعها EDAايضا تتصمن هذه المرحلة ويكون ذلك بالتمثيل البياني والمخططات البيانية كمنحني التوزع الطبيعي (الهيستوغرام) او ال(البوكس بلوت) او( الباي تشارت

HISTOGRAM
PIE CHART
BAR CHART

والغاية منه تدريب Training dataنقوم بتقسيم البيانات الى قسمين الاول يسمى EDAبعد الانتهاء من انتقاء المودل وعملية ال

والغاية منه تطبيق المودل بعد تدريبه للحصول على النتائجtesting dataالمودل على جزء من الداتا والبيانات والقسم التاني هو ال

اذا كانت النتائج مشكوك بدقتها او صحتها فيجب اخيتار داتا اكتر للتدريب واذا استمر الخطأ ممكن ان testing فبعد عملية ال

نقوم باستبدال المودل بمودل اخر

ماهي الادوات المستخدمة في عملية التحليل وما هي ميزاتها

R١- برنامج ال

هو لغة من لغات البرمجة يتم استخدامها من اجل العمليات الاحصائية والتمثيل البياني يتميز بقوته في رياضيات الاحصاء

٢-. البايثون

هو ايضا لغة من اللغات البرمجة والتي تعتبر سهلة جدا بالتعلم للمبتدئين في هذا المجال يتميز بتنوع مكاتبه العلمية المستخدم لرياضيات خوارزميات الماشين ليرنينغ وايضا مكاتب التمثيل البياني

SAS– ٣

من اهم البرامج المستخدمة في عمليات التحليل الاحصائي للبيانات

٤- مرحلة بناء المول

بناء المودل المناسب الهدف منه كما ذكرنا سابقا هو اكتشاف ماوراء الداتا , ففي حالة برنامج البايثون يتم استخدام مكتبات متعددة Matplotlibوايضاpandasوايضا Numpyمثل ال

٥- مرحلة مايسمى بترجمة النتائج

تعتبر هذه المرحلة من اهم مراحل عمل مشاريع الداتا ساينس وهي كتابة التقريرالنهائي بطريقة مبسطة وسهلة الفهم وباستخدام مخططات تمثيلية تسهل وصول الفكرة بشكل بسيط يتم شرح مبسط لما تم تطبيقه سابقا وشرح النتائج التي تم الوصول اليها وتقديم الحلول اذا اقتضى الامر

٦- المرحلة النهائية

وهي المرحلة النهائية التي يتم اعتماد النتائج التي تم الوصول اليها لتطبيقها ومرحلة استلام كودات العمل والتقارير النهائية

Advertisements

Basic requirements for Data Scientist job role.

Advertisements

Basic requirements for Data Scientist job role.

What are the technical skills to be learned as a Data Scientist?

  1. Machine learning: it is considered as a basic stone in data science job field in addition to the basic knowledge to the math of statistic.
  2. Modeling: Numerical models empower you to make speedy computations and forecasts depending on what you definitely think about the information. Modeling is additionally a piece of ML and includes distinguishing which calculation is the most appropriate to take care of a given issue and how to prepare these models.
  3. Statistics:   statistics is the fundamental of Data Science, because it helps better reveal all insights behind the data and extract perfect results.
  4. Programming: you need to have intermediate level in programming in order to perform a successful data science project. The most common languages for data science are Python and R.
  5. 5- Data Bases: as a data scientist you need to know how the databases work, and how to deal with them.

What are the basics of machine learning algorithms that any data scientist should know?

The basic of machine learning algorithms that any data scientist should know about are:

  1. Regression: it is one of the machine learning algorithms that is considered as a supervised learning technique. The outcomes and results are continuous values like observing the increase of weigh depending on the intake calories.
  2. Decision tree: it is a supervised machine learning technique, and it is used basically for classification.
  3. Naïve Byes: it is one of the supervised learning and it is used for binary and multi-classification problems. It is all based on math of probabilities.
  4. Logistic regression: Also, it is a supervised machine learning technique, it is used when the dependent variable is binary (0/1, True/False, Yes/No), It is arranging data into discrete classes by examining the relationship from a given set of labeled data. It takes in a linear relationship from the given dataset and afterward presents a non-linearity as the Sigmoid capacity.
  5. Clustering: It is un-supervised machine learning technique, it is used to work on un-labeled data points and group all data points into clusters.
  • It was a simple explanation for the ML algorithms, we will dive in the deep of them soon later.

Advertisements

:بالعربي

ماهي المهارات التقنية التي يجب ان يتعلمها أي شخص مهتم بمجال علم البيانات؟

Advertisements

١- التعلم الالي: يعتبر التعلم الآلي الحجر الأساس في مجال الداتا ساينس بالإضافة الى معرفة اساسيات علم الإحصاء الرياضي

٢- التصميم الخوارزمي: هو الجزء الأساسي من تعلم الالة نستطيع من خلاله معرفة نوع الخوارزمية المناسب واللازم استخدامها اثناء عملية التحليل والتنبؤ

٣– رياضيات الاحصاء: هي الرياضيات القائمة عليها خوارزميات التعلم الالي حيث تساعد في كشف ما وراء الداتا للوصول لأحسن النتائج.

٤- لغات البرمجة: يجب ان تكون متوسط المستوى في أي لغة من لغات البرمجة من اجل ضمان إمكانية تنفيذ مشاريع جيدة في مجال الداتا ساينس. أسهل لغة برمجة في عصرنا الحالي هي البايثون.٥

– ٥- قواعد البيانات : كعالم بيانات عليك ان تعرف كيفية التعامل مع قواعد البيانات وكيفية الحصول على البيانات منها.

ماهي خوارزميات تعلم الالة الأساسية الواجب معرفتها لدي أي عالم بيانات؟

(سيتم ذكر أسماء الخوارزميات بالإنكليزي نظرا” لعدم توافر ترجمة لها بالعربي)

Advertisements

:Regressionخوارزمية ال

(Supervised)من الخوارزميات الشائعة في عالم الداتا ساينس تعتبر من تقنيات تعلم الالة الرقابية

بحيث تكون النتائج الناجمة عن تطبيق هذه الخوارزمية هي نتائج متوالية مثال عنها مراقبة تغير الوزن بشكل مستمر بالاعتماد على تغير كمية الحريريات الداخلة للجسم

:Decision treeخوارزمية ال

(supervised learning)هي أحد تقنيات تعلم الالة الرقابية أيضا

.وتستخدم لإعطاء نتائج تصنيفية اما نعم او لا.

:Naive Byesخوارزمية ال

(supervised learning)أيضا” هي أحد تقنيات التعلم الالي الرقابية

تعتمد بشكل أساسي على رياضيات الاحتمالات. تستخدم للحصول على نتائج ثنائية التصنيف او متعددة التصنيف

:Logistic regressionخوارزمية ال

(Supervised learning)أيضا” هي أحد تقنيات التعلم الالي الرقابية

وتكون العلاقة غير خطية بين المتغيرات Regressionثنائي التصنيف اما يس او نو وليس متتالي مثل ال Yتستخدم عندما يكون

:Clusteringخوارزمية ال

(un-labeled data) تستخدم للبيانات الغير معنونة (un-supervised learning)هي أحد تقنيات التعلم الالي الرقابية

.حيث تعتمد على جمع البيانات في مجموعات منفصلة

ـ هذا كان شرح مبسط غير مفصل عن خوارزميات تعلم الالة سنقوم لاحقا” بشرح هذه الخوارزميات وخوارزميات غيرها قريبا”.

Advertisements

What is Data Science??

Advertisements

What is Data Science?

  • Data Science is the space of study that manages tremendous volumes of information utilizing new instruments and procedures to discover what is behind the data, determine significant points to settle on business choices. Besides, Data Science utilizes complex AI calculations to assemble predictive models.

Where to get the Data?

  • The Data utilized for the analysis can be from different sources and present in different arrangements.
  • Best sources to get data sets to work and train on it are kaggle.com and github.com

Data Science lets you:

  • Track down the main source of an issue by posing the correct inquiries
  • Proceed exploratory examination on the data
  • Process the data by utilizing different algorithms
  • Interpret the outcomes by performing visualization using charts, dashboards, and so forth.
Advertisements

LET US TAKE AN EXAMPLE RELATED TO Data Science APPLIANCE:

  • We can see the appliance of Data Science in many life’s aspects, the most common example is the weather forecasting.

We all have mobile phones and weather application is installed to know the weather every hour, did you ask yourself before how would that happen?

Data about temperature, humidity, wind speed, and air quality are collected every day to feed the weather applications’ algorithms in order to perform weather forecasting either day by day or for the week.

Do you think the type of algorithm is differ between the day-by-day temperature or by saying the weather sunny today, rainy or even snowy?

The answer is yes absolutely there is a difference.

Can you guess what is the difference ??!, write in comments 🙂

Advertisements

: بالعربي

علم البيانات هو علم العصر , يعتمد هذا النوع من العلوم على جمع معلومات وبيانات ضخمة وتطبيق طرق خاصة بهدف الكشف عن ماوراء هذه الداتا وبالتالي اتخاذ القرارات الصائبة

كيف يمكن الحصول على هذه الداتا والبيانات؟

الحصول على هذه البيانات يكون عادة من مصادر مختلفة كالمؤسسات الاحصائية التي تقوم بجمع البيانات فيما يخص حدث معين كجمع معلومات عن اعداد الناس التي تمت اصابتهم بفايروس كورونا ضمن منطقة معينة بحيث تصبح هذه الاحصائية مرجعا فيما بعد لدراسات لاحقة. اما اذا اردت الحصول على بيانات من اجل التدريب وتطبيق خوارزميات تعلم الالة فيمكنك زيارة موقعين .kaggle and githubهما

Advertisements

:نستفيد من هذا المجال بمايلي

اولا- علم البيانات يتيح المجال باستكشاف الأخطاء واصلاحها والاجابة على كل الأسئلة

٢- هذا المجال يتيح لنا استكشاف الداتا وتحليلها.

٣- استخدام خوارزميات تعلم الالة من اجل معالجة البيانات لاحقا والحصول على نتائج

٤- ترجمة هذه النتائج باستخدام أساليب التمثيل البياني من مخططات وغرافات من اجل سهولة الشرح للمستخدم النهائي

:مثال تطبيقي لمفهوم علم البيانات

بداية يمكننا ان نرى ان علم البيانات اصبح متاح في كل مناحي حياتنا واكبر مثال على ذلك التطبيقات الموجودة على هواتفنا المحمولة التي تخص حالة الطقس لمعرفة حال الطقس كل ساعة بعد ساعة وممكن لأسبوع كامل, هل سألت نفسك بيوم من الأيام كيف يتم هذا؟

ان بيانات الحرارة والرطوبة وسرعة الرياح تجمع كل يوم لتغذية الخوارزميات القائمة عليها تطبيقات التنبؤ في حالة الطقس بهدف-الحصول على حالة الطقس يوما بع يوم او على مدى أسبوع كامل.

 هل باعتقادك هناك فرق في نوعية الخوارزمية المطبقة لمعرفة درجة الحرارة يوميا او لمعرفة ماهي حالة الطقس سواء ماطر او صيفي او حتى مثلج؟

الجواب: طبعا. نعم هناك فرق بين الخوارزميتين المطبقتين.

(إذا عرفتم ما هو الفرق او ماهي الخوارزميات المطبقة في الحالتين السابقتين يرجى الكتابة في التعليقات).

Advertisements

Do you want to be a (Good) Data Scientist?

Beginners  Guide

  • Here I will cover things you should learn to become a data scientist, including the basics of business intelligence, statistics, programming, and machine learning.
Advertisements

Is it simple to learn Data Science?! You could decide after you read the following requirements.

  • Most of the time when you read about data scientist job roles, you think there is no such way that a common person can learn data science!. Data science is just an extension of 21st-century mathematics that people have been doing for centuries. In essence, it is the skill that uses the information available to gain insights and improve actions whether it is a small Excel spreadsheet or 100 million records in a database; the goal is always the same: discover the insights behind the data. 
  • What makes data science different from traditional statistics is that it does not only explain values but also tries to predict future trends.

Here we have the summary of the Data Science usages:

  • Moreover, Data science is a newly developed blend of machine learning algorithms, the math of statistics and probabilities, business intelligence, and technology. This mixture helps us clear hidden information behind the data in a way that fits business needs.
Advertisements
  • What should a data scientist know?

To start with Data Science, you need the abilities of a business analyst, a statistician, a programmer, and a Machine Learning developer, but to enter the world of data, you are not required to be a specialist in any of these fields.

  • The minimum that you need are the followings:
  • 1- Business Intelligence:
  • At the point when we first look at Data Science and Business Intelligence, we can see the likeness: both of them center around data to give the best results and reliable decision-support system. The thing that matters is that while BI works with static and organized information, Data Science can deal with rapid and complex, multi-organized information from a wide assortment of information sources.

However, to begin a straightforward a Data Science project, you don’t need to be a specialist Business Analyst. What you need is to have clear thoughts of the accompanying focuses:

  • have an inquiry or something you are interested about.
  • find and gather significant information that exists for your area of interest and may address your inquiry.
  • Break down your information with common analytical tools; then take a look at your work and try to extract the conclusions.
  • 2- Statistics and probability:

Probability and statistics are the backbones of data science. Simply, statistics is the mathematics method for technical analysis, but to make estimates and predictions for further analysis we should know that statistical methods rely on probability theory to make predictions.

  • 3- Programming:

Data science is an exciting field of work because it combines advanced statistical and quantitative skills with real-world programming skills. Depending on your background, you can choose a programming language based on your preference. However, the most popular in the data science community are RPython, and SQL.

  • 4- Machine Learning and AI

While artificial intelligence and data science usually go hand in hand, many data scientists do not understand the areas and techniques of machine learning. However, data science involves working with large amounts of data sets for which machine learning techniques such as “supervised machine learning, decision trees, logistic regression, etc” must be mastered. These skills will help you solve various data science problems based on the predictions of the main organization outcomes.

  • What are additional skills should a data scientist have?

Now you know the main data science prerequisites. What makes you a better data scientist? While there is no one correct answer, there are several things to keep in mind:

1-Analytical Mindset

2-Focus on Problem Solving

3-Domain Knowledge

4-Communication Skills

Advertisements

:(In Arabic) بالعربي

هل تريد الدخول بمجال عالم البيانات او ان تكون عالم بيانات جيد؟؟

: (اقرأ هذا الدليل التوجيهي )

هنا سنقوم باستعراض الاساسيات اللازمة بشكل عام التي يجب التعرف عليها قبل الدخول بمجال علم البيانات كأهمية تحليل البيانات, التطرق للوسائل التكنولوجية اللازم تعلمها, الرياضيات وراء علم البيانات , و لماذا يجب التعرف على خوارزميات تعلم الالة

Advertisements

بداية كيف نشأ علم البيانات وما الغاية منه ؟

علم البيانات هو مجرد امتداد لرياضيات القرن الحادي والعشرين وبكلمة اخرى هو مزيج مطور حديثًا من خوارزميات التعلم الآلي، ورياضيات الإحصاء والاحتمالات، والتكنولوجيا الحديثة . يستخدم هذا العلم المعلومات المتاحة لاكتشاف ما وراء البيانات وبالتالي تحسين العمل سواء كانت هذه البيانات جداول اكسل او بيانات عبارة 100 مليون سجل في قاعدة بيانات، فإن الهدف دائمًا هو نفسه: اكتشاف ما وراء الداتا.. وهذا ما يجعل علم البيانات مختلفًا عن الإحصائيات التقليدية حيث إنه لا يشرح القيم فحسب، بل يحاول أيضًا التنبؤ بالمستقبل.

:باختصار وجد علم البيانات من اجل

:لنرى هذا المخطط التوضيحي البسيط

ما الذي يجب أن يعرفه عالم البيانات؟

– لتبدأ بالخوض بهذا العلم ، فعليك التعرف على المهارات التي يجب ان تتواجد عند عالم البيانات والتي هي جامعة لمهارات التحليل البياني ، والعلوم الاحصائية والبرمجية ، ومهارات التعلم الآلي

:سنتحدث عما سبق بشكل مختصر

القدرة على تحليل البيانات

عند المقارنة بين علوم البيانات وتحليل البيانات، نرى ان التشابه بينهما كلاهما يتمحور حول دراسة البيانات لإعطاء افضل النتائج التي تساهم في دعم القرارات المتمحورة حول نجاح البزنس.

الشيء المهم هو انه بينما يتعامل محلل البيانات مع معلومات ثابتة ومنظمة يمكن لعالم البيانات التعامل مع معلومات سريعة ومعقدة ومتعددة التنظيم نحصل عليها من مجموعة متنوعة من مصادر المعلومات فلبدء مشروع في علم البيانات، لا تحتاج إلى أن تكون محلل أعمال متخصص. ما تحتاجه هو أن يكون لديك أفكار واضحة حول النقاط الاساسية لهذا العلم.

:الإحصاء والاحتمال

الاحتمالات والإحصاء هما العمود الفقري لعلوم البيانات فالإحصاء بالاعتماد على الاحتمالات هو الرياضيات المستخدمة في عملية تحليل للبيانات وامكانية التنبؤ بالنتائج..

البرمجة

علم البيانات هو مجال عمل فريد من نوعه لأنه يجمع بين المهارات الإحصائية والكمية ومهارات البرمجة وبناءً على خلفيتك ومهاراتك يمكنك اختيار لغة البرمجة التي تريد استخدامها في عملية التحليل

: التعلم الالي والذكاء الاصطناعي

بما ان الذكاء الاصطناعي وعلوم البيانات يسيران جنبًا إلى جنب ، حيث يتضمن علم البيانات العمل مع كميات كبيرة من البيانات التي يجب إتقان تقنيات التعلم الآلي الخاصة بها مثل التعلم الآلي الخاضع للإشراف ، وأشجار القرار ، والانحدار اللوجستي ، وما إلى ذلك. ستساعدك هذه المهارات في حل مشاكل علوم البيانات المختلفة بناءً على نتائج التوقعات التي حصلت عليها عند تطبيق خوارزميات التعلم الالي

:اضافة الى ماسبق يجب لعالم البيانات ايضا ان يتمتع بمايلي

العقلية التحليلية-

التركيز على حل المشكلات-

المعرفة الكافية عن هذا المجال-

مهارات التواصل-

Advertisements
https://