الدرس الرابع (مقاييس الانتشار والإحصائيات الاستنتاجية)

¡Supera tus tareas y exámenes ahora con Quizwiz!

النص:ملخص الإحصائيات الوصفية

الخلاصة Variable Types We have covered a lot up to this point!We started with identifying data types as either categorical or quantitative.We then learned, we could identify quantitative variables as either continuous or discrete.We also found we could identify categorical variables as either ordinal or nominal. Categorical Variables When analyzing categorical variables, we commonly just look at the count or percent of a group that falls into each level of a category.For example, if we had two levels of a dog category:lab وأيضًا not lab.We might say, 32% of the dogs were lab (percent), or we might say 32 of the 100 dogs I saw were labs (count). However, the 4 aspects associated with describing quantitative variables are not used to describe categorical variables. Quantitative Variables Then we learned there are four main aspects used to describe quantitative variables: 1.Measures of Center 2.Measures of Spread 3.Shape of the Distribution 4.القيم الخارجية Measures of Center We looked at calculating measures of Center 1.المتوسطات 2.الوسيطات 3.المنوالات Measures of Spread We also looked at calculating measures of Spread 1.النطاق 2.مدى بين ربعين 3.الانحراف المعياري 4.التباين الشكل We learned that the distribution of our data is frequently associated with one of the three shapes: 1.الانحراف إلى اليمين 2.الانحراف إلى اليسار 3.Symmetric (frequently normally distributed) استنادًا إلى الشكل المرتبط بمجموعة البيانات لدينا، قد تكون بعض مقاييس Center أو الانتشار أفضل لتلخيص مجموعة بياناتنا. عندما تكون لدينا بيانات تتبع توزيعًا طبيعيًّا، يمكننا فهم مجموعة بياناتنا تمامًا باستخدام mean وstandard deviation. ومع ذلك، إذا تم انحراف مجموعة بياناتنا، فقد يكون 5 number summary (ومقاييس Center المرتبطة به) أفضل لتلخيص مجموعة بياناتنا. القيم الخارجية تعلمنا أن القيم الخارجية لها تأثير أكبر على مقاييس كالمتوسط عن مقاييس كالوسيط.تعلمنا أنه ينبغي لنا التعامل مع القيم الخارجية على أساس كل حالة على حدة.تشتمل الأساليب الشائعة على ما يلي: 1. ملاحظة وجودها على الأقل وتأثيرها على إحصائيات الملخص. 2. If typo - remove or fix 3. فهم سبب وجودها، والتأثير على الأسئلة التي نحاول الإجابة عنها بشأن بياناتنا. 4. Reporting the 5 number summary values is often a better indication than measures like the mean and standard deviation when we have outliers. 5. Be careful in reporting.Know how to ask the right questions. المدرجات التكرارية ومخططات box plot ألقينا نظرة أيضًا على المدرجات التكرارية ومخططات box plot لتمثيل بياناتنا الكمية مرئيًا.يكون تحديد القيم الخارجية والشكل المرتبطان بتوزيع بياناتنا أسهل عند استخدام تمثيل مرئي بدلاً من استخدام إحصائيات الملخص. What Next? حتى هذه النقطة، نكون قد ألقينا نظرة فقط على الإحصائيات الوصفية، نظرًا لأننا نصف بياناتنا المُجمّعة.في الأقسام النهائية من هذا الدرس، سنلقي نظرة على الفرق بين الإحصائيات الوصفية والإحصائيات الاستنتاجية.

فيديو:الشكل والقيم الخارجية

القيم الخارجية تعلمنا أن القيم الخارجية هي نقاط تقع بعيدًا جدًا عن بقية نقاط البيانات لدينا.يؤثر هذا في المقاييس مثل المتوسط والانحراف المعياري أكثر بكثير من المقاييس المرتبطة بملخص العدد خمسة. تحديد القيم الخارجية يوجد عدد من الأساليب المختلفة اللازمة لتحديد القيم الخارجية.تتوفّر ورقة كاملة متعلقة بهذا الموضوع هنا.بوجه عام، ألقي نظرة عادة على صورة وأحدد هل يبدو شيء ما مريبًا!

فيديو:الشكل الذي تأخذه البيانات في العالم

مراجع هذه هي المراجع المستخدمة في سحب تطبيقات كل شكل. Quora جامعة تكساس

اختبار: الإحصائيات الوصفية مقابل الاستنتاجية (الكعك)

Question 1 of 2 حدّدوا المجموعة (المجموعات) والمعلمة (المعلمات) والعينة (العينات) والإحصائية (الإحصائيات) للسيناريو أدناه: لنفترض أننا نمتلك محل كعك. ونحن نعرف أن متوسط قطر جميع الكعك الذي لدينا يبلغ 5.5 بوصة. ويتحرك المنافس بجوارنا مباشرةً! ونحن نهتم بما إذا كانوا يصنعون كعكات أكبر منا. وحصلنا على 100 كعكة من التي يصنعونها، ووجدنا أن متوسط قطرها يبلغ 6 بوصات. Statistic None Parameter Sample الوصف المصطلح 5.5 inches Parameter 6 inches Statistic All the bagels at our bagel shop. Population All the bagels at our competitor's bagel shop. Population The 100 bagels from the competitor's bagel shop. Sample Question 2 of 2 فيما يلي، طابقوا بين المصطلح والوصف الصحيح له. Population None Statistic Statistic الوصف المصطلح A numeric summary of a sample. Statistic A numeric summary of a population. Parameter Drawing conclusions regarding a population using information from a sample. Inference Drawing conclusions regarding a sample using information from a population. None A subset of a population. Sample Our entire group of interest. Population Frequently we do not know this value, so we must try and estimate. Parameter

الواجب المنزلي 1:الاختبار النهائي حول مقاييس Spread

Question 1 of 2 في مجموعة البيانات التالية، وصّل كل قيمة بالتسمية المناسبة: 15, 4, 3, 8, 15, 22, 7, 9, 2, 3, 3, 12, 6 Submit to check your answer choices! Term القيمة n 13 median 7 first quartile 3 third quartile 13.5 mean 8.4 mode 3 Question 2 of 2 For the following dataset, match each value to the appropriate label: 15, 4, 3, 8, 15, 22, 7, 9, 2, 3, 3, 12, 6 Submit to check your answer choices! Term القيمة interquartile range 10.5 range 20 variance 33.9 standard deviation 5.8 minimum 2 maximum 22

اختبار:الشكل والقيم الخارجية (ما التأثير؟)

Question 1 of 2 وصّلوا كل التوزيع بالعلاقة الصحيحة عند مقارنة المتوسط بالوسيط. Cannot be Determined. Shape مقارنة Right-skewed Mean is greater than the Median. Left-skewed Mean is less than the Median. Symmetric Mean is equal to the Median. Question 2 of 2 تحقق من أن كل ما يلي يجب أن يكون صحيحًا. Normally distributed data must have a mean equal the median. Histograms and box plots are both used to plot quantitative data. They cannot be used to plot categorical data. A box plot relates directly to the 5 number summary. ---------------- --------------- حاول مرة أخرى Oops! This one is tricky. If data are normally distributed, the mean must equal the median. However, any perfectly symmetric distribution will have a mean equal to the median.

مقاييس الانتشار (الحساب والوحدات)

Question 1 of 3 إذا قمنا بقياس التباين المرتبط بمبيعاتنا بالدولارات لكل شهر لمدة 3 سنوات، فما الوحدات المرتبطة بالتباين؟ Dollars Squared أدخلوا قيمة التباين لمجموعة البيانات التالية. (اعرض إجابتك على مكانين عشريين في نهاية عمليتك الحسابية). 1, 5, 10, 3, 8, 12, 4 13.55 أدخلوا قيمة الانحراف المعياري لمجموعة البيانات التالية. (اعرض إجابتك على مكانين عشريين في نهاية عمليتك الحسابية). 1, 5, 10, 3, 8, 12, 4 3.68

المستوى المتقدم: الانحراف المعياري والتباين

Question 1 of 3 لنفترض أن d1 وd2 مجموعتي بيانات يتم قياسهما بنفس الواحدات. ونحن نعرف أن الانحراف المعياري لمجموعة البيانات d1 يساوي 5 وتباين مجموعة البيانات d2 يساوي 36، فأي مما يلي يُعد صحيحًا بلا شك. يرجى وضع علامة على كل ما ينطبق. يكون التباين في d2 أكبر من d1 يكون الانحراف المعياري في d2 أكبر من d1. Question 2 of 3 إذا كان الانحراف المعياري لمجموعة بيانات يساوي صفرًا، فأي مما يلي ينبغي أن يكون صحيحًا؟ يجب أن تكون جميع نقاط البيانات متساوية. Question 3 of 3 بالنسبة إلى كل مما يلي: إذا كانت العبارة صحيحة، حدّدوا المربع بجوار العبارة. إذا كان لمجموعتي بيانات التباين نفسه، فسيكون لهما الانحراف المعياري نفسه كذلك.' ----------------- ---------------- Thanks for completing that! هذا صحيح! إضافةً إلى أن متوسط العائد لاستثمار ما، يجب أن نفكر أيضًا في الانتشار المرتبط بالعائد. لكن لمجرد أن الانحراف المعياري المرتبط بكل استثمار يكون متساويًا، فهذا لا يعني أن أقصى حد قد تصل إليه لكل استثمار يكون متساويًا. ---------------------- حاول مرة أخرى This one is tricky! The standard deviation of two investments could be the same despite having different maximums. Consider two datasets: 1, 2, 3, 4 and 5, 6, 7, 8. Different max, but same st. dev.

اختبار: الإحصائيات الوصفية مقابل الاستنتاجية (طلاب Udacity)

Quiz Question حدّدوا المجموعة والمعلمة والعينة والإحصائية للسيناريو أدناه: لنفرض أننا نهتم بمتوسط عدد الساعات التي يقضيها جميع طلاب Udacity في النوم (100000 طالب). ولقد أرسلت بريدًا إلكترونيًا لجميع طلاب Udacity، ولكن لم أستلم سوى 5000 رسالة بريد إلكتروني كاستجابة. وكان متوسط مقدار النوم الذي يقضيه أولئك الذين استجابوا يبلغ 6.8 ساعات من النوم. We cannot know for sure. 6.8 hours of sleep المصطلح الوصف Population All Udacity students Parameter We cannot know for sure. Sample 5,000 Udacity students Statistic 6.8 hours of sleep

فيديو:التعامل مع إشعاري حول القيم الخارجية

إشعار القيم الخارجية فيما يلي توجيهاتي الخاصة بالتعامل مع أي عمود (متغيّر عشوائي) في مجموعة البيانات الخاصة بي. 1. خططوا بياناتك لتحديد هل لديكم قيم خارجية. 2. معالجة القيم الخارجية وفقًا لذلك من خلال الطرق المذكورة أعلاه. 3.في حالة عدم وجود قيم خارجية واتباع بياناتك للتوزيع الطبيعي - استخدموا المتوسط والانحراف المعياري لوصف مجموعة البيانات الخاصة بكم، وأعلنوا أن البيانات موزّعة توزيعًا طبيعيًّا. ملاحظة جانبية إذا لم تكونوا متأكدين من توزيع البيانات الخاصة بكم توزيعًا طبيعيًّا، فهناك رسوم تُسمى رسوم التوزيع الكمي الطبيعية وطرق إحصائية مثل اختبار Kolmogorov - Smirnov الذي يهدف إلى مساعدتكم في فهم هل بياناتكم موزّعة توزيعًا طبيعيًّا أم لا.يتجاوز تنفيذ هذا الاختبار نطاق هذه الفئة، لكن يمكن استخدامه كحقيقة طريفة. 4. في حالة انحراف البيانات أو القيم الخارجية، استخدموا ملخص العدد خمسة لتلخيص بياناتكم والإبلاغ عن القيم الخارجية.

فيديو:التعامل مع القيم الخارجية

الأساليب الشائعة عندما تكون القيم الخارجية موجودة، ينبغي لنا مراعاة النقاط التالية. 1. يلاحظ وجودها وتأثيرها في إحصائيات الملخص. 2. إذا كان خطأ مطبعيًّا - فأزله أو أصلحه 3. فهم سبب وجودها، والتأثير في الأسئلة التي نحاول الإجابة عنها حول البيانات الخاصة بنا. 4. إنّ ذكر قيم ملخص العدد 5 غالبًا من المؤشرات الجيدة عن المقاييس كالمتوسط والانحراف المعياري عندما تكون لدينا قيم خارجية. 5. توخوا الحذر أثناء ذكرها.معرفة كيفية طرح الأسئلة الصحيحة.

النص:الملخص الوصفي مقابل الملخص الاستنتاجي

الإحصائيات الوصفية مقابل الإحصائيات الاستنتاجية In this section, we learned about how Inferential Statistics differs from Descriptive Statistics. Descriptive Statistics Descriptive statistics يتمحور حول وصف بياناتنا المُجمّعة باستخدام المقاييس التي تمت مناقشتها في هذا الدرس:مقاييس Center، ومقاييس Spread، وشكل توزيعنا، والقيم الخارجية.يمكننا أيضًا استخدام رسوم بياناتنا للحصول على أفضل فهم. Inferential Statistics Inferential Statistics is about using our collected data to draw conclusions to a larger population.يتطلب إجراء الإحصائيات الاستنتاجية بصورة جيدة أن نأخذ عينة تُمثّل مجموعتنا بأكملها محل الاهتمام بصورة دقيقة. ثمة طريقة شائعة لجمع البيانات وهي عبر الاستبيان.ومع ذلك، قد تكون الاستبيانات متحيزة للغاية استنادًا إلى أنواع الأسئلة المطروحة، وطريقة طرح الأسئلة.هذا موضوع ينبغي عليكم التفكير فيه عند معالجة المشروع الأول. We looked at specific examples that allowed us to identify the 1.Population - our entire group of interest. 2.Parameter - numeric summary about a population 3.Sample - subset of the population 4.Statistic numeric summary about a sample المضي قدمًا على الرغم من أننا لن نتعمق في الإحصائيات الاستنتاجية داخل هذه الدورة التدريبية، فإنكم الآن على دراية بالاختلاف بين هاتين الطريقتين من الإحصائيات.إذا أجريتم اختبار فرضية أو أنشأتم مسافات ثقة، فإنكم قد أجريتم إحصائيات استنتاجية.تتغيّر الطريقة التي نُجري بها الإحصائيات الاستنتاجية مع تطور التقنيات.تستهدف الكثير من المسارات الوظيفية التي تنطوي على تعلم الآلة والذكاء الاصطناعي استخدام البيانات المُجمّعة لاستخلاص الاستنتاجات حول المجموعات بأكملها على المستوى الفردي.إنها لحظة استثنائية لاعتبار الوقت جزءًا من هذا الحيز، وأنتم الآن تبلون بلاء حسنًا في طريق الانضمام إلى الممارسين الآخرين!

الفيديو: مقدمة إلى الانحراف المعياري والتباين

الانحراف المعياري والتباين يمثل الانحراف المعياري أحد المقاييس الأكثر شيوعًا للتحدث عن انتشار البيانات. ويُعرف بأنه متوسط المسافة لكل مشاهدة من المتوسط. في الفيديو أعلاه، رأينا إلى أي مدى كان الطلاب يبعدون عن متوسط المسافة من العمل. وفي الفيديو التالي، سترون بالتحديد كيف يتم حساب ذلك."

النص:ملخص مقاييس Center والانتشار

الخلاصة أنواع المتغيرات لقد تناولنا الكثير حتى هذه النقطة!بدأنا بتحديد أنواع البيانات إما categorical أو quantitative.تعلمنا بعد ذلك أنه يمكننا تحديد المتغيّرات الكمية إما continuous أو discrete.وجدنا أيضًا أنه يمكننا تحديد المتغيّرات المصنّف إما ordinal أو nominal. المتغيّرات المصنّفة عند تحليل المتغيّرات المصنّفة، نُلقي عادة نظرة فقط على عدد المجموعات أو نسبتها المئوية التي تقع في كل مستوى للفئة.على سبيل المثال، إذا كان لدينا مستويان من فئة الكلاب:lab وأيضًا not lab.قد نقول إن 32% من الكلاب كانت lab (نسبة)، أو قد نقول إن 32 من أصل 100 كلب رأيتها كانت في المختبرات (عدد). ومع ذلك، فإن الجوانب الأربعة المرتبطة بوصف المتغيّرات الكمية غير مستخدمة في وصف المتغيّرات المصنّفة. المتغيّرات الكمية بعد ذلك، تعلمنا أن هناك أربعة جوانب أساسية مستخدمة لوصف المتغيّرات quantitative: 1.مقاييس Center 2.مقاييس Spread 3.شكل التوزيع 4.القيم الخارجية ألقينا نظرة على حساب مقاييس Center 1.المتوسطات 2.الوسيطات 3.المنوالات ألقينا أيضًا نظرة على حساب مقاييس Spread 1.النطاق 2.مدى بين ربعين 3.الانحراف المعياري 4.التباين حساب التباين رأينا أنه كان بمقدورنا حساب variance كـ: 1n∑i=1n(xi−x¯)2\bold{\frac{1}{n}\sum\limits_{i=1}^n(x_i - \bar{x})^2}n1​i=1∑n​(xi​−x¯)2 سترون أيضًا: 1n−1∑i=1n(xi−x¯)2\bold{\frac{1}{n-1}\sum\limits_{i=1}^n(x_i - \bar{x})^2}n−11​i=1∑n​(xi​−x¯)2 والسبب في ذلك هو خارج نطاق ما تناولناه حتى الآن، ولكن يمكنكم العثور على تفسير هنا. يمكنكم عادة إيجاد إجابات لأسئلتكم بسرعة البحث في Google.الآن هو وقت جيد لبدء هذا التدريب العملي!ينبغي أن تكون هذه الإجابة أكثر منطقية عند الانتهاء من هذا الدرس. الانحراف المعياري مقابل التباين The standard deviation is the square root of the variance.في التدريب العملي، تستخدمون عادة الانحراف المعياري بدلاً من التباين.يرجع سبب هذا إلى أن الانحراف المعياري يُشارك الوحدات نفسها مع بياناتنا الأصلية، بينما يكون لدى التباين وحدات مربعة. ما التالي؟ في الجلسات التالية، سنلقي نظرة على آخر جانبين من المتغيّرات الكمية:الشكل والقيم الخارجية.ما نعرفه عن مقاييس Center ومقاييس Spread من شأنه أن يساعد على فهم هذين الجانبين النهائيين.

فيديو:الشكل

المدرجات التكرارية تعلمنا كيفية إنشاء المدرج التكراري في هذا الفيديو، لأن هذا هو التمثيل المرئي الأكثر شيوعًا للبيانات الكمية. الشكل في المدرج التكراري، يمكننا تحديد شكل بياناتنا بسرعة، وهذا يساعدنا على التأثير في جميع المقاييس التي تعلمناها في المفاهيم السابقة.تعلمنا أن توزيع بياناتنا يرتبط غالبًا بواحد من الأشكال الثلاثة: 1.الانحراف إلى اليمين 2.الانحراف إلى اليسار 3.متماثل (غالبًا ما يتم التوزيع بصورة طبيعية) الملخص الشكل المتوسط مقابل الوسيط تطبيقات واقعية متماثل (عادي) المتوسط يساوي الوسيط الارتفاع، والوزن، والأخطاء، والهطول الانحراف إلى اليمين المتوسط أكبر من الوسيط كمية الدواء المتبقية في تدفق الدم، الوقت بين المكالمات الهاتفية في مركز الاتصال، الوقت حتى توقف المصباح الكهربائي الانحراف إلى اليسار المتوسط أقل من الوسيط الدرجات في صورة نسبة مئوية في العديد من الجامعات، العمر عند الوفاة، تغيّر سعر الأصل يكون منوال التوزيع في الأساس هو الشريط الأطول في المدرج التكراري.قد توجد منوالات متعددة استنادًا إلى عدد القمم في مدرجنا التكراري.

الفيديو: المدرجات التكرارية

المدرجات التكرارية تُعد المدرجات التكرارية مفيدة للغاية لفهم جوانب مختلفة من البيانات الكمية. وفي المفاهيم القادمة، سترون مدرجات تكرارية تُستخدم طوال الوقت لمساعدتكم على فهم الجوانب الأربعة التي وضّحناها سابقًا بشأن المتغير الكمي: المركز الانتشار الشكل القيم الشاذة"

الاختبار: الانحراف المعياري والتباين المنطبقين

بيانات الاستثمار لنفترض أن لدينا فرصتي استثمار: العوائد السنة 1 السنة 2 السنة 3 السنة 4 السنة 5 السنة 6 الاستثمار 1 5% 5% 5% 5% 5% 5% الاستثمار 2 12% -2% 10% 0% 7% 3% تم توضيح العوائد لمدة 6 سنوات متتالية لكل استثمار أعلاه. استخدموا المعلومات للإجابة على الأسئلة أدناه. ما متوسط العائد للاستثمار 1؟ (اكتبوا إجابتكم بالنسبة المئوية دون استخدام علامة النسبة المئوية - مثال: يجب تقديم النسبة 9% على أنها 9 أو 93% على أنها 93.) 5 ما متوسط العائد للاستثمار 2؟ (اكتبوا إجابتكم بالنسبة المئوية دون استخدام علامة النسبة المئوية - مثال: يجب تقديم النسبة 9% على أنها 9 أو 93% على أنها 93.) 5 بيانات الاستثمار في السؤالين السابقين، ينبغي أن تكونوا قد وجدتم أن هذه الاستثمارات لها نفس الوسط! أي أنه بصرف النظر عن فرصة الاستثمار التي تختارونها، فمن المتوقع أن تحصلوا على نفس المقدار. إذن ما أوجه الاختلاف بينها؟ لنلقِ نظرة على بعض الأسئلة الإضافية لنرى ما إذا كان يمكننا إيجاد بعض الاختلافات. تم تقديم نفس البيانات مجددًا كما ورد أعلاه (لتقليل التمرير). العوائد السنة 1 السنة 2 السنة 3 السنة 4 السنة 5 السنة 6 الاستثمار 1 5% 5% 5% 5% 5% 5% الاستثمار 2 12% -2% 10% 0% 7% 3% تم توضيح العوائد لمدة 6 سنوات متتالية لكل استثمار أعلاه. استخدموا المعلومات للإجابة على الأسئلة أدناه." Question 3 of 4 باستخدام المعلومات أعلاه، حدّدوا جميع العبارات الصحيحة التالية. The risk associated with investment 1 is lower than the risk associated with Investment 2. The standard deviation associated with Investment 1 is smaller than the standard deviation associated with Investment 2. Question 4 of 4 اعتمادًا على البيانات التي تمت مشاهدتها، أي من الاستثمارين أعلاه ينطوي على أفضل فرصة لكسب أكثر من 7%؟ Investment 2 رؤية مفيدة يُعد المثال المذكور أعلاه نسخة مبسّطة من الواقع، ولكنه يشير إلى شيء مفيد ربما تكونوا قد سمعتم عنه من قبل. ولاحظوا أنكم إذا لم تستثمروا بشكل كامل في الاستثمار 1 أو الاستثمار 2، ولكن في المقابل كنتم متنوعين عبر كلا خياري الاستثمار، فيمكنكم كسب ما يزيد عن أحدهما بشكل فردي. وهذه فائدة تنوع محفظتكم الاستثمارية لتحقيق أرباح طويلة الأجل. أما بالنسبة إلى الأرباح قصيرة الأجل، فربما لا تحتاجون إلى التنوع أو ترغبون فيه. وقد يحالفكم الحظ وتحققون أرباحًا قصيرة الأجل مرتبطة بفترات الانتعاش (12% أو 10% أو 7%) من الاستثمار 2. إضافةً إلى ذلك، قد لا يحالفكم الحظ وتعانون من الركود الاقتصادي ولا تكسبون شيئًا أو حتى تخسرون المال على استثماركم باستخدام هذه الإستراتيجية نفسها.

الفيديو: مقدمة إلى ملخص الأعداد الخمسة

حساب ملخص الأعداد الخمسة يتكون ملخص الأعداد الخمسة من 5 قيم: النهاية الصغرى: أصغر عدد في مجموعة البيانات. \bold{Q_1}: القيمة التي تبلغ 25% من البيانات فأقل. \bold{Q_2}: القيمة التي تبلغ 50% من البيانات فأقل. \bold{Q_3}: القيمة التي تبلغ 75% من البيانات فأقل. النهاية العظمى: أكبر قيمة في مجموعة البيانات. في الفيديو أعلاه، رأينا أن حساب كل من هذه القيم كان يتمثل بشكل أساسي في إيجاد الوسيط من عدد من مجموعات البيانات المختلفة فقط. ولأننا نحسب في الأساس مجموعة من الوسيطات، فإن العملية الحسابية تعتمد على ما إذا كان لدينا عددًا فرديًا أو زوجيًا من القيم. المدى يتم بعد ذلك حسابالمدى على أنه الفرق بين النهاية العظمى والنهاية الصغرى. المدى الربيعي يتم حساب المدى الربيعي على أنه الفرق بين \bold{Q_3} و \bold{Q_1}. وفي الأقسام التالية، ستتدربون على هذا مع كاتي وبأنفسكم."

الفيديو: الإحصائيات الوصفية مقابل الاستنتاجية

في هذا الدرس، تعلمنا كيف تختلف الإحصائيات الاستنتاجية عن الإحصائيات الوصفية. الإحصائيات الوصفية `لإحصائيات الوصفية\" تتعلق بوصف البيانات التي تم جمعها. الإحصائيات الاستنتاجية `الإحصائيات الاستنتاجية\" تتعلق باستخدام البيانات التي تم جمعها لاستخلاص نتائج لمجموعة أكبر. لقد تناولنا أمثلة محددة مكّنتنا من تحديد المجموعة - إجمالي المجموعة التي نهتم بها. المعلمة - الملخص الرقمي بشأن مجموعة ما العينة - مجموعة فرعية من المجموعة الإحصائية - الملخص الرقمي بشأن العينة"

النص: مقدمة إلى الانحراف المعياري والتباين

مقاييس أخرى للانتشار ملخص الأعداد الخمسة في الأقسام السابقة، رأينا كيفية حساب القيم المرتبطة بملخص الأعداد الخمسة (النهاية الصغرى، Q1Q_1Q1​, Q2Q_2Q2​, Q3Q_3Q3​ النهاية العظمى)، إضافةً إلى مقياس الانتشار المرتبط بهذه القيم (المدى والمدى الربيعي). وبالنسبة إلى مجموعات البيانات غير المتماثلة، يعد ملخص الأعداد الخمسة والرسم الصندوقي المتماثل طريقة رائعة للبدء في فهم انتشار بياناتكم. ورغم أنني لا زلت أفضّل المدرج التكراري في معظم الحالات، إلا أن الرسومات الصندوقية يمكن أن يكون من الأسهل مقارنتها بمجموعتين أو أكثر. وستطلعون على هذا في الاختبارات قرب انتهاء هذا الدرس. التباين والانحراف المعياري هناك مقياسان آخران من مقاييس الانتشار يُستخدمان طوال الوقت وهما التباين والانحراف المعياري. وللوهلة الأولى، يمكن أن يبدو التباين والانحراف المعياري معقدان. فإذا لم تفهموا المعادلات أدناه، فلا تنزعجوا! وفي هذا القسم، لا أريد سوى تقديم نظرة عامة لكم عن الأقسام التالية التي سنناقشها. وسنتناول جميع هذه الأجزاء بشكل شامل في الأقسام القليلة التالية، لكن الفكرة الرئيسية هي معرفة ما يلي: فهم كيفية حساب المتوسط والتباين. إدراك السبب في أن العمليات الحسابية للمتوسط والتباين أمر منطقي لمعرفة انتشار بياناتنا. الحقول التي قد ترون فيها هذه القيم مستخدمة. لماذ قد نستخدم الانحراف المعياري أو التباين مقارنة بالقيم المرتبطة بملخص الأعداد الخمسة بالنسبة إلى مجموعة بيانات معينة. الحساب نقوم بحساب التباين بالطريقة التالية: 1n∑i=1n(xi−x¯)2\frac{1}{n}\sum\limits_{i=1}^n(x_i - \bar{x})^2n1​i=1∑n​(xi​−x¯)2 التباين هو متوسط حاصل تربيع الفرق بين كل مشاهدة والمتوسط. الانحراف المعياري هو الجذر التربيعي للتباين. لذلك، يبدو حساب الانحراف المعياري كما يلي: 1n∑i=1n(xi−x¯)2\sqrt{\frac{1}{n}\sum\limits_{i=1}^n(x_i - \bar{x})^2}n1​i=1∑n​(xi​−x¯)2 ​ لانحراف المعياري هو مقياس يحتوي على نفس الوحدات مثل بقية البيانات، ومحتويات التباين هي تربيع البيانات الأصلية لدينا. مرة أخرى، يعمل هذا القسم بمثابة تمهيد للمعلومات التي ستناقشونها في الأقسام العديدة المقبلة. فإذا لم يكن مفهومًا في المرة الأولى هذه، فلا تقلقوا. فستعملون خلال هذه العملية الحسابية وتبنون منهجية التفكير الإستراتيجي مع كاتي عند العمل على مثال باستخدام بيانات الراتب. ثم أعود لتقديم بعض السياقات المتعلقة بسبب أهمية هذه العمليات الحسابية والمواضع التي قد تجدونها بها!"

الفيديو: ما مقاييس الانتشار؟

مقاييس الانتشار تُستخدم مقاييس الانتشار لتقدم لنا فكرة عن كيفية انتشار البيانات الخاصة بنا من واحدة لأخرى. وتتضمن مقاييس الانتشار الشائعة ما يلي: المدى المدى الربيعي (IQR)‏ الانحراف المعياري التباين خلال هذا الدرس، ستتعلمون كيفية حساب هذه المقاييس، وكذلك السبب في أننا نستخدم مقياس انتشار معين فضلًا عن الآخر.

اختبار:الشكل والقيم الخارجية (مقارنة التوزيعات)

ملخص الصورة في الصورة أدناه، لدينا ثلاثة رسوم للمربع.يخصص كل رسم للمربع لزهرة سوسن مختلفة:setosa أو versicolor أو virginica.على المحور y، يتم إعطاؤنا طول الكأس.لاحظوا أن virginica يحتوي على قيمة خارجية باتجاه أسفل الرسم.ومن ثمّ، لا يُعطى الحد الأدنى بواسطة السطر السفلي هنا؛ وبدلاً من ذلك، يتم توفيره بواسطة هذه النقطة. Question 1 of 2 وصّل نوع زهرة السوسن المناسبة بالعبارة (العبارات) التي تكون صحيحة لطول الكأس. None Sepal Length نوع زهرة السوسن The largest Range Virginica The smallest Interquartile Range Setosa Median is approximately 5 Setosa Third quartile is approximately 6.3 Versicolor Approximately Symmetric All The largest sepals on average. Virginica Question 2 of 2 \'باستخدام بيانات الزهرة نفسها، حددوا جميع العبارات المذكورة أدناه التي يجب أن تكون صحيحة.\' More than 75% of the virginica flowers have a larger sepal length than the largest setosa flower. More than 50% of setosa flowers have larger sepal length than the shortest versicolor flower.

الفيديو: نقاط نهائية مهمة

نقاط نهائية مهمة يُستخدم التباين للمقارنة بين انتشار مجموعتين مختلفين. تكون مجموعة البيانات ذات تباين أعلى أكثر انتشارًا من مجموعة البيانات ذات تباين أقل. لذا كونوا حذرين، فربما توجد قيمة شاذة (قيم شاذة) فقط تُزيد التباين، عندما تكون معظم البيانات مقتربة جدًا في الواقع. عند مقارنة الانتشار بين مجموعتي بيانات، يجب أن تتطابق وحدات كل مجموعة. عندما تتعلق البيانات بالمال أو الاقتصاد، يرتبط التباين الأعلى (أو الانحراف المعياري) بالمخاطرة الأعلى. يُستخدم الانحراف المعياري غالبًا في الممارسة أكثر من التباين، وذلك لأنه يشارك وحدات مجموعة البيانات الأصلية. الاستخدام في العالم يرتبط الانحراف المعياري بمخاطر في مجال التمويل ويساعد في تحديد أهمية الأدوية في الدراسات الطبية ويقيس الخطأ في النتائج التي نحصل عليها للتنبؤ بأي شيء من كمية هطول الأمطار التي يمكننا توقُّع حدوثها غدًا إلى وقت تنقلكم المتوقع غدًا. تتجاوز هذه التطبيقات نطاق هذا الدرس حيث إنها تناسب مجالات معينة، لكن اعلموا أن فهم انتشار مجموعة معينة من البيانات أمر مهم للغاية للعديد من المجالات. ولقد أتقنتم خلال هذا الدرس العملية الحسابية لمقاييس الانتشار الأكثر شيوعًا.

الاختبار: التدريب على ملخص الأعداد الخمسة

هل تعلمون ملخص الأعداد الخمسة؟ لاحظوا أن مجموعة البيانات للمسائل الأربعة التالية تستخدم كلها نفس مجموعة البيانات. ما النطاق المرتبط بمجموعة البيانات التالية؟ 1, 5, 10, 3, 8, 12, 4, 1, 2, 8 11 بمعطى القيم أدناه، ما قيمة الربع الأول؟ 1, 5, 10, 3, 8, 12, 4, 1, 2, 8 2 بمعطى القيم أدناه، ما قيمة الربع الثالث؟ 1, 5, 10, 3, 8, 12, 4, 1, 2, 8 8 بمعطى القيم أدناه، ما قيمة الوسيط؟ (هذا مطابق للربع الثاني) 1, 5, 10, 3, 8, 12, 4, 1, 2, 8 4.5 هل تعلمون ملخص الأعداد الخمسة؟ لاحظوا أن مجموعة البيانات للمسائل الأربعة التالية تستخدم كلها نفس مجموعة البيانات. بمعطى القيم أدناه، ما قيمة الوسيط؟ (هذا مطابق للربع الثاني) 5, 10, 3, 8, 12, 4, 1, 2, 8, 5 بمعطى القيم أدناه، ما المدى؟ (يجب أن يكون المدى عدد فردي فقط) 5, 10, 3, 8, 12, 4, 1, 2, 8 11 بمعطى القيم أدناه، ما قيمة الربيع الأول؟ 5, 10, 3, 8, 12, 4, 1, 2, 8 2.5 بمعطى القيم أدناه، ما قيمة الربيع الثالث؟ 5, 10, 3, 8, 12, 4, 1, 2, 8 9


Conjuntos de estudio relacionados

Exploration and Conquest Unit Test Study

View Set