تعريف الإحصاء Statistics ما أهميته وأنواعه وأهم مبادئه؟ فمع تدفق البيانات المتعلقة بالمبيعات والاستثمار والميزانية وما إلى ذلك. يصبح من الضروري تحليلها بشكل دقيق واستخدام النتائج بأفضل طريقة ممكنة لتطوير الأعمال، والتي تتم من خلال إحدى طرق تحليل البيانات التي تعرف بالإحصاءات. وذلك بالاعتماد على النظريات الرياضية والحصول على عينة صغير من الحجم الكلي للبيانات لمراقبة سلوك تلك البيانات واستخلاص استنتاجات دقيقة حول البيانات الأكبر، والأحداث، واحتمالات حدوثها. نتيجةً لذلك سنتعرف عبر موقع تجارتي على تعريف الإحصاء، بالإضافة إلى أنواع الإحصاء وطرقه، كما سنقدم لكم الأمثلة ليكون شرحًا سهلًا ودقيقًا مستوفيًا لجميع المعلومات الواجب معرفتها عن الإحصاء وأهميته في حياتنا الواقعية فلنتابع سويةً.
المحتويات
- 1 تعريف الإحصاء Statistics
- 2 أهمية الإحصاء Statistics
- 3 أنواع الإحصاء Statistics
- 4 الإحصاء الوصفي والإحصاء الاستنتاجي
- 5 الإحصاء الحيوي biostatistics
- 6 أمثلة عن الإحصاء الحيوي biostatistics
- 7 الإحصاء التطبيقي Applied Statistics
- 8 الإحصاء الرياضي Mathematical Statistics
- 9 لماذا نحتاج علم الإحصاء في حياتنا
- 10 أنواع المتغيرات والبيانات في الإحصاء Variations in statistics
- 11 استخدامات الإحصاء Statistics
- 12 خصائص الإحصاء Statistics
- 13 أبرز مبادئ الإحصاء Statistics
- 14 مراحل الإحصاء Statistics
- 15 مفهوم بيانات الإحصاء Statistics
- 16 المستويات الإحصائية للقياس Measurement level in statistics
- 17 تحليل البيانات الإحصائية Statistical analysis of statistical data
- 18 مراحل تحليل البيانات الإحصائية Statistical data analysis
- 19 تقنيات أخذ العينات في الإحصاء Statistics
- 20 كيف يتم استخدام الإحصاء في الاقتصاد والتمويل Statistics in Economics
- 21 المتوسط والوسيط والوضع في الإحصاء Statistics
- 22 مقياس التشتت في الإحصاء Statistics
- 23 القيم المتطرفة في الإحصاء Statistics
- 24 تحليل البيانات الاستكشافي في الإحصاء Statistics
- 25 الاحتمالية في الإحصاء Statistics
- 26 طرق الإحصاء Statistics
- 27 الأحداث واحتمالاتها في الإحصاء Statistics
- 28 ما هو الغرض من الإحصاء Statistics
- 29 أمثلة عن الإحصاء Statistics
- 30 أنواع مصادر الإحصاءات
- 31 تعريفات إحصائية هامة
تعريف الإحصاء Statistics
الإحصاء (بالإنجليزية Statistics): هو فرع من فروع الرياضيات التطبيقية التي تتضمن الجمع والوصف والتحليل والاستنتاج بالاعتماد على البيانات الكمية. باستخدام النظريات الرياضية في الإحصاء التي تعتمد على حساب التفاضل، والتكامل، والجبر الخطي، ونظرية الاحتمالات.
يمثل تعريف الإحصاء دراسة جمع البيانات وتحليلها وتفسيرها وعرضها وتنظيمها بطريقة معينة وفق الطرق الرياضية المستخدمة في التحليلات المختلفة كالتحليل الرياضي، والجبر الخطي، ونظرية الاحتمال النظري للقياس، والمعادلات التفاضلية، والتحليل العشوائي. كما يرتبط جمع البيانات الرقمية وتصنيفها وتنظيمها وعرضها بالإحصاء، مما يساعد الأشخاص على فهم النتائج المختلفة والتنبؤ بعدة احتمالات للأحداث.
تناقش أنواع الإحصاء الإحصائيات والمعلومات والملاحظات والبيانات على شكل بيانات رقمية. مما يتيح المجال لرسم مؤشرات مختلفة للاتجاهات المركزية للبيانات، وتباعد القيم المختلفة عن المركز بمساعدة الإحصاء.
لذلك يهتم خبراء الإحصاء بتحديد كيفية استخلاص استنتاجات موثوقة حول الأحداث العامة بالاعتماد على السلوك والخصائص الأُخرى. التي يمكن ملاحظتها في العينات الصغيرة التي يتم عمل إحصائية عليها، حيث تمثل هذه العينات الصغيرة جزءًا من المجموعة الكبيرة أو عددًا محدودًا من الحالات لظاهرة عامة.
أهمية الإحصاء Statistics
تتمثل أهمية تعريف الإحصاء في أهمية وجوده، حيث يتم استخدام الإحصاء في جميع التخصصات العلمية تقريبًا مثل العلوم الفيزيائية والاجتماعية، كذلك في الأعمال التجارية، والعلوم الإنسانية، والحكومة، والتصنيع. إذ إن الإحصاء هو في الأساس من فروع الرياضيات التطبيقية، التي تطورت عبر تطبيق الأدوات الرياضية بما فيها حساب التفاضل والتكامل والجبر الخطي وصولًا لنظرية الاحتمالات.
في الممارسات العملية تمثل أنواع الإحصاء الفكرة التي يمكن التعرف عليها حول خصائص مجموعات كبيرة من الكائنات (السكان) أو الأحداث. من خلال دراسة عدد قليل من الأشياء أو الأحداث المتشابهة (عينة) المراد تحليلها، نظرًا لأنه في كثير من الحالات يكون جمع البيانات الشاملة حول أمر معين مكلفًا للغاية أو صعبًا أو حتى مستحيلًا. وهنا تعمل الإحصائية على ملاحظة جميع خصائص تلك العينة أو الظاهرة بسهولة وبتكلفة معقولة.
إن وجود أنواع الإحصاء أمر مهم جدًا للتخصصات الأكاديمية أو الممارسين الذين يعتمدون بشكل كبير على تحليل البيانات والأبحاث. كما توفر الإحصائيات المعلومات لفهم كيفية عمل الأشياء، وتُستخدم لإجراء البحوث، وتقييم النتائج، وتطوير التفكير النقدي، واتخاذ قرارات مستنيرة. ويمكن استخدام الإحصائيات للاستعلام عن أي مجال من مجالات الدراسة تقريبًا لمعرفة سبب حدوث الأشياء، ومتى تحدث، وما هي عوامل حدوثها، وما إذا كان تكرار حدوثها أمر وارد أم لا في ظل ظروف معينة.
كما يساعد الإحصاء على فهم الاتجاهات والأنماط العامة في مجموعة بيانات معينة، وتحليل البيانات، واستخلاص النتائج منها. ويمكن استخدامه لعمل تنبؤات حول أحداث والسلوكيات المستقبلية، وفهم كيفية تغير الأشياء بمرور الوقت مما يسمح بالتحكم بها.
أنواع الإحصاء Statistics
يتم استخدام نوعين من أنواع الإحصاء في تحليل البيانات وهما:
- الإحصاء الوصفي.
- الإحصاء الاستنتاجي.
حيث يقوم الإحصائيون بقياس وجمع البيانات حول الأفراد أو عناصر معينة. ثم يتم تحليل تلك البيانات لتوليد الإحصائية الوصفية ويمكنهم بعد ذلك استخدام تلك الخصائص المرصودة لبيانات العينة والتي تسمى (الإحصاءات) لعمل استنتاجات أو تخمينات حول الخصائص المجهولة أو (غير المقاسة) للمجتمع والمعروفة باسم المعلمات (المعطيات).
يعرف المجالان الرئيسيان في أنواع الإحصاء باسم (الإحصاء الوصفي) الذي يصف خصائص بيانات العينة والسكان، و(الإحصاء الاستنتاجي) الذي يستخدم الخصائص المرصودة في الإحصاء الوصفي لاختبار الفرضيات واستخلاص النتائج. حيث تشمل الإحصاءات الوصفية (المتوسط، التباين، الانحراف، التفرطح). أما الإحصائيات الاستدلالية تشمل (تحليل الانحدار الخطي، تحليل التباين ANOVA ، نموذج السجل/الاحتمالات، اختبار الفرضية الصفرية).
الإحصاء الوصفي descriptive statistics
يركّز الإحصاء الوصفي غالبًا على الاتجاه المركزي وتنوع وتوزيع بيانات العينة أي الاتجاه المركزي وتقدير الخصائص. لذلك هو عنصر نموذجي من أنواع الإحصاء لعينة أو مجموعة سكانية، يتضمن إحصاءات وصفية مثل المتوسط، والوسيط، والوضع. كما يشير المتغير إلى مجموعة من الإحصائيات التي توضح مقدار الاختلاف بين عناصر العينة أو المجموعة السكانية على طول الخصائص التي تم قياسها، وتتضمن مقاييس محددة مثل النطاق، والتباين، والانحراف المعياري.
يشير التوزيع إلى الشكل العام للبيانات والذي يمكن تصويره على مخطط مثل المدرج التكراري أو مخطط النقطة. ويتضمن خصائص مثل دالة توزيع الاحتمالات والانحراف والتفرطح. كما يمكن للإحصاءات الوصفية أن تصف الاختلافات بين الخصاص المرصودة لعناصر مجموعة البيانات.
تساعد الإحصائيات الوصفية ضمن أنواع الإحصاء على فهم الخصائص الجماعية لعناصر من عينة البيانات، وتشكل الأساس لاختبار الفرضيات وعمل التنبؤات باستخدام الإحصائيات الاستدلالية.
استخدامات الإحصاء الوصفي descriptive statistics
يمكن أن تكون الإحصائيات الوصفية مفيدة لغرضين وهما:
- توفير المعلومات الأساسية حول المتغيرات في مجموعة البيانات.
- تسليط الضوء على العلاقات المحتملة بين المتغيرات.
كما يمكن عرض الإحصائيات الوصفية الثلاثة (الاتجاه المركزي، والتشتت، والارتباط) بشكل بياني أو تصويري عبر:
- الطرق الرسومية أو التصويرية.
- مقاييس الاتجاه المركزية.
- مقياس التشتت.
- مقاييس الارتباط.
الإحصاء الاستنتاجي Inferential Statistics
هي عبارة عن أدوات يستخدمها الإحصائيون أو مراكز الإحصاء لتوليد استنتاجات حول خصائص السكان. تكون مستمدة من عينة محددة لتحديد مدى تأكدهم من موثوقية تلك الاستنتاجات بالاستناد إلى حجم العينة والتوزيع.
يمكن لخبراء الإحصاء حساب احتمالية أن الإحصاءات التي تقيس الاتجاه المركزي والتنوع والتوزيع والعلاقات بين الخصائص داخل عينة البيانات. توفّر صورة دقيقة للمعلمات (المعطيات) المقابلة للمجتمع بأكمله، والذي تم منه أخذ العينة لإنشاء إحصائية.
تستخدم الإحصائيات الاستدلالية لإجراء تعميمات حول المجموعات الكبيرة مثل تقدير متوسط الطلب على منتج من خلال مسح عينة من عادات الشراء لدى المستهلكين، أو لمحاولة التنبؤ بالأحداث المستقبلية المتعلقة بالمنتج. على سبيل المثال، توقع العائد المستقبلي أو فئة الأصول بناءً على العوائد في فترة العينة المأخوذة.
إن تحليل الانحدار في الإحصاء هو أسلوب يستخدم على نطاق واسع للاستدلال الإحصائي، ويستخدم لتحديد قوة وطبيعة العلاقة أو الارتباط بين متغير تابع واحد أو أكثر من متغير توضيحي مستقل. غالبًا ما يتم تحليل نتائج نموذج الانحدار من أجل الأهمية الإحصائية، والذي يشير إلى الادعاء بأن النتيجة من غير المحتمل أن تكون قد حدثت بشكل عشوائي أو بالصدفة. ولكن من المحتمل أن تُعزى إلى سبب محدد تم توضيحه بواسطة البيانات.
استخدامات الإحصاء الاستنتاجي Inferential Statistics
بينما يتم تلخيص الإحصائيات الوصفية على شكل مجموعة بيانات، يأتي دور الإحصاء الاستنتاجي الذي يساعد على التوصل إلى استنتاجات وإجراء تنبؤات بناءً على البيانات. وعندما تجمع البيانات من العينة يتم استخدام الإحصاءات الاستنتاجية لغرضين رئيسين وهما:
- عمل تقديرات حول السكان. على سبيل المثال، متوسط درجة sat لجميع طلاب الحادي عشر.
- اختبار الفرضيات لاستخلاص استنتاجات حول السكان. على سبيل المثال، العلاقة بين درجة sat ودخل الأسرة.
الإحصاء الوصفي والإحصاء الاستنتاجي
تتيح لك الإحصائيات الوصفية وصف مجموعة بيانات بينما تسمح لك الإحصائيات الاستدلالية عمل استنتاجات بناء على مجموعة بيانات. باستخدام الإحصائيات الوصفية يمكن الحصول على خصائص البيانات الخاصة بك:
- يتعلق التوزيع بتكرار كل قيمة.
- يتعلق الاتجاه المركزي بمتوسطات القيم.
- يتعلق التباين بكيفية انتشار القيم.
- في الإحصاء الوصفي لا يوجد عدم يقين فالإحصائيات تصف بدقة البيانات التي جمعتها ويمكن مقارنتها لاحقًا.
أما في الإحصائيات الاستنتاجية ففي معظم الأوقات لا يمكنك الحصول إلا على البيانات من العينات لأنه من الصعب جدًا أو المكلف جمع البيانات من جميع السكان. لذلك يساعدك الإحصاء الاستنتاجي بالاعتماد على الإحصاءات الوصفية من عمل تخمينات معقولة حول العينة المراد تحليلها، لكن من المهم استخدام طرق العينات العشوائية وغير المتحيزة.
الإحصاء الحيوي biostatistics
هو عبارة عن دراسات تعمل على تطوير أساليب إحصائية مبتكرة مع تطبيقات لفهم صحة الإنسان والأمراض بما في ذلك العلوم الطبية الحيوية الأساسية. ويجب أن تركز الدراسات على الأساليب والتطبيقات. من خلال تطبيق التقنيات الإحصائية على البحث العلمي في المجالات المتعلقة بالصحة. بما في ذلك الطب، والبيولوجيا، والصحة العامة، وتطوير أدوات جديدة لدراسة هذه المجالات. وقد أصبح اليوم الإحصاء الحيوي أداة لا غنى عنها في تحسين الصحة وتقليل الأمراض.
يعتبر الإحصاء الحيوي أمرًا أساسيًا لكل العلوم، لأن العلم يحتاج إلى جمع الأدلة وتقييمها لإصدار الحكم كما يساعد الإحصائيون الحيويون في الإجابة عن الأسئلة البحثية الملحة في الطب والبيولوجيا والصحة العامة. على سبيل المثال إذا كان الدواء الجديد يعمل أم لا، وما الذي يسبب السرطان والأمراض الأخرى؟ وما هي مدة بقاء الشخص على قيد الحياة وهو مصاب بمرض معين؟.
أمثلة عن الإحصاء الحيوي biostatistics
يعمل الإحصاء الحيوي على إيجاد الروابط بين المتغيرات الجينية وأمراض معينة. أما الآن وبعد أن أصبح تسلسل الجينوم رخيصًا نسبيًا بفضل الإحصاء، يجب أن يكون العلماء قادرين على تحديد الأسس الجينية للعديد من الأمراض البشرية والحصول على فهم أفضل بكثير للعلم مما كان ممكنًا من قبل، وهو ما يدور حوله الطب الدقيق والعلاج الموجه.
كما يستخدم الإحصائيون الحيويون مهاراتهم الكمية للعمل كفريق مع خبراء في مجالات أخرى من علماء الأحياء ومتخصصي السرطان إلى الجراحين وعلماء الوراثة. لكنهم هنا ليسوا مجرد مسجلين للأرقام بل إنهم يلعبون أدوارًا محورية في تصميم الدراسات لضمان جمع البيانات الكافية والنوع الصحيح من البيانات. كما يقومون بتحليل وتقييم وتفسير النتائج مع مراعاة المتغيرات والتحيزات والبيانات المفقودة على طول الطريق.
- أظهرت الدراسات أن العلاج المضاد للفيروسات يقلل من خطر انتقال فيروس نقص المناعة بين الجنسين بنسبة 96%.
- أظهرت الدراسات الأخرى أن الحقن فوق الجافية لنوع شائع من آلام الظهر، لم تحدث أي فرق تقريبًا بالنسبة للمرضى .
- إن استخدام الحمض النووي من أنياب الأفيال وروثها، لتحديد مكان حدوث الصيد الجائر في أفريقيا يتم عن طريق الإحصاء الحيوية.
تطوير وتصميم إطار البحث
هو استراتيجية للإجابة عن التساؤلات البحثية باستخدام البيانات التجريبية. للمساعدة في تطابق أساليبك مع أهدافك البحثية وأنك تستخدم النوع الصحيح من التحليل لبياناتك. لكن عليك رصد عينات دقيقة من البيانات والتأني في تحليلها على أن تكون صغيرة. وذلك لأن العينة الكبيرة تضيع الكثير من الوقت وقد تكون مكلفة.
إدارة ومراقبة البيانات
إن صياغة الخطط الإدارية للبيانات تحتاج إلى متابعة وتحديد احتمالات حدوث الأخطاء. مما يتطلب كمية ضخمة من الخبرة والوضوح في جمع البيانات وتحليلها، وتفسيرها، وعرضها.
الإحصاء التطبيقي Applied Statistics
هو أصل تحليلات البيانات وتتضمن ممارسة الإحصائيات التطبيقية تحليل البيانات المساعدة في تحديد احتياجات العمل. حيث تمتلئ أماكن العمل الحديثة بالبيانات الضخمة وتبحث عن الإحصائيين ومحللي البيانات وعلماء البيانات وغيرهم من المتخصصين الذين لديهم إحصاءات تطبيقية يمكنهم تنظيم بياناتها وتحليلها واستخدامها لحل مشاكل العالم الحقيقي.
مبادئ الإحصاء التطبيقي Applied Statistics
تشتمل مبادئ الإحصاء التطبيقي على ما يلي:
- صياغة وشرح أسئلة بحثية محددة ذات صلة بالموضوع.
- إيجاد حلول توفر إجابة آمنة وتفتح إمكانيات جديدة.
- تطوير إجراءات قياس تتسم بالكفاءة والموثوقية.
- تطوير الأساليب التحليلية بالبرمجيات المناسبة بعد مشكلة البحث الأولية.
- العرض الفعال وتصور الاستنتاجات.
- تحليل منظم لتسهيل تفسير البيانات من حيث الموضوعات وعلاقتها بالقاعدة المعرفية للمجال.
- تطوير مفاهيم وطرق مناسبة تساعد في حل المهام المذكورة.
كما يمكن أن يؤدي التحليل الصحيح لبيانات الشركة إلى زيادات ملحوظة في الكفاءة والربحية. وفي الواقع تظهر الدراسات أن الشركات التي تستخدم استراتيجيات تسويق تعتمد على البيانات لتشهد زيارات تصل إلى 20% في الإيرادات و 30% انخفاضًا في الإنفاق. يمكن للوكالات الحكومية والمنظمات غير الربحية والمنظمات الأخرى، استخدام البيانات للمساعدة في الوقاية من الأمراض، وجمع المعلومات الديموغرافية الهامة وتوجيه الحملات السياسية.
الإحصاء الرياضي Mathematical Statistics
هو فرع من فروع الرياضيات يتعامل مع دراسة جمع البيانات وتحليلها وتقديمها بطريقة معينة ويتم استخدامها بشكل أساسي لفهم البيانات والتركيز على التطبيقات المختلفة. وقد يتم استخدامها في جمع وتحليل الحقائق والبيانات حول اقتصاد أو السكان في دولة محددة. كما تطبق الإحصائيات الرياضية تقنيات رياضية مثل الجبر الخطي، والمعادلات التفاضلية، والتحليل الرياضي، ونظريات الاحتمال.
لماذا نحتاج علم الإحصاء في حياتنا
يعد الإحصاء في الحياة اليومية حقيقة حاضرة تمس جميع جوانب المجتمع، خصوصًا في السنوات الأخيرة. التي قام بها الإحصائيون الحديثون بتطبيقات متقدمة للإحصاء من خلال مناهج مبتكرة لحل المشكلات.
ترتبط أهمية تحليل البيانات والإحصاءات التطبيقية بكل مجال من مجالات حياتنا تقريبًا. ومع استمرار تطور مجال الإحصاء التطبيقي يتوسع نطاق الإحصاء في الحياة اليومية في المجالات التالية:
الإحصاء في الحكومة
حيث يتم وصف مؤسسات الإحصاء في كافة البلدان بأنها عنصر لا غنى عنه في نظام المعلومات لمجتمع ديمقراطي. كما يتم استخدام الإحصاء في إدارة الحملات الانتخابية لاستهداف التركيبة السكانية للناخبين، وقياس معدلات الموافقة على الناخبين والتنبؤ بالانتخابات.
الإحصاء في الرعاية الصحية
الإحصائيون هم من كبار المشاركين في علم العقاقير لأنهم يشاركون في اكتشاف واختبار واعتماد وتسويق أحد الأدوية. وقد يعملون في مجال الصحة العامة للوكالات الحكومية ويساعدون في التثقيف بشأن مسائل صحة المجتمع وتطوير العلاجات الوقائية والسيطرة عليها. كما يضطلع الإحصائيون على علم الأوبئة ويعملون في مجالات عدة مثل التغذية والعلوم البيئية للمساعدة في مراقبة البيانات المتعلقة بالصحة والإبلاغ عنها. فضلًا عن تقديم المبادرات الصحية والدعوة إليها.
الإحصاء في التمويل والبنوك
تؤثر تطبيقات الإحصاء على التمويل البنكي في مستويات عديدة على المستوى الشخصي والعالمي. ويستخدم الأفراد الإحصائيات لاتخاذ القرارات في التخطيط المالي والميزانية، بينما تسترشد المنظمات بالإحصاءات في قرارات السياسة. لذلك تستخدم البنوك الإحصائيات لتقليل المخاطر في عمليات الإقراض وتحليل النشاط في السوق المالية والتنبؤ بتأثير الأزمات الاقتصادية. كما يستخدم المستثمرون الإحصائيات لفهم مخاطر وإمكانات بعض الأسهم مما يساعدهم على اتخاذ قرارات استثمارية مستنيرة.
الإحصاء في القانون
غالبًا ما تساعد الإحصائيات على تطوير التشريعات، ويمكن أن توجه أيضًا في تفسير القوانين وقد يقدم الإحصائيون شهادة الخبراء في قضايا المحاكم التي تتضمن تفاصيل مثل الفروق في الراتب واختبار الحمض النووي ومجموعات الأمراض واستطلاعات المستهلك. على سبيل المثال، تم معالجة أسئلة تتعلق بجمع بيانات العرق والإثنية، كما تزود مشاريع البيانات مثل هذه الأنظمة القانونية بمعلومات مهمة لتعزيز العدالة والمساواة.
الإحصاء في التسويق الرقمي
إن الإحصاء التطبيقي هو القوة الدافعة في تحويل مناهج التسوق المعاصرة وظهور البيانات الضخمة. وهذا يعني أن الشركات تجمع كميات هائلة من المعلومات من المستهلكين، وتستخدم الشركات هذه المعلومات للتنبؤ بالمبيعات وجمع اهتمامات العملاء، وتحليل فعالية مبادرات التسويق. كما يوفر الإحصاء في الحياة اليومية استراتيجية عالية الاستهداف تعتمد على البيانات.
إن مراقبة البحث المدفوع للحملات الإعلانية يتم بالاستناد إلى أهداف مؤشرات الأداء الرئيسية، والخطوط الأساسية، وتحليل البيانات، لتحسين أداء الحملة الإعلانية وفهم كيفية قراءة تحليلات مواقع الويب وتفسيرها.
الإحصاء في الوسائط الاجتماعية
أدى ظهور وسائل التواصل الاجتماعي إلى خلق بيئة ترتبط فيها أعداد كبيرة من الأشخاص والمنظمات في إطار تكنولوجي معقد. على سبيل المثال، في فيلم “The Social Dilemma,” يشارك خبراء الإحصاء ما يدور خلف شاشات وسائل التواصل الاجتماعي، ويوضح الفيلم أن كل ما يفعله المستخدمون عبر الإنترنت “تتم مشاهدته”.
يراقب مديرو وسائل التواصل الاجتماعي حركة المرور العضوية والمدفوعة إلى ملفات تعريف الوسائط الاجتماعية، ويحللون البيانات لتنمية المتابعين وزيادة المشاركة والتحويلات. وتستخدم الشركات البيانات للاستهداف الدقيق وقياس الاتجاهات ومراقبة المنافسين.
أنواع المتغيرات والبيانات في الإحصاء Variations in statistics
إن البيانات هي قياس محدد لمتغير وهي القيمة التي تسجلها في ورقة البيانات الخاصة بك. حيث تنقسم البيانات بشكل عام إلى فئتين وهما:
- البيانات الكمية وتمثل المبالغ.
- البيانات الفئوية وتمثل التجمعات.
أما المتغير الذي يحتوي على بيانات كمية فهو متغير كمي، والمتغير الذي يحتوي على بيانات فئوية هو متغير فئوي ويمكن تقسيم كل من هذه المتغيرات إلى أنواع أُخرى.
المتغيرات الفئوية categorical variables
تتمثل المتغيرات الفئوية تجمعات من نوع ما ويتم تسجيلها أحيانًا كأرقام. لكن تلك الأرقام تمثل فئات بدلًا من مقادير فعلية للأشياء، وهناك ثلاثة أنواع من المتغيرات الفئوية المتغيرات الثنائية والاسمية والترتيبية وهي:
- المتغيرات الفئوية الثنائية: وهي النتائج بنعم أو لا. على سبيل المثال، لعبة رؤوس أو ذيول في قلب العملة، أو الفوز والخسارة في مباراة كرة القدم.
- المتغيرات الفئوية الاسمية: وهي مجمعات ليس بينها ترتيب. على سبيل المثال، الأسماء، والأنواع، والألوان، والعلامات التجارية.
- المتغيرات الفئوية الترتيبية: وهي المجموعات التي تم تصنيفها بترتيب معين. على سبيل المثال، مكان الانتهاء في السباق أو استجابات مقياس التصنيف في استطلاع معين.
المتغيرات المربكة confusing variables
وهي متغيرات تخفي التأثير الحقيقي لمتغير آخر في التجربة. وذلك عندما يرتبط متغير آخر ارتباطًا وثيقًا بمتغير تهتم به لكنك لم تتحكم به في تجربتك. على سبيل المثال، قد يؤثر حجم الوعاء ونوع التربة على بقاء النبتة حيّة بقدر أو أكثر من إضافة المغذيات إلى التربة. ويمكن التعامل مع مثل تلك المتغيرات المربكة في الحفاظ على ثباتها.
المتغيرات الكامنة latent variables
وهي متغيرات لا يمكن قياسها بشكل مباشر، ولكن يمكن تمثيلها عبر وكيل. على سبيل المثال، لا يمكن قياس تحمل الملح في النباتات بشكل مباشر، ولكن يمكن الاستدلال عليه من قياسات صحة النبات في تجربة إضافة الملح إلى التربة.
المتغيرات المركبة Compound variables
وهي متغيرات يتم تكوينها من خلال الجمع بين متغيرات متعددة في التجربة، ويتم إنشاء هذه المتغيرات عند تحليل البيانات وليس عند قياسها. على سبيل المثال، يمكن دمج المتغيرات الثلاثة في نتيجة واحدة لصحة النبات لتسهيل تقديم نتائجك.
المتغيرات المستقلة independent variables
هو المتغير الذي تعتقد أنه السبب في الحدث بينما المتغير التابع هو السبب والمتغير المستقل هو النتيجة. على سبيل المثال، المتغير المستقل هو كمية العناصر الغذائية المضافة إلى حقل المحاصيل.
المتغيرات التابعة dependent variables
إن المتغير التابع هو أساس المادة. على سبيل المثال، هو الكتلة الحيوية للمحاصيل وقت الحصاد.
المتغيرات النوعية qualitative variables
وهي سمات محددة تكون غير رقمية غالبًا، والعديد من الأمثلة الواردة في مثال السيارة هي متغيرات نوعية. ومن الأمثلة الأخرى على المتغيرات النوعية في الإحصاء هو الجنس، أو لون العين، أو مكان الميلاد (بالنسبة للسكان). يتم استخدام المتغيرات النوعية لتحديد النسبة المئوية للنتيجة التي تحدث لأي متغير نوعي معين وتحليله.
المتغيرات الكمية Quantitative variables
حيث يتم دراسة المتغيرات الكمية عدديًا، ويكون لها وزن فقط عندما تكون حول واصف غير رقمي على غرار التحليل الكمي. ويمكن تقسيم المتغيرات الكمية إلى فئتين اثنين وهما:
-
- المتغيرات المنفصلة discrete variables: التي لها قيود في الإحصاء وبالتالي نستنتج أن هناك فجوات بين قيم المتغيرات المنفصلة المحتملة. على سبيل المثال، إن عدد النقاط المسجلة في لعبة كرة القدم هو متغير منفصل، وذلك لأنه لا يمكن أن يكون هناك كسورًا عشرية، كما أنه من المستحيل أن يسجل فريق نقطة واحدة فقط.
- المتغيرات الكمية المستمرة Continuous quantitative variables: التي تعمل على مؤشرات القياس في الإحصاء. في حين أن القيم المنفصلة لها حدود، وغالبًا ما يتم قياس المتغيرات الكمية المستمرة من خلال الكسور العشرية. أي أنه عند ارتفاع عدد لاعبي كرة القدم، يمكن الحصول على أي قيمة ضمن الحدود الممكنة، ويمكن قياس الارتفاعات بما يصل إلى 1/16 من البوصة إن لم يكن أكثر.
علمًا أنه في بعض الأحيان يمكن أن يكون المتغير أكثر من نوع واحد، ويمكن أيضًا استخدام المتغير الترتيبي كمتغير كمّي إذا كان المقياس رقميًا ولا يحتاج إلى الاحتفاظ به كأعداد صحيحة منفصلة. على سبيل المثال، تعتبر تصنيفات النجوم في مراجعات المنتجات ترتيبية (من 1 إلى 5 نجوم) ولكن متوسط التصنيف بالنجوم هو متغير كمّي.
استخدامات الإحصاء Statistics
بعد التعرف على تعريف الإحصاء، لنتعرف على وظائفه التي تتمثل فيما يلي:
- يساعد الإحصاء في جمع البيانات حول الكمية المناسبة.
- يصور الإحصاء البيانات المعقدة في شكل رسومي وشكل جدولي وفي تمثيل بياني لفهمها بسهولة وسرعة.
- يوفر الإحصاء الوصف الدقيق لفهم أفضل.
- يساعد في تصميم التخطيط الفعال والسليم للاستعلام الإحصائي في أي مجال.
- يعطي استنتاجات صحيحة مع مقاييس الموثوقية حول معلمات السكان من بيانات العينة.
- يساعد على فهم نمط التباين من خلال الملاحظات الكمية.
إن الإحصاء جزء لا يتجزأ من حياتنا الواقعية ويتم استخدامه في مكان العمل والحياة اليومية. غالبًا ما تُستخدم أنواع الإحصاء لتحليل ما هي أفضل استراتيجية للتسويق للشركة، أو كيفية توزيع العمل بين الموظفين وفي الحياة اليومية. كما يمكن استخدام الإحصاء لتحليل الطعام الذي يجب عليك شراؤه من المتجر، أو مقدار الأموال التي يجب أن تنفقها على شراء تلك السلع أسبوعيًا. وبذلك يكون الإحصاء موجود في كل مكان ليساعدنا على فهم وترتيب الأحداث والعالم من حولنا.
خصائص الإحصاء Statistics
في سياق الحديث عن تعريف الإحصاء، سنتعرف على خصائص الإحصاء التي هي كما يلي:
- يتم التعبير عن الإحصائيات عدديًا.
- يمتلك الإحصاء مجموعة من الحقائق.
- يجمع الإحصاء البيانات بترتيب منتظم.
- تكون بيانات الإحصاء قابلة للمقارنة مع بعضها البعض.
- تجمع البيانات لغرض إنشاء مخطط.
أبرز مبادئ الإحصاء Statistics
إن تعريف الإحصاء يحتوي على مبادئ للإحصاء وهي:
- طرق جمع البيانات: وهي وصف السمات الرئيسية للطرق الصالحة لجمع البيانات.
- عروض رسومية: وهي إنشاء وتفسير العروض الرسومية لمجموعة بيانات معينة.
- المتغيرات العشوائية وتوزيعات العينات: هو وصف توزيع المتغيرات العشوائية، ووسائل العينة، ونسب العينة.
- حساب الاحتمالات: وذلك باستخدام خصائص توزيعات العينات الخاصة بهم.
- العلاقة بين المتغيرات: وهي فحص العلاقة بين متغيرين كميين، ومتغيرين فئويين، ومتغير فئوي وكمي.
- تفسير المعلمات(المعطيات) السكانية: باستخدام فترات الثقة والتنبؤ.
- اختبار الفرضيات: عن طريق تقييم الادعاءات حول المعلمات السكانية باستخدام اختبارات الأهمية.
- الإجراء الإحصائي المناسب: ويتم استخدامه في مشكلة بحث معينة قد تواجه الإحصائي.
مراحل الإحصاء Statistics
إن الإحصاء يمر بعدة مراحل وهي:
- تجميع البيانات: وهي الخطوة الأولى في التحليل الإحصائي حيث يتم جمع البيانات بطرق مختلفة حسب الحالة.
- تنظيم البيانات المرصودة: وهي عملية تنظيم البيانات التي تم جمعها بطريقة هادفة لتسهيل فهم جميع البيانات.
- عرض البيانات: هي عملية تبسيط البيانات وتقديمها في شكل جداول أو رسوم بيانية أو مخططات.
- تحليل البيانات: إن التحليل مطلوب في الإحصاء للحصول على النتائج الصحيحة. غالبًا ما يتم إجراؤه باستخدام مقاييس الميول المركزية وقياسات التشتت، والارتباط، والانحدار، والاستيفاء.
- تفسير البيانات: وهي المرحلة الأخيرة حيث يتم سن الاستنتاجات من خلال استخدام المقارنات، وعلى هذا الأساس تتولد التنبؤات.
مفهوم بيانات الإحصاء Statistics
إن جذر الإحصاء مدفوع بالمتغيرات، والمتغير هو عبارة عن مجموعة بيانات يمكن حسابها لتمييز خاصية أو سمة لعنصر ما أو لمجموعة معينة. على سبيل المثال، يمكن أن تحتوي السيارة على متغيرات مثل الطراز، أو السنة، أو الأميال الممشية، أو اللون، أو الحالة. ومن خلال الجمع بين المتغيرات عبر مجموعة من البيانات مثل ( ألوان جميع السيارات في ساحة انتظار معينة) يمكن إنشاء الإحصائيات التي تتيح فهم الاتجاهات والنتائج بشكل أفضل.
المستويات الإحصائية للقياس Measurement level in statistics
بعد تحليل المتغيرات والنتائج كجزء من أنواع الإحصاء، هناك عدة مستويات ناتجة من القياس ويمكن للإحصائيات تحديد النتائج بطرق مختلفة وهي:
- قياس المستوى الاسمي Nominal level measurement: لا توجد قيمة عددية أو كمية للصفات غير المرتبة. بدلًا من ذلك، تعتبر قياسات المستوى الاسمي مجرد تسميات أو فئات مخصصة لمتغيرات أُخرى. وهنا يكون من الأسهل التفكير في قياسات المستوى الاسمي على أنها حقائق غير رقمية حول متغير معين.
- قياس المستوى الترتيبي Ordinal level measurement: وهنا يمكن ترتيب النتائج بطريقة مفهومة، ومع ذلك فإن جميع البيانات لها نفس القيمة أو الوزن. وعلى الرغم من أنه لا يمكن طرح قياسات المستوى الترتيبي العددي في الإحصاء مقابل بعضها البعض. لأن موضع نقطة البيانات فقط هو المهم، لذلك غالبًا ما يتم دمج المستويات الترتيبية في الإحصائيات اللامعلمية مقابل مجموعة المتغيرات الإجمالية. على سبيل المثال، كان الأمريكي فريد كيرلي ثاني أسرع رجل في أولمبياد طوكيو 2020، بناءً على أوقات العدو لمسافة 100 متر.
- قياس مستوى الفاصل الزمني Interval level measurement: يمكن ترتيب النتائج بطريقة معينة، لكن الاختلافات بين قيم البيانات هنا قد يكون لها معنى. غالبًا ما يتم استخدام نقطتي بيانات مختلفتين لمقارنة مرور الوقت أو تغيير الظروف داخل مجموعة البيانات. وفي بعض الأحيان لا يكون هناك نقطة بداية لنطاق قيم البيانات، وقد لا تحتوي تواريخ التقويم أو درجات الحرارة على قيمة صفرية جوهرية ذات مغزى.
- قياس مستوى النسبة Ratio Level Measurement:هو مقياس متغير لا ينتج من فقط ترتيب المتغيرات، لكن يصنع الفرق بين المتغيرات المعروفة جنبًا إلى جنب مع المعلومات حول قيمة الصفر الحقيقي. ويتم حسابه بافتراض أن المتغيرات لها خيار للصفر والفرق بين المتغيرين هو نفسه.
تحليل البيانات الإحصائية Statistical analysis of statistical data
يتضمن تحليل البيانات الإحصائية بشكل عام شكلًا من أشكال الأدوات الإحصائية. والتي لا يستطيع الشخص العادي القيام بها دون أن يكون لديه معرفة إحصائية من خلال العديد من البرامج المختلفة المتخصصة في إجراء تحليل البيانات الإحصائية، التي تشمل نظام التحليل الإحصائي والحزمة الإحصائية للعلوم الاجتماعية.
تتكون البيانات الإحصائية من متغيرات، وفي بعض الأحيان تكون البيانات أحادية المتغير أو متعددة المتغيرات اعتمادًا على عدد المتغيرات. وإذا كانت البيانات في تحليل البيانات الإحصائية متعددة في الأرقام، فيمكن إجراء عدة متغيرات. وهذا هو تحليل البيانات الإحصائية للعوامل، وتحليل البيانات الإحصائية المميزة وما إلى ذلك.
في حال كانت البيانات مفردة في العدد فيتم إجراء تحليل البيانات الإحصائية أُحادي المتغير بالاعتماد على نوعين أساسيين، وهما:
- البيانات المستمرة: هي التي لا يمكن عدها على سبيل المثال، قياس شدة الضوء
- البيانات السرية: هي التي يمكن عدها على سبيل المثال، يمكن حساب عدد المصابيح التي يصدر منها الضوء.
مراحل تحليل البيانات الإحصائية Statistical data analysis
هناك أربع مراحل أساسية في التحليل الإحصائي هي:
- تحديد المشكلة ومعرفة جميع بياناتها.
- جمع البيانات ومعالجتها في شكل مناسب للتحليلات الإحصائية.
- تحليل أولي يهدف إلى توضيح الشكل العالم للبيانات واقتراح لاتجاه الذي يسير فيه التحليل.
- استخدام الرسوم البيانية والجداول البسيطة.
- التحليل النهائية الذي يتم فيه توفير أساس الاستنتاجات.
- ثم عرض دقيق وموجز للاستنتاج بشكل واضح.
- الإبلاغ عن النتائج من خلال الاستدلالات.
تقنيات أخذ العينات في الإحصاء Statistics
من أجل جمع البيانات الإحصائية بطريقة صحيحة، يجب قراءة تعريف الإحصاء وفهمه بشكل جيد. حيث لن يكون من الممكن في كثير من الأحيان جمع البيانات من كل نقطة بيانات داخل السكان أو المجموعة المراد تحليلها. بدلًَا من ذلك يتم الاعتماد في الإحصائيات على تقنيات أخذ العينات المختلفة لإنشاء مجموعة فرعية تمثيلية من السكان، ليكون من السهل تحليلها. وفي الإحصاء هناك عدة أنواع أساسية من أخذ البيانات وهي:
- عينة عشوائية بسيطة.
- أخذ عينات بشكل منهجي.
- أخذ عينات طبقية.
- أخذ عينات عنقودية.
كما يجب أن تكون كل مجموعة فرعية ممثلة للسكان، بدلًا من الاختيار العشوائي داخل مجموعة فرعية. كما يجب أن يتم اختيار المجموعة الفرعية بأكملها بشكل عشوائي.
كيف يتم استخدام الإحصاء في الاقتصاد والتمويل Statistics in Economics
يدرس خبراء الاقتصاد تعريف الإحصاء جيدًا، ويعملون على النظر إلى كافة أنواع البيانات بدءًا من الإنفاق الاستهلاكي إلى المساكن البادئة، وصولًا إلى التضخم ونمو الناتج المحلي الإجمالي. وفي مجال التمويل يجمع المحللون والمستثمرون بيانات حول الشركات والصناعات وبيانات السوق وردود الفعل حول السعر والحجم. وهنا يتم استخدام أنواع الإحصاء الذي يعرف بالاقتصاد القياسي، حيث تعتمد العديد من النماذج المالية ونماذج التسعير على الاستدلال الإحصائي في تعديل الأسعار والسوق تجاه منتج معين.
المتوسط والوسيط والوضع في الإحصاء Statistics
يعتبر المتوسط في الإحصاء هو المتوسط الحسابي لمجموعة البيانات التي يتم العثور عليها عن طريق إضافة الأرقام في مجموعة، والقسمة على عدد الملاحظات في مجموعة البيانات. أما الوسيط فهو الرقم الأوسط في مجموعة البيانات أثناء إدراجه بترتيب تصاعدي أو تنازلي. والوضع هو الرقم الذي يحدث بتكرار أكثر في مجموعة البيانات ويتراوح بين أعلى قيمة وأقل قيمة.
يتم حساب المتوسط عن طريق إضافة جميع قيم البيانات للمتغير، وقسمة المجموع على عدد قيم البيانات. فالمتوسط هو مقياس للموقع المركزي للبيانات، أما الوسيط فهو مقياس آخر للموقع المركزي. وعلى عكس المتوسط، لا يتأثر الوسيط بقيم البيانات الكبيرة أو الصغيرة، وعند تحديد الوسيط يتم ترتيب قيم البيانات أولًا بالترتيب من أصغر قيمة إلى أكبر قيمة.
إذا كان هناك عدد فردي من قيم البيانات فإن الوسيط هو القيمة الوسطى، وإذا كان هناك عدد زوجي من قيم البيانات فإن الوسيط هو متوسط القيمتين الوسطيتين. أما المقياس الثالث للاتجاه المركزي هو الوضع والذي يحدث بكمية تكرار كبيرة.
توفر النسب المئوية مؤشرًا لكيفية انتشار قيم البيانات عبر الفاصل الزمني من أصغر قيمة إلى أكبر قيمة. على سبيل المثال، في معظم الاختبارات الموحدة تقسم الأرباع قيم البيانات إلى أربعة أجزاء متساوية من حيث العدد وتسمى الربيعيات:
- الربيع الأول: ويكون ربع المفردات أصغر منها وثلاثة أرباع المفردات أكبر منها.
- الربيع الثاني مع الوسيط: وهو القيمة التي يكون نصف المفردات أصغر منها، والنصف الآخر أكبر منها.
- الربيع الثالث: وهو القيمة التي يكون ثلاثة أرباع القيم أصغر منها والربع الآخر أكبر منها.
مقياس التشتت في الإحصاء Statistics
لا تكفي مقاييس الاتجاه المركزي لوصف المعلومات الكاملة حول بيانات معينة في أنواع الإحصاء. لذلك يتم وصف التباين بقيمة تسمى مقياس التشتت الذي يشتمل على مقاييس مختلفة وهي:
- يتم حساب النطاق في الإحصائيات على أنه الفرق بين القيمة القصوى والحد الأدنى لقيمة نقاط البيانات.
- الانحراف الربعي الذي يقيس المطلق للتشتت، حيث يتم تقسيم نقاط البيانات إلى ثلاثة أرباع، ويتم البحث عن وسيط نقاط البيانات.
يقال إن متوسط البيانات إلى يسار هذا الوسيط هو الربيع الأعلى، وُيقال إن متوسط نقاط البيانات على يمين هذا الوسيط هو الربيع السفلي. وهنا يكون الربيع السفلي والربيع العلوي هو المدى الربيعي، وفي المنتصف هو الانحراف الربيعي. - متوسط الانحراف الذي هو المقياس الإحصائي لتحديد متوسط الفرق المطلق بين العناصر في التوزيع، والمتوسط أو الوسيط لتلك السلسلة.
- الانحراف المعياري وهو مقياس مقدار التباين في مجموعة من القيم.
على سبيل المثال: ما هو احتمال الحصول على ذيولين ورأس واحد عند رمي 3 عملات في المرة الواحدة؟
- 15.
- 38.
- 14.
- 17.
الحل هو في عدة خطوات:
- الخطوة الأولى هي عدد النتائج المحتملة عند رمي عملة واحدة وتساوي 2، النتائج هي (HHH وTTT).
- الخطوة الثانية النتائج المحتملة عند رمي 3 عملات، النتائج هي (THT ، TTT ، HHH ، HTT ، HTH ، HHT ، THH ، TTH).
- الخطوة الثالثة عدد النتائج الإيجابية تساوي 3 والنتائج الإيجابية هي (THT و TTH و HTT).
- الخطوة الرابعة (الاستبدال).
- إن احتمال الحصول على ذيولين ورأس واحد عند رمي ثلاث عملات في المرة الواحدة هو 38 وهي الإجابة الصحيحة.
القيم المتطرفة في الإحصاء Statistics
في بعض الأحيان تتضمن بيانات المتغير قيمة واحدة أو أكثر تظهر بشكل غير عادي كبيرة أو صغيرة في غير محلها عند مقارنتها بقيم البيانات الأُخرى. تعرف هذه القيم بالقيم المتطرفة وغالبًا ما يتم تضمينها بشكل خاطئ في مجموعة البيانات، حيث يتخذ خبراء الإحصاء خطوات لتحديد القيم المتطرفة، ثم يراجعون كل منها بعناية للتأكد من دقتها ومدى ملاءمة إدراجها في مجموعة البيانات.
في حال حدوث خطأ يمكن اتخاذ إجراء تصحيحي مثل رفض قيمة البيانات المعنية، ويتم استخدام المتوسط والانحراف المعياري لتحديد القيم المتطرفة. هنا يمكن حساب درجة “Z” لكل قيمة، مع تمثيل “X” لقيمة البيانات، وتكون “x̄” هي متوسط العينة و “S” هي الانحراف المعياري للعينة.
يتم إعطاء درجة “Z” بواسطة المعادلة (z = (x – x̄) / s.) وتمثل الدرجة “Z” الموضع النسبي لقيمة البيانات من خلال الإشارة إلى عدد الانحرافات المعيارية من المتوسط. إن القاعدة العامة هنا هي أن أي قيمة ذات علامة “Z” أقل من 3 أو أكبر من +3 يجب اعتبارها قيمة خارجية.
تحليل البيانات الاستكشافي في الإحصاء Statistics
يوفر تحليل البيانات الاستكشافية مجموعة متنوعة من الأدوات للتلخيص السريع، واكتساب نظرة دقيقة وثاقبة حول مجموعة البيانات المستخلصة، من خلال طريقتين هما: الملخص، ومخطط الصندوق.
يتكون الملخص من خمسة أرقام وهي:
- أصغر قيمة البيانات.
- الربيع الأول.
- الوسيط.
- الربيع الثالث.
- أكبر قيمة من البيانات.
أما مخطط الصندوق فهو جهاز رسومي يعتمد على الملخص ليرسم المستطيل، بحيث تقع نهايات المستطيل في الربيعين الأول والثالث. يمثل الصندوق هنا 50% من البيانات حيث يتم رسم خط عمودي في المستطيل لتحديد الوسيط. حيث تمتد الخطوط التي تسمى “الشعيرات” من أحد طرفي المستطيل إلى أصغر قيمة بيانات، ومن الطرف الآخر للمستطيل إلى أكبر قيمة من البيانات. في حال وجود القيم المتطرفة تمتد الشعيرات عمومًا إلى قيم البيانات الأصغر والأكبر التي ليست قيمًا متطرفة، ثم يتم وضع النقاط أو العلامات النجمية خارج الشعيرات للإشارة إلى وجود القيم المتطرفة.
الاحتمالية في الإحصاء Statistics
إن الاحتمالية في أنواع الإحصاء هي موضوع يتعامل مع عدم اليقين، ويمكن اعتبار الاحتمال مقياسًا رقميًا لاحتمال وقوع حدث معين، ويتم تعيين الاحتمالية على مقياس من 0 إلى 1. حيث تشير القيم القريبة من (0) إلى أنه من غير المحتمل حدوث ذلك الحدث. بينما تشير القيم القريب من (1) إلى احتمال وقوع حدث ما. أي أن احتمال 0.50 يشير إلى أن حدثًا ما من المرجح أن يقع بالمساواة مع احتمال عدم حدوثه.
طرق الإحصاء Statistics
إن الخطوة الأولى في أي عملية إحصائية هي جمع البيانات من خلال الاستعيان من الأشخاص، أو من خلال تسجيل الاستجابات لمعالجة أحد المشاكل في إحدى التجارب وعرض تلك النتائج، وتتمثل طرق عرض البيانات والنتائج ضمن تعريف الإحصاء فيما يلي:
الجدولة في الإحصاء tabulation in statistics
إن أكثر الملخصات الجدولية استخدامًا لمتغير واحد هو توزيع التردد ويوضح توزيع التردد عددًا من قيم البيانات في كل فئة من الفئات المتعددة غير المتداخلة. ويظهر ملخص جدولي آخر يسمى توزيع التكرار النسبي (الكسر أو النسبة المئوية) لقيم البيانات في كل فئة. لذلك يعتبر ملخص الجدولة هو الأكثر شيوعًا لبيانات المتغيرين في الجدولة المتوسطة الذي هو تماثل متغير لتوزيع التردد.
بالنسبة للمتغير النوعي يوضح توزيع التردد عدد البيانات من كل فئة نوعية. على سبيل المثال، يتألف متغير الجنس من فئتين (ذكر وأنثى) وبالتالي فإن التوزيع التكراري للجنس يشتمل على فئتين غير متداخلتين لإظهار عدد الذكور والإناث. ويظهر التوزيع التكراري النسبي لهذا المتغير جزء الأفراد من الذكور ونسبة الإناث من الأفراد. ومن أجل إنشاء توزيع تردد لمتغير كمي يجب إيلاء المزيد من الاهتمام في تحديد الفئات ونقاط التقسيم بين الفئات المتجاورة، مثل تقسيم الذكور والإناث بحسب الفئات العمرية .
أما الجدولة المتقاطعة هي جدولة ذات اتجاهين ع صفوف الجدول التي تمثل فئات متغير واحد وأعمدة الجدول التي تمثل فئات متغير آخر. لإنشاء جدولة متقاطعة باستخدام متغيرات الجنس والعمر يمكن عرض الجنس في صفين ذكر وأنثى، وإظهار العمر تسعة أعمدة تتوافق مع الفئات العمرية المراد عرضها. كما سيحدد الإدخال في كل خلية في الجدول عدد قيم البيانات مع الجنس المحدد في عنوان الصف والعمر المحدد في عنوان العمود، وهنا يمكن أن يكون مثل الجدول المتقاطع مفيدا في فهم العلاقة بين الجنس والعمر.
الرسوميات في الإحصاء graphics in statistics
يتوفر عدد من الأساليب الرسومية لوصف البيانات في أنواع الإحصاء أبرزها:
- الرسم البياني الشريطي وهو جهاز رسومي لوصف البيانات النوعية التي تم تلخيصها في توزيع التردد ويتم عرض تسميات فئات المتغير النوعي على المحور الأفقي للرسم البياني. يتم إنشاء شريط أعلى كل تسمية بحيث يتناسب ارتفاع كل شريط مع قيم البيانات في الفئة المعينة، ليظهر الرسم البياني الشريطي .
- المخطط الدائري وهو جهاز رسومي آخر لتلخيص البيانات النوعية، بما يتناسب مع حجم كل شريحة من الفئات مع عدد قيم البيانات في الفئة المقابلة.
- المدرج التكراري وهو العرض الرسومي الأكثر شيوعًا للبيانات الكمية التي تم تلخيصها في توزيع التردد. تظهر تلك العروض قيم المتغير الكمي على المحور الأفقي ويتم رسم مستطيل فوق كل فئة. بحيث تكون قاعدة المستطيل مساوية لعرض فاصل الفئة ويكون ارتفاعه متناسبًا مع عدد قيم البيانات في الفصل.
الأحداث واحتمالاتها في الإحصاء Statistics
في كثير من الأحيان يجب حساب الاحتمالات للأحداث ذات الصلة في أنواع الإحصاء. على سبيل المثال، يتم تطوير الإعلانات بهدف زيادة مبيعات المنتج وفي حال كانت رؤية الإعلان تزيد من احتمالية قيام الشخص بشراء المنتج، فيُقال إن أحداث “رؤية الإعلان” و”شراء المنتج” تعتمدان على بعضهما البعض.
كما يدل تعريف الإحصاء على أنه في حال كان هناك حدثان مستقلان فإن وقوع حدث واحد لا يؤثر على احتمال وقوع الحدث الآخر. بينما عندما يكون هناك حدثان أو أكثر مستقلان فإن احتمال حدوثهما المشترك هو نتاج احتمالاتهما الفردية. ويقال أنهما حدثان متنافيان إذا كان وقوع حدث واحد يعني أن الحدث الآخر لا يمكن أن يحدث، في هذه الحالة عندما يقع حادث واحد فإن احتمال وقوع الحدث الآخر هو 0.
ما هو الغرض من الإحصاء Statistics
يهتم تعريف الإحصاء باستكشاف وتلخيص واستنتاج حول حالة الأنظمة المعقدة. على سبيل المثال، حالة الأمة، أو الإحصاءات الرسمية، أو حالة صحة الأشخاص كالإحصاءات الطبية والصحية. كما يتم استخدام الإحصاء في حالات البيئة بالإضافة إلى توفير وصف دقيق لظواهر طبيعية معينة.
يساعد الإحصاء في التخطيط السليم والفعاّل، كما يمثل الإحصاء عملية حاسمة وراء كيفية قيامنا باكتشافات العلوم واتخاذ القرارات بناءً على البيانات والتنبؤ. كما تسمح لك الإحصائيات بفهم موضوع معقد بشكل أسهل وأكثر تعمّقًا ودقة.
أمثلة عن الإحصاء Statistics
تبرز أنواع الإحصاء في التمويل والاستثمار والأعمال والعالم والكثير من المعلومات التي تراها، والبيانات التي تحصل عليها مستمدة من الإحصائيات والتي يتم استخدامها في جميع جوانب الأعمال التجارية.
- في الاستثمار تضمن الإحصائيات متوسط حجم التداول والمستويات الدنيا والمستويات العليا خلال مدة محددة غالبًا تكون 52 أسبوعًا. بالإضافة إلى النسخ التجريبية والارتباط بين فئات الأصول أو الأوراق المالية.
- أما في الاقتصاد فتشمل الإحصاءات الناتج المحلي الإجمالي ومستوى البطالة وتسعير الاستهلاك. بالإضافة إلى التضخم ومقاييس النمو الاقتصادي الأُخرى في التسويق. كما تشمل الإحصائيات معدلات التحول، ومعدلات النقر، وكميات البحث، ومقاييس وسائل التواصل الاجتماعي.
- في المحاسبة تشمل الإحصائيات مقاييس السيولة، والملاءة المالية، والربحية عبر الوقت.
- في مجال تكنولوجيا المعلومات تشمل الإحصائيات النطاق الترددي، وقدرات الشبكة، ولوجستيات الأجهزة.
- في الموارد البشرية تشمل الإحصائيات معدل دوران الموظفين ومدى رضاهم ومستوى التعويض بالنسبة لأسعار السوق.
أنواع مصادر الإحصاءات
لم يتم ذكر مصادر جمع البيانات في تعريف الإحصاء. سيما وأنه يوجد مصدرين رئيسيين لجمع البيانات الإحصائية باستخدام أنواع الإحصاء وهما:
- مصدر ميداني: الذي يتم من خلاله جمع البيانات عن طريق التعداد والبحوث والمسوح الإحصائية باستخدام إحدى وسائل جمع البيانات التي أهمها:
- المقابلة الشخصية.
- طريق البريد.
- الهاتف.
- الانترنت.
- السجلات الإدارية في الهيئات والوزارات: حيث تقوم معظم الجهات الحكومية بحفظ بياناتها المتعلقة بأنشطتها المختلفة في سجلات خاصة. وعادةً ما تكون عملية الحفظ ليست لأهداف إحصائية. وبالتالي فإن الحصول عليها يحتاج الى تجهيز، وتبويب لتلك البيانات حتى يتم تحويلها الى احصائيات مفيدة. وقد يتم الحصول على ملفات حاسوبية بدلًا من الملفات الورقية.
تعريفات إحصائية هامة
بعد التعرف على تعريف الإحصاء. يمكن القول أن أنواع الإحصاء لديها العديد من الأقسام التي لا بد من معرفة كل منها. لذلك إليكم أبرز تلك الأقسام والمصطلحات والتي تم ذكرها في مقالنا:
- المجتمع الإحصائي: وهو مجموعة ذات خصائص مشتركة من الأشياء أو المفردات التي تشكّل أهمية لدراسة علمية.
- أقسام المجتمع الإحصائي:
- محدود: وهو الذي يكون فيه عدد محدود من الأشياء أو الأفراد.
- غير محدود: وهو الذي يكون فيه عدد لا محدود من الأفراد أو الأشياء.
- العينة الإحصائية: هي جزء صغير من المجتمع الإحصائي يتم اختيارها لتمثل جميل خصائص وصفات المجتمع الإحصائي الأساسي.
- المعلمات:هي شيء يميز العينة الاحصائية مثل متوسط الطول للذكر البالغ في دولة معينة.
- المتغيرات: هي مقدار له خصائص رقمية (كمّية) وغير رقمية (وصفية) تتغير قيمتها من عنصر إلى آخر من عناصر المجتمع الاحصائي أو العينة المرصودة للإحصاء.
- الإحصائية: هي شيء يميز العينة الإحصائية مثل متوسط طول الأنثى البالغة لعينة مكونة من 50 أنثى.
- المتوسطات: هي القيم النموذجية الممثلة لمجموعة من البيانات.
- المدى:هو الفرق بين اكبر مشاهدة واصغر مشاهدة في مجموعة من المشاهدات.
- التفلطح: وهو ما يقيس درجة تمركز البيانات حول قيمتها المركزية أو الكثافية. التي تتوزع بها البيانات حول مركزها.
- نظرية بيز: هي حساب احتمال أن يكون هناك سببًا ما هو مصدر حدوث حادثة معينة نعلم مسبقًا بحدوثها. وأن حدوثها يرجع الى عدد من الأسباب المعروف احتمال حدوث كل منها. كما نعلم احتمال حدوث الحادثة إذا تحقق سبب ما من تلك الأسباب.
- حقل سجما فصل الحوادث: هو عبارة عن مجموعة عناصرها تتكون من بعض المجموعات الجزئية التي يمكن تكوينها من فراغ العينة S.
- المنوال (الوضع) هو القيمة الأكثر تكرارًا في مجموعة البيانات.
- الأعمدة البيانية: هي عبارة عن مستطيلات رأسية قاعدتها ذات سمك متساوي، وارتفاعها يمثل القراءات للظاهرة التي يتم دراستها.
في الختام
وبعد أن تعرفنا على تعريف الإحصاء Statistics ما أهميته وأنواعه وأهم مبادئه. نستنتج أنه من الضروري التعرف على خصائص مجموعة كبيرة من العناصر مثل الأفراد والأسر والمباني والمنتجات والأجزاء والعملاء وما إلى ذلك. لتوفير بيانات وإحصائيات تساعد على تحسين تلك المجموعات، أو الحصول على تقديرات واحتمالات حدوث الأحداث المتعلقة بالبيانات المرصودة عن الأمر المراد عمل إحصائيات عنه.
الأسئلة الشائعة ؟
تستخدم الإحصائيات على نطاق واسع عبر مجموعة من التطبيقات والمهن وفي أي وقت يتم فيه جمع البيانات وتحليلها يتم استخدام الإحصاء. ويمكن أن تكون تلك الجهات حكومية، أو بحوث أكاديمية، أو لتحليل الاستثماراتية عند جمع البيانا وتحليلها وتفسيرها لتكون نتائج الإحصائية صحيحة وغير مضللة
تستخدم الإحصائيات الوصفية لوصف أو تلخيص خصائص عينة أو مجموعة من البيانات مثل متوسط المتغير أو الانحراف المعياري أو التردد. أما الإحصائيات الاستنتاجية فهي عبارة عن عدد من الأساليب لربط المتغيرات في مجموعة بيانات باستخدام تحليل الارتباط أو الانحدار، وتستخدم تلك البيانات بعد ذلك لتقدير التوقعات أو استنتاج السببية.
ن الإحصاء هو أحد فروع الرياضيات، ويستخدم للتعامل مع الاحتمالات والتمثيل الرسومي للبيانات الرياضية وتفسير الملاحظة غير المؤكدة التي لا يمكن تحقيقها مع الصيغ ومبادئ الرياضيات. كما أن له العديد من التطبيقات، وفي الواقع هو أحد فروع الرياضيات التي يشار إليها مجتمعة بإسم الرياضيات التطبيقية.
1-قوانين الاحصاء صحيحة في المتوسط
2-لا يمكن تطبيق الإحصائيات على البيانات غير المتجانسة
3-يجب بذل الجهود الكافية عند جمع البيانا وتحليلها وتفسيرها لتكون نتائج الإحصائية صحيحة وغير مضللة