طريقة بايزي في التشخيص الفني. طرق التعرف

حاليًا، أصبحت الأساليب البايزية منتشرة على نطاق واسع وتستخدم بنشاط في مجموعة متنوعة من مجالات المعرفة. ومع ذلك، لسوء الحظ، ليس لدى الكثير من الناس فكرة عما هو عليه ولماذا هو مطلوب. أحد الأسباب هو عدم وجود كمية كبيرة من الأدب باللغة الروسية. لذلك، سأحاول هنا تقديم مبادئهم بكل بساطة قدر الإمكان، بدءًا من الأساسيات ذاتها (أعتذر إذا كان هذا يبدو بسيطًا جدًا للبعض).

في المستقبل، أود الانتقال إلى تحليل بايزي نفسه والتحدث عن معالجة البيانات الحقيقية، وفي رأيي، بديل ممتاز للغة R (تم كتابة القليل عنها) - Python مع وحدة pymc . شخصيًا، أجد أن لغة Python أكثر قابلية للفهم ومنطقية من لغة R التي تحتوي على الحزم والأخطاء، كما أن لغة Python تقدم أكثر من ذلك بكثير ياقدر أكبر من الحرية والمرونة (على الرغم من أن بايثون لديها صعوباتها الخاصة، إلا أنها يمكن التغلب عليها، ولا يتم مواجهتها غالبًا في التحليل البسيط).

قليلا من التاريخ

كملاحظة تاريخية مختصرة، سأقول أن صيغة بايز نُشرت بالفعل في عام 1763، بعد عامين من وفاة مؤلفها، توماس بايز. ومع ذلك، أصبحت أساليب استخدامه منتشرة على نطاق واسع فقط في نهاية القرن العشرين. ويفسر ذلك حقيقة أن الحسابات تتطلب تكاليف حسابية معينة، وأنها أصبحت ممكنة فقط مع تطور تكنولوجيا المعلومات.

حول الاحتمال ونظرية بايز

تتطلب صيغة بايز وكل ما يتبعها فهمًا للاحتمالات. يمكنك قراءة المزيد عن الاحتمالية على ويكيبيديا.
من الناحية العملية، فإن احتمال وقوع حدث ما هو تكرار حدوث هذا الحدث، أي نسبة عدد مشاهدات الحدث إلى إجمالي عدد الملاحظات لعدد إجمالي كبير (لا نهائي نظريًا) من الملاحظات.
خذ بعين الاعتبار التجربة التالية: نستدعي أي رقم من القطعة ونرى أن هذا الرقم يقع بين، على سبيل المثال، 0.1 و0.4. كما قد تتخيل، فإن احتمالية هذا الحدث ستكون مساوية لنسبة طول المقطع إلى الطول الإجمالي للمقطع (وبعبارة أخرى، نسبة "عدد" القيم المحتملة بنفس القدر إلى "إجمالي "عدد" القيم) ، أي (0.4 - 0.1) / (1 - 0) = 0.3 ، أي أن احتمال الدخول في المقطع هو 30٪.

الآن دعونا ننظر إلى مربع x.

لنفترض أنه يتعين علينا تسمية أزواج من الأرقام (x، y)، كل منها أكبر من الصفر وأقل من واحد. احتمال أن يكون x (الرقم الأول) ضمن المقطع (كما هو موضح في الشكل الأول بالمنطقة الزرقاء، في الوقت الحالي الرقم الثاني y ليس مهمًا بالنسبة لنا) يساوي نسبة مساحة المساحة الزرقاء إلى مساحة المربع بأكمله أي (0.4 - 0.1) * (1 - 0) / (1 * 1) = 0.3 أي 30%. وبالتالي، يمكننا أن نكتب أن احتمال أن x ينتمي إلى المقطع هو p(0.1<= x <= 0.4) = 0.3 или для краткости p(X) = 0.3.
إذا نظرنا الآن إلى y، بالمثل، فإن احتمال وجود y داخل المقطع يساوي نسبة مساحة المنطقة الخضراء إلى مساحة المربع بأكمله p(0.5)<= y <= 0.7) = 0.2, или для краткости p(Y) = 0.2.
الآن دعونا نرى ما يمكننا تعلمه عن قيمتي x وy.
إذا أردنا أن نعرف ما هو احتمال أن يكون x و y في نفس الوقت في الأجزاء المحددة المقابلة، فإننا نحتاج إلى حساب نسبة المنطقة المظلمة (تقاطع المناطق الخضراء والزرقاء) إلى مساحة المنطقة بأكملها مربع: ع(X، Y) = (0.4 - 0.1) * (0.7 - 0.5) / (1 * 1) = 0.06.

لنفترض الآن أننا نريد أن نعرف ما هو احتمال وجود y في الفترة إذا كانت x موجودة بالفعل في الفترة. وهذا يعني، في الواقع، لدينا مرشح وعندما نسمي الأزواج (x، y)، فإننا نتجاهل على الفور تلك الأزواج التي لا تستوفي شرط وجود x في فترة زمنية معينة، ثم من الأزواج التي تمت تصفيتها نحسب تلك الأزواج الذي يفي y بشرطنا ويأخذ في الاعتبار الاحتمالية كنسبة عدد الأزواج التي تقع فيها y في المقطع المذكور أعلاه إلى العدد الإجمالي للأزواج التي تمت تصفيتها (أي التي تقع فيها x في المقطع). يمكننا كتابة هذا الاحتمال كـ p(Y|X). ومن الواضح أن هذا الاحتمال يساوي نسبة مساحة المنطقة المظلمة (تقاطع المنطقتين الخضراء والزرقاء) إلى مساحة المنطقة الزرقاء. مساحة المنطقة الداكنة هي (0.4 - 0.1) * (0.7 - 0.5) = 0.06، ومساحة اللون الأزرق هي (0.4 - 0.1) * (1 - 0) = 0.3 فتكون نسبتهما 0.06 / 0.3 = 0.2. بمعنى آخر، احتمال العثور على y على القطعة بشرط أن x ينتمي بالفعل إلى القطعة هو p(Y|X) = 0.2.
تجدر الإشارة إلى أنه مع مراعاة كل ما سبق وجميع الرموز المذكورة أعلاه، يمكننا كتابة التعبير التالي
ص(Y|X) = ص(X، Y) / ص(X)

دعونا نعيد إنتاج كل المنطق السابق بإيجاز الآن فيما يتعلق بـ p(X|Y): نقوم بتسمية الأزواج (x, y) وتصفية تلك الأزواج التي تقع فيها y بين 0.5 و0.7، ثم احتمال وجود x في الفاصل الزمني بشرط أن y ينتمي للقطعة تساوي نسبة مساحة المنطقة المظلمة إلى مساحة اللون الأخضر:
ص(X|Y) = ص(X، Y) / ص(Y)

في الصيغتين أعلاه، نرى أن المصطلح p(X, Y) هو نفسه، ويمكننا حذفه:

يمكننا إعادة كتابة المساواة الأخيرة على النحو التالي

هذه هي نظرية بايز.
ومن المثير للاهتمام أيضًا ملاحظة أن p(Y) هو في الواقع p(X,Y) لجميع قيم X. أي أننا إذا أخذنا المنطقة المظلمة وقمنا بتمديدها بحيث تغطي جميع قيم X، فإنها ستتبع المنطقة الخضراء تمامًا، مما يعني أنها ستكون مساوية لـ p(Y). في اللغة الرياضية هذا يعني ما يلي:
ثم يمكننا إعادة كتابة صيغة بايز على النحو التالي:

تطبيق نظرية بايز

دعونا ننظر إلى المثال التالي. خذ عملة معدنية واقلبها 3 مرات. مع احتمال متساو يمكننا الحصول على النتائج التالية (O - الرؤوس، P - الذيول): OOO، OOR، ORO، ORR، ROO، ROR، RPO، RRR.

يمكننا حساب عدد الرؤوس التي ظهرت في كل حالة وعدد المرات التي حدثت فيها تغييرات في الرؤوس والذيل والرؤوس الذيل:

يمكننا اعتبار عدد الرؤوس وعدد التغييرات كمتغيرين عشوائيين. ثم سيبدو جدول الاحتمالات كما يلي:

الآن يمكننا أن نرى صيغة بايز قيد التنفيذ.
لكن أولًا، دعونا نرسم تشبيهًا بالمربع الذي نظرنا إليه سابقًا.
يمكنك ملاحظة أن p(1O) هو مجموع العمود الثالث ("المنطقة الزرقاء" للمربع) ويساوي مجموع كل قيم الخلايا في هذا العمود: p(1O) = 2/8 + 1/8 = 3/8
p(1C) هو مجموع الصف الثالث ("المنطقة الخضراء" للمربع)، وبالمثل، يساوي مجموع كل قيم الخلايا في هذا الصف p(1C) = 2/8 + 2/ 8 = 4/8
احتمال حصولنا على رأس واحد وتغيير واحد يساوي تقاطع هذه المناطق (أي القيمة في الخلية لتقاطع العمود الثالث والصف الثالث) p(1C, 1O) = 2/8
بعد ذلك، باتباع الصيغ الموضحة أعلاه، يمكننا حساب احتمالية الحصول على تغيير واحد إذا حصلنا على رأس واحد في ثلاث رميات:
ص (1C | 1O) = ص (1C، 1O) / ص (1O) = (2/8) / (3/8) = 2/3
أو احتمال الحصول على رأس واحد إذا حصلنا على تغيير واحد:
ص (1O | 1C) = ص (1C، 1O) / ص (1C) = (2/8) / (4/8) = 1/2
إذا قمنا بحساب احتمال الحصول على تغيير واحد إذا كان هناك رأس واحد p(1O|1C) من خلال صيغة بايز، نحصل على:
ص(1O|1C) = ص(1C|1O) * ص(1O) / ص(1C) = (2/3) * (3/8) / (4/8) = 1/2
وهو ما حصلنا عليه أعلاه.

ولكن ما هي الأهمية العملية التي يحملها المثال أعلاه؟
والحقيقة هي أنه عندما نقوم بتحليل البيانات الحقيقية، فإننا عادة ما نهتم ببعض معلمات هذه البيانات (على سبيل المثال، المتوسط، التباين، وما إلى ذلك). ثم يمكننا إجراء القياس التالي مع جدول الاحتمالات أعلاه: دع الصفوف تكون بياناتنا التجريبية (دعنا نشير إليها البيانات)، والأعمدة هي القيم المحتملة لمعلمة هذه البيانات التي تهمنا (دعنا نشير إليها ). ثم نحن مهتمون باحتمال الحصول على قيمة معلمة معينة بناءً على البيانات المتاحة.
يمكننا تطبيق صيغة بايز وكتابة ما يلي:

وتذكر الصيغة مع التكامل، يمكننا أن نكتب ما يلي:

وهذا يعني، في الواقع، نتيجة لتحليلنا، لدينا احتمال كدالة للمعلمة. يمكننا الآن، على سبيل المثال، تعظيم هذه الوظيفة والعثور على القيمة الأكثر احتمالية للمعلمة، وحساب التشتت ومتوسط قيمة المعلمة، وحساب حدود المقطع الذي تقع ضمنه المعلمة التي نهتم بها باحتمال 95 ٪، إلخ.

الاحتمال يسمى الاحتمال الخلفي. ومن أجل حساب ذلك نحن بحاجة إلى أن يكون
- دالة الاحتمالية و - الاحتمالية السابقة.
يتم تحديد دالة الاحتمالية بواسطة نموذجنا. أي أننا نقوم بإنشاء نموذج لجمع البيانات يعتمد على المعلمة التي تهمنا. على سبيل المثال، نريد استيفاء البيانات باستخدام الخط المستقيم y = a * x + b (وبالتالي نفترض أن جميع البيانات لها علاقة خطية مع الضوضاء الغوسية المتراكبة عليها مع تباين معروف). إذن a وb هما المعلمتان لدينا، ونريد أن نعرف قيمهما الأكثر احتمالية، ودالة الاحتمالية هي غاوسية بمتوسط معطى بواسطة معادلة الخط وتباين معين.
يتضمن الاحتمال المسبق المعلومات التي نعرفها قبل إجراء التحليل. على سبيل المثال، نحن نعلم على وجه اليقين أن الخط يجب أن يكون له ميل إيجابي، أو أن القيمة عند تقاطع x يجب أن تكون موجبة - كل هذا وأكثر يمكننا دمجه في تحليلنا.
كما ترون، مقام الكسر هو التكامل (أو في الحالة التي يمكن أن تأخذ فيها المعلمات قيمًا منفصلة معينة فقط، المجموع) للبسط على جميع القيم الممكنة للمعلمة. من الناحية العملية، هذا يعني أن المقام ثابت ويعمل على تطبيع الاحتمال الخلفي (أي أن تكامل الاحتمال الخلفي يساوي واحدًا).

وبهذا أود أن أنهي رسالتي (تابع

إرسال عملك الجيد في قاعدة المعرفة أمر بسيط. استخدم النموذج أدناه

سيكون الطلاب وطلاب الدراسات العليا والعلماء الشباب الذين يستخدمون قاعدة المعرفة في دراساتهم وعملهم ممتنين جدًا لك.

نشر على http://www.allbest.ru/

مقدمة

تشير طريقة بايز إلى طرق التعرف الإحصائي، وتتمثل الميزة الرئيسية لها في القدرة على مراعاة ميزات الطبيعة الفيزيائية المختلفة في نفس الوقت. ويرجع ذلك إلى حقيقة أن جميع العلامات تتميز بكميات بلا أبعاد - احتمالات حدوثها في حالات مختلفة من النظام.

تحتل الطريقة البايزية، بسبب بساطتها وكفاءتها، مكانة خاصة بين طرق التشخيص التقنية، على الرغم من أن لها أيضًا عيوب، على سبيل المثال، كمية كبيرة من المعلومات الأولية، و"قمع" التشخيصات النادرة، وما إلى ذلك. ومع ذلك، في الحالات التي تسمح كمية المعلومات الإحصائية باستخدام الطريقة البايزية، ومن المستحسن استخدامها باعتبارها واحدة من أكثر الطرق موثوقية وفعالية.

1. أساسيات طريقة بايز

تعتمد الطريقة على صيغة بايز (صيغة احتمالية الفرضيات).

إذا كان هناك تشخيص د أناوعلامة بسيطة ك ي ، التي تحدث مع هذا التشخيص، ثم احتمال وقوع الأحداث المشتركة (وجود الحالة في الكائن د أناوالتوقيع ك ي) ، يتم تحديده بواسطة الصيغة:

ف(د أناك ي) = ف(د أنا) ف (ك ي/د أنا) = ف (ك ي) ف (د أنا/ ك ي). (1.1.)

من هذه المساواة تتبع صيغة بايز:

ف(د أنا/ ك ي) = ف(د أنا) ف(ك أنا/د أنا)/ف(ك ي ) (1.2.)

من المهم جدًا تحديد المعنى الدقيق لجميع الكميات المدرجة في هذه الصيغة.

ص(د أنا)--احتمال التشخيص د أنا، محدد من البيانات الإحصائية ( احتمال التشخيص المسبق). لذلك، إذا تم فحصها مسبقا نالكائنات و ن أناالكائنات كان لها شرط د أنا، الذي - التي

ص(د أنا) = ن أنا/ن. (1.3.)

ص (ك ي/د أنا ك ي للكائنات ذات الحالة د أنا.

إذا كان من بين ن أنا الأشياء مع التشخيص د أنا، ذ ن اي جاي ظهرت علامة ك ي ثم ارتباط بايز الاحتمالي

ص(ك ي/د أنا) = ن اي جاي/ن أنا. (1.4.)

ص(ك ي)--احتمال حدوث إشارة ك ي في جميع الكائنات، بغض النظر عن حالة (تشخيص) الكائن. اسمحوا من العدد الإجمالي ن علامة الكائنات ك ي تم العثور عليه في ن ي الكائنات إذن

ص(ك ي ) = ن ي/ن. (1.5.)

لإنشاء التشخيص، حساب خاص ص(كج ) غير مطلوب. كما سيتضح مما يلي , قيم ص(د أنا)و ص (ك ي / د أنا), المعروفة لجميع الحالات الممكنة، تحديد القيمة ص(ك ي ).

عدم المساواة ص (د أنا/ك ي) - احتمال التشخيص د أنابعد أن تبين أن الشيء المعني يتمتع بهذه الصفة ك ي (اعتقاد لاحقتتشخبص).

2 . صيغة بايز المعممة

تنطبق هذه الصيغة على الحالة التي يتم فيها إجراء الفحص وفق مجموعة من العلامات ل , بما في ذلك العلامات ك 1 , ك 2 , ..., ك الخامس . كل من العلامات ك ي لقد م ي الرتب ( ك يل، ك ي 2 , ..., ك js، ...،). ونتيجة للفحص يصبح تنفيذ الخاصية معروفا

ك ي * = ك js (1.5.)

ومجمع العلامات بأكمله ك*. فِهرِس *, كما كان من قبل، يعني المعنى المحدد (تحقيق) للسمة. صيغة بايز لمجموعة من الميزات لها الشكل

ص(د أنا/ ل * )= ص(د أنا)ص(ل */د أنا)/ص(ل * )(أنا = 1, 2, ..., ن), (1.6.)

أين ص (د أنا/ ل * )--احتمال التشخيص د أنا بعد ظهور نتائج الفحص على مجموعة من العلامات ل , ص (د أنا) - الاحتمال الأولي للتشخيص د أنا (حسب الإحصائيات السابقة).

تنطبق الصيغة (1.6.) على أي من ن الحالات المحتملة (التشخيص) للنظام. من المفترض أن النظام موجود في حالة واحدة فقط من الحالات المشار إليها وبالتالي

في المسائل العملية، احتمال وجود عدة حالات A1، .....، Ar مسموح به غالبًا، ويمكن أن يحدث بعضها مع بعضها البعض.

ص(ل */ د أنا) = ف(ك 1 */ د أنا)ص (ك 2 */ ك 1 * د أنا)...ص (ك الخامس */ ك ل* ...ك* الخامس- 1 د أنا), (1.8.)

أين ك ي * = ك js - فئة الصفة التي تم الكشف عنها نتيجة الفحص. لعلامات مستقلة تشخيصيا

ص (ل */ د أنا) = ص (ك 1 */ د أنا) ص (ك 2 */ د أنا)... ص (ك الخامس * / د أنا). (1.9.)

في معظم المشاكل العملية، وخاصة مع وجود عدد كبير من الميزات، من الممكن قبول شرط استقلال الميزات حتى في ظل وجود ارتباطات كبيرة بينها.

احتمال ظهور مجموعة من العلاماتل *

ص(ل *)= ص(د س) ص(ل */د س) . (1.10.)

يمكن كتابة صيغة بايز المعممة على النحو التالي :

ص(د أنا/ ك * ) (1.11.)

أين ص (ل */ د أنا) يتم تحديدها بالمساواة (1.8.) أو (1.9.). من العلاقة (1.11.) يتبع

ص(د أنا/ ل *)=ل , (1.12.)

وهذا بالطبع يجب أن يكون هو الحال، حيث أن أحد التشخيصين قد تحقق بالضرورة، ومن المستحيل تحقيق تشخيصين في نفس الوقت. تجدر الإشارة إلى ذلك مقام صيغة بايز لجميع التشخيصاتياالمكالمة هي نفسها.هذا يسمح لك بتحديد أولاً احتمال الحدوث المشترك ه نيا أنا التشخيص وهذا تنفيذ لمجموعة من الميزات

ص(د أنال *) = ص(د أنا)ص(ل */د أنا) (1.13.)

وثم الاحتمال الخلفي للتشخيص

ص (د أنا/ل *) = ص(د أنال *)/ص(د سل *). (1.14.)

لاحظ أنه من المستحسن في بعض الأحيان استخدام اللوغاريتم الأولي للصيغة (1.11)، لأن التعبير (1.9.) يحتوي على منتجات بكميات صغيرة.

إذا تم تنفيذ مجموعة معينة من الميزات ل * يكون تحديد للتشخيص د ص, ثم لا يحدث هذا المجمع في التشخيصات الأخرى:

ثم بحكم المساواة (1.11.)

وبالتالي، فإن المنطق الحتمي للتشخيص هو حالة خاصة من المنطق الاحتمالي. يمكن أيضًا استخدام صيغة بايز في الحالة التي يكون فيها بعض الميزات توزيعًا منفصلاً، والجزء الآخر له توزيع مستمر. للتوزيع المستمر، يتم استخدام كثافات التوزيع. ومع ذلك، في خطة الحساب، يكون الاختلاف المحدد في الخصائص غير مهم إذا تم تعريف المنحنى المستمر باستخدام مجموعة من القيم المنفصلة.

3 . مصفوفة التشخيص

لتحديد احتمالية التشخيص باستخدام طريقة بايز، من الضروري إنشاء مصفوفة تشخيصية (الجدول 1.1)، والتي يتم تشكيلها على أساس المواد الإحصائية الأولية. يحتوي هذا الجدول على احتمالات فئات الأحرف للتشخيصات المختلفة.

الجدول 1.1

مصفوفة التشخيص في طريقة بايز

تشخبص د أنا	علامة ك ي
ك 1	ك 2
ف(ك 11 /د أنا)	ف(ك 12 /د أنا)	ف(ك 21 /د أنا)	ف(ك 22 /د أنا)	ف(ك 23 /د أنا)	ف(ك 24 /د أنا)	ف(ك 31 /د أنا)	ف(ك 32 /د أنا)
د 1
د 2

إذا كانت العلامات مكونة من رقمين (علامات بسيطة "نعم - لا")، ففي الجدول يكفي الإشارة إلى احتمالية ظهور العلامة ف(ك أنا/د أنا). احتمال فقدان الميزة ر ( /د،-) = 1 - ف(ك أنا/د أنا).

ومع ذلك، فمن الملائم أكثر استخدام نموذج موحد، بافتراض، على سبيل المثال، علامة مكونة من رقمين ص (ك ي/د أنا) = ر (ك أنا 1 /د أنا); ر ( / د،) = ف(ك أنا 2 /د أنا).

لاحظ أن ف(ك js/دي) = 1، حيث تي، -- عدد أرقام السمات ك ي. مجموع احتمالات جميع التطبيقات الممكنة للميزة يساوي واحدًا.

تتضمن المصفوفة التشخيصية احتمالات مسبقة للتشخيص. تتكون عملية التعلم في طريقة بايز من تشكيل مصفوفة تشخيصية. من المهم توفير إمكانية توضيح الجدول أثناء عملية التشخيص. للقيام بذلك، لا ينبغي تخزين القيم فقط في ذاكرة الكمبيوتر ف(ك js/ دي)، ولكن أيضا الكميات التالية: ن - العدد الإجمالي للكائنات المستخدمة لتجميع المصفوفة التشخيصية؛ ن أنا د أنا; ن اي جاي - عدد الكائنات مع التشخيص د أنا, تم فحصه على أساس ك ي. إذا وصل كائن جديد مع التشخيص د م، ثم يتم تعديل الاحتمالات المسبقة السابقة للتشخيص.

بعد ذلك، يتم إدخال التصحيحات على احتمالات الميزات. دع الكائن الجديد مع التشخيص د م تم الكشف عن التفريغ صلافتة ك ي. ثم، لمزيد من التشخيص، يتم قبول القيم الجديدة لفترات الاحتمالية للميزة ك ي عند التشخيص د م:

لا تتطلب الاحتمالات الشرطية لعلامات التشخيصات الأخرى التعديل.

خاتمة

في طريقة بايز، كائن ذو مجموعة من الميزات ل * يشير إلى التشخيص ذو الاحتمالية الأعلى (الخلفي).

ك* د أنا, لو ف(د أنا/ ك *)> ف(د ي/ ك *) (ي = 1, 2,..., ن; أنا؟ ي). (1.17.)

رمز ، المستخدمة في التحليل الوظيفي، تعني الانتماء إلى مجموعة. تشير الحالة (1.17.) إلى أن الكائن يمتلك تنفيذًا معينًا لمجموعة معقدة من الخصائص ل * أو باختصار التنفيذ ل * ينتمي إلى التشخيص (الحالة) د أنا. يتم عادةً توضيح القاعدة (1.17.) من خلال إدخال قيمة عتبة لاحتمال التشخيص:

ف(د أنا/ ك *) ? ص أنا, (1.18.)

أين ص أنا. - محدد مسبقًا مستوى الاعترافللتشخيص د أنا. في هذه الحالة، فإن احتمال أقرب تشخيص منافس لا يزيد عن 1 - ص أنا. عادة ما يتم قبولها ص أنا؟ 0.9. بشرط

ف(د أنا/ ك *)

أنا (1.19.)

لم يتم اتخاذ قرار بشأن التشخيص (رفض الاعتراف) وهناك حاجة إلى معلومات إضافية.

تتم عملية اتخاذ القرار بطريقة بايز عند الحساب على الكمبيوتر بسرعة كبيرة. على سبيل المثال، يستغرق إجراء تشخيص لـ 24 حالة باستخدام 80 علامة متعددة الأرقام بضع دقائق فقط على جهاز كمبيوتر بسرعة تتراوح من 10 إلى 20 ألف عملية في الثانية.

كما هو موضح، فإن طريقة بايز لها بعض العيوب، على سبيل المثال، الأخطاء في التعرف على التشخيصات النادرة. في الحسابات العملية، يُنصح بإجراء تشخيصات لحالة التشخيصات المحتملة بنفس القدر

ف(د أنا) = لتر / ن (1.20.)

عندها سيكون للتشخيص أكبر قيمة احتمالية خلفية د أنا، لأي منهم ص (ك* /د أنا) أقصى:

ك* د أنا, لو ف(ك* /د أنا) > ف(ك* /د ي) (ي = 1, 2,..., ن; أنا؟ ي). (1.21.)

وبعبارة أخرى، يتم التشخيص د أنا إذا كانت هذه المجموعة من الأعراض أكثر شيوعًا أثناء التشخيص د أنامن مع التشخيصات الأخرى. تتوافق قاعدة القرار هذه طريقة الاحتمالية القصوى ويترتب على ما سبق أن هذه الطريقة هي حالة خاصة من طريقة بايز ولها نفس احتمالات التشخيص السابقة. في طريقة الاحتمالية القصوى، تتمتع التشخيصات "الشائعة" و"النادرة" بحقوق متساوية.

قائمة المصادر المستخدمة

1. Gorelik، A. L. طرق التعرف [النص]: كتاب مدرسي. دليل للجامعات / A. L. Gorelik، V. A. Skripkin. - م: أعلى. المدرسة، 2004. - 261 ص.

2. Sapozhnikov، V. V. أساسيات التشخيص الفني [النص]: كتاب مدرسي. بدل / V. V. Sapozhnikov، Vl. في.سابوزنيكوف. - م: الطريق، 2004. - 318 ص.

3. Serdakov، A. S. التحكم الآلي والتشخيص الفني [نص] / A. S. Serdakov. - كييف: التكنولوجيا، 1971. - 244 ص.

4. ستيتسيوك. A. E. "أساسيات التشخيص الفني. نظرية الاعتراف": كتاب مدرسي. بدل / A. E. Stetsyuk، Ya.Yu.Bobrovnikov. - خاباروفسك: دار النشر DVGUPS، 2012. - 69 ص.

تم النشر على موقع Allbest.ru

وثائق مماثلة

دراسة الخوارزميات الأكثر شيوعًا لحل المشكلات ذات الطبيعة الاحتمالية. التعرف على عناصر التوافقيات، نظرية الجرة، صيغة بايز، طرق إيجاد المتغيرات العشوائية المنفصلة والمستمرة. النظر في أساسيات جبر الحدث.
دليل التدريب، تمت إضافته في 05/06/2010

تحديد وتقييم احتمالية وقوع حدث معين. أسلوب لحل مسألة باستخدام نظرية الجمع والضرب، أو صيغة الاحتمالية الإجمالية، أو بايز. تطبيق مخطط برنولي في حل المشكلات. حساب الانحراف التربيعي.
العمل العملي، تمت إضافته في 23/08/2015

التعريف الإحصائي والبديهي والكلاسيكي للاحتمال. المتغيرات العشوائية المنفصلة. نظريات الحد من لابلاس وبواسون. دالة التوزيع الاحتمالي للمتغيرات العشوائية متعددة المتغيرات. صيغة بايز. تقدير نقطة التباين.
ورقة الغش، تمت إضافتها في 05/04/2015

حساب احتمالية عدم سداد القرض من قبل كيان قانوني وفرد باستخدام صيغة بايز. حساب تباين العينة ومنهجيته ومراحله الرئيسية. تحديد احتمال سقوط كرة بيضاء من بين ثلاث كرات تم أخذها عشوائيًا، تبرير النتيجة.
تمت إضافة الاختبار في 11/02/2014

تطبيق صيغ وقوانين نظرية الاحتمالات في حل المسائل. صيغة بايز، التي تسمح لك بتحديد احتمالية حدث ما، بشرط وقوع حدث آخر مترابط إحصائيًا معه. نظرية الحد المركزي.
تمت إضافة الدورة التدريبية في 11/04/2015

تجربة ذات نتائج عشوائية. الاستقرار الإحصائي. مفهوم الاحتمال. جبر الأحداث. مبدأ ازدواجية الأحداث. الاحتمالات الشرطية صيغ الجمع والضرب في الاحتمالات. صيغة بايز. مساحة الأحداث الابتدائية.
الملخص، أضيف في 12/03/2007

تحديد احتمالية الحصول على 4 نقاط على الأقل على حجر النرد عند رميه مرة واحدة. تحديد احتمالية إنتاج جزء ما (إذا كان الجزء المأخوذ عشوائياً من قبل المجمع ذو جودة ممتازة) من قبل المصنع الأول باستخدام صيغة بايز.
تمت إضافة الاختبار في 29/05/2012

مؤشرات الموثوقية كمؤشرات لموثوقية الأشياء غير القابلة للإصلاح. التعريف الكلاسيكي والهندسي للاحتمال. تكرار الحدث العشوائي و"التعريف الإحصائي" للاحتمال. احتمال الجمع ونظريات الضرب.
تمت إضافة الدورة التدريبية في 18/11/2011

المتغيرات العشوائية المنفصلة وتوزيعاتها. صيغة الاحتمالية الإجمالية وصيغة بايز. الخصائص العامة للتوقع الرياضي. تباين متغير عشوائي. دالة التوزيع لمتغير عشوائي. التعريف الكلاسيكي للاحتمال.
تمت إضافة الاختبار في 13/12/2010

النماذج الرياضية للظواهر أو العمليات. تقارب طريقة التكرار البسيطة. تقدير الخطأ اللاحق. طريقة دوران الأنظمة الخطية. التحكم في الدقة والحل التقريبي في إطار الطريقة المباشرة. طريقة الاسترخاء وطريقة غاوس.

مقدمة
تشير طريقة بايز إلى طرق التعرف الإحصائي، وتتمثل الميزة الرئيسية لها في القدرة على مراعاة ميزات الطبيعة الفيزيائية المختلفة في نفس الوقت. ويرجع ذلك إلى حقيقة أن جميع العلامات تتميز بكميات بلا أبعاد - احتمالات حدوثها في حالات مختلفة من النظام.

تحتل الطريقة البايزية، بسبب بساطتها وكفاءتها، مكانة خاصة بين طرق التشخيص التقنية، على الرغم من أن لها أيضًا عيوب، على سبيل المثال، كمية كبيرة من المعلومات الأولية، و"قمع" التشخيصات النادرة، وما إلى ذلك. ومع ذلك، في الحالات التي تسمح كمية المعلومات الإحصائية باستخدام الطريقة البايزية، ومن المستحسن استخدامها باعتبارها واحدة من أكثر الطرق موثوقية وفعالية.

أساسيات طريقة بايز

تعتمد الطريقة على صيغة بايز (صيغة احتمالية الفرضيات).

إذا كان هناك تشخيص د أناوعلامة بسيطة ك ي ، التي تحدث مع هذا التشخيص، ثم احتمال وقوع الأحداث المشتركة (وجود الحالة في الكائن د أناوالتوقيع ك ي) ، يتم تحديده بواسطة الصيغة:

ف(د أنا ك ي ) = ف(د أنا ) ف (ك ي /د أنا ) = ف (ك ي ) ف (د أنا / ك ي ). (1.1.)

من هذه المساواة تتبع صيغة بايز:

ف(د أنا / ك ي ) = ف(د أنا ) ف(ك أنا /د أنا )/ف(ك ي ) (1.2.)

من المهم جدًا تحديد المعنى الدقيق لجميع الكميات المدرجة في هذه الصيغة.

ص(د أنا)--احتمال التشخيص د أنا، محدد من البيانات الإحصائية ( احتمال التشخيص المسبق). لذلك، إذا تم فحصها مسبقا نالكائنات و ن أناالكائنات كان لها شرط د أنا، الذي - التي

ص(د أنا) = ن أنا /ن. (1.3.)

ص (ك ي /د أنا ك ي للكائنات ذات الحالة د أنا .

إذا كان من بين ن أناالأشياء مع التشخيص د أنا، ذ ن اي جايظهرت علامة ك ي ثم ارتباط بايز الاحتمالي

ص(ك ي /د أنا) = ن اي جاي /ن أنا . (1.4.)

ص(ك ي)--احتمال حدوث إشارة ك يفي جميع الكائنات، بغض النظر عن حالة (تشخيص) الكائن. اسمحوا من العدد الإجمالي نعلامة الكائنات ك يتم العثور عليه في ن يالكائنات إذن

ف(ك ي ) = ن ي /ن. (1.5.)

لإنشاء التشخيص، حساب خاص ص(كج) غير مطلوب. كما سيتضح مما يلي المعنى ص(د أنا)و ص (ك ي /د أنا)، المعروف بجميع الحالات الممكنة، حدد القيمة ص(ك ي ).

عدم المساواة ص (د أنا /ك ي) - احتمال التشخيص د أنابعد أن تبين أن الشيء المعني يتمتع بهذه الصفة ك ي (الاحتمال الخلفي للتشخيص).

دوغلاس دبليو هوباردفصل من كتاب "كيفية قياس أي شيء." "تقدير قيمة الأصول غير الملموسة في الأعمال"
دار النشر "أوليمبوس بيزنس"

الجدول 1. صفوف فردية من جدول العمليات الحسابية باستخدام الانعكاس البايزي
يبدو أن معدل الاحتفاظ بالعملاء لدينا ليس جيدًا. لكننا سنعيد حساب تكلفة هذه المعلومات، وعلى الرغم من أنها ستنخفض، إلا أنه يتبين أنه لا يزال من المنطقي إجراء قياسات إضافية. دعونا نختار 40 مشتريًا إضافيًا، وبعد ذلك سيكون هناك 60 شخصًا إجمالاً. ومن بين هؤلاء الـ 60، سيقول 39 فقط أنهم سيعودون إلى متجرنا. سيكون نطاق الثقة 90% الجديد لدينا هو 69-80%. ويساوي الحد الأعلى الآن العتبة الحرجة الأصلية التي تبلغ 80%، مما يمنحنا ثقة بنسبة 95% في أن معدل المشتري المتكرر منخفض بالدرجة الكافية التي تتطلب منا إجراء تغييرات كبيرة ومكلفة.
تبين أن الحسابات معقدة للغاية، ولكن تذكر أنه يمكنك استخدام الجداول المتوفرة على موقع الدعم الخاص بنا. ومن المحتمل جدًا أن تكون الطريقة البايزية الذاتية التي تمت مناقشتها مسبقًا، والتي تم تطبيقها من قبل خبراء معايرين، قد نجحت في هذه الحالة. ربما يكشف استطلاع رأي العملاء عن مثل هذه العوامل النوعية التي سيتمكن المتخصصون المعايرون لدينا من أخذها بعين الاعتبار. ومع ذلك، فإن تكلفة هذه القياسات المهمة مرتفعة بما يكفي لتبرير جهودنا الإضافية.

تجنب انعكاس الملاحظة

يطرح الكثير من الناس السؤال التالي: "ما النتيجة التي يمكنني استخلاصها من هذه الملاحظة؟" لكن بايز أوضح لنا أنه من المفيد غالبًا أن نسأل: "ما الذي يجب أن ألاحظه إذا كان الشرط X صحيحًا؟" الإجابة على السؤال الأخير تسمح لنا بفهم السؤال الأول.

على الرغم من أن الانعكاس البايزي قد يبدو كثيف العمالة للوهلة الأولى، إلا أنه أحد أكثر طرق القياس كفاءة المتاحة لدينا. إذا تمكنا من صياغة السؤال "ما هو احتمال رؤية X إذا كان Y صحيحًا؟" وتحويلها إلى "ما هو احتمال أن يكون Y صحيحًا إذا لاحظنا X؟"، عندها يمكن حل عدد كبير من مسائل القياس. في الواقع، هذه هي الطريقة التي نجد بها إجابات لمعظم الأسئلة العلمية. إذا كانت الفرضية المقترحة صحيحة، فماذا يجب أن نلاحظ؟
على العكس من ذلك، يبدو أن العديد من المديرين يعتقدون أن كل القياسات تتلخص في العثور على إجابات للسؤال: "ما الذي يجب أن أستنتجه مما أرى؟" عندما يبدو أنه قد تم ارتكاب خطأ رصدي، يقرر الناس أنه لا يمكن استخلاص أي استنتاجات على هذا الأساس، بغض النظر عن مدى انخفاض احتمال حدوث مثل هذا الخطأ. ومع ذلك، يظهر التحليل بايزي أن الأخطاء التي يتخيلها المديرون غير محتملة للغاية وأن هذا القياس من شأنه أن يقلل بشكل كبير من عدم اليقين الحالي. بمعنى آخر، يؤدي الافتقار إلى الفهم النظري على الأقل للانعكاس البايزي إلى قلب السؤال والاعتقاد بأن الأخطاء ذات الاحتمالية المنخفضة تقلل من قيمة القياسات إلى الصفر - أي إلى الشكل الأكثر مؤسفًا من "انعكاس الملاحظة" ".
ملحوظات

1 ديفيد م. جريثر، محمود عبد الجمل. هل الناس بايزي؟ الكشف عن الاستراتيجيات السلوكية // ورقة عمل العلوم الاجتماعية 919، 1995، معهد كاليفورنيا للتكنولوجيا.
2 توم دي ماركو، تيموثي ليستر. Peopleware: المشاريع والفرق الإنتاجية. الطبعة الثانية. نيويورك: دورست هاوس للنشر، 1999.
FYP - ربح السنة الأولى، ربح السنة الأولى. - ملحوظة. مترجم
عدم الدقة: يرد رقم نسبة السكان في الفصل 9 (انظر الشكل 9.2). - ملحوظة. محرر.

تحديد مهام التشخيص الفني

الاتجاهات الرئيسية للتشخيص الفني

أساسيات التشخيص الفني

القسم رقم 5

تعريفات.يأتي مصطلح "التشخيص" من الكلمة اليونانية "التشخيص" التي تعني الاعتراف والتصميم.

أثناء عملية التشخيص، يتم إنشاء التشخيص، أي. يتم تحديد حالة المريض (التشخيص الطبي) أو حالة النظام الفني (التشخيص الفني).

التشخيص الفني هو علم التعرف على حالة النظام الفني.

أهداف التشخيص الفني.دعونا نفكر بإيجاز في المحتوى الرئيسي للتشخيص الفني. يدرس التشخيص الفني طرق الحصول على المعلومات التشخيصية وتقييمها ونماذج التشخيص وخوارزميات اتخاذ القرار. الغرض من التشخيص الفني هو زيادة موثوقية وعمر خدمة الأنظمة التقنية.

كما هو معروف فإن أهم مؤشر للموثوقية هو عدم وجود أعطال أثناء تشغيل (تشغيل) النظام الفني. يمكن أن يؤدي فشل محرك الطائرة أثناء ظروف الطيران، أو تعطل آلات السفينة أثناء رحلة السفينة، أو تشغيل محطات الطاقة تحت الحمل إلى عواقب وخيمة.

التشخيص الفني، بفضل الاكتشاف المبكر للعيوب والأعطال، يجعل من الممكن القضاء على مثل هذه الأعطال أثناء عملية الصيانة، مما يزيد من موثوقية وكفاءة التشغيل، كما يجعل من الممكن تشغيل الأنظمة الفنية الهامة وفقًا لحالتها.

من الناحية العملية، يتم تحديد عمر خدمة هذه الأنظمة من خلال النسخ "الأضعف" من المنتجات. أثناء التشغيل على أساس الحالة، يتم تشغيل كل عينة وفقًا لحالتها المحددة وفقًا لتوصيات نظام التشخيص الفني. يمكن أن يحقق التشغيل على أساس الحالة فوائد تعادل تكلفة 30% من إجمالي الأسطول.

المهام الرئيسية للتشخيص الفني. يحل التشخيص الفني مجموعة واسعة من المشكلات، يرتبط الكثير منها بمشاكل التخصصات العلمية الأخرى. تتمثل المهمة الرئيسية للتشخيص الفني في التعرف على حالة النظام الفني في ظل المعلومات المحدودة.

يُطلق على التشخيص الفني أحيانًا اسم التشخيص الموضعي، أي التشخيص الذي يتم إجراؤه دون تفكيك المنتج. يتم إجراء تحليل الحالة في ظل ظروف التشغيل التي يكون فيها الحصول على المعلومات أمرًا صعبًا للغاية. في كثير من الأحيان لا يمكن استخلاص نتيجة لا لبس فيها من المعلومات المتاحة ويجب استخدام الأساليب الإحصائية.

ينبغي اعتبار النظرية العامة للتعرف على الأنماط الأساس النظري لحل المشكلة الرئيسية للتشخيص الفني. تتناول هذه النظرية، التي تشكل قسمًا مهمًا من علم التحكم الآلي التقني، التعرف على الصور من أي طبيعة كانت (هندسية، صوتية، إلخ)، والتعرف الآلي على الكلام، والنصوص المطبوعة والمكتوبة بخط اليد، وما إلى ذلك. يدرس التشخيص الفني خوارزميات التعرف كما يتم تطبيقها على مشكلات التشخيص، والتي يمكن عادةً اعتبارها مشكلات تصنيف.

تعتمد خوارزميات التعرف في التشخيص الفني جزئيًا على نماذج التشخيص التي تنشئ اتصالاً بين حالات النظام الفني وخرائطها في مساحة الإشارات التشخيصية. جزء مهم من مشكلة الاعتراف هي قواعد القرار (قواعد القرار).

إن حل مشكلة التشخيص (تصنيف المنتج على أنه صالح للخدمة أو معيب) يرتبط دائمًا بخطر الإنذار الكاذب أو فقدان الهدف. لاتخاذ قرار مستنير، يُنصح باستخدام أساليب نظرية القرار الإحصائي، التي تم تطويرها لأول مرة في الرادار.

يرتبط حل مشكلات التشخيص الفني دائمًا بالتنبؤ بالموثوقية لفترة التشغيل التالية (حتى الفحص الفني التالي). وهنا يجب أن تعتمد القرارات على نماذج الفشل المدروسة في نظرية الموثوقية.

المجال الثاني المهم للتشخيص الفني هو نظرية إمكانية التحكم. القدرة على التحكم هي خاصية للمنتج لتوفير تقييم موثوق به

الحالة الفنية والكشف المبكر عن الأعطال والأعطال. يتم إنشاء إمكانية التحكم من خلال تصميم المنتج ونظام التشخيص الفني المعتمد.

تتمثل المهمة الرئيسية لنظرية قدرة التحكم في دراسة وسائل وطرق الحصول على المعلومات التشخيصية. تستخدم الأنظمة التقنية المعقدة مراقبة الحالة تلقائيًا، والتي تتضمن معالجة المعلومات التشخيصية وتوليد إشارات التحكم. تشكل طرق تصميم أنظمة التحكم الآلي أحد مجالات نظرية إمكانية التحكم. أخيرًا، ترتبط المهام المهمة جدًا لنظرية التحكم بتطوير خوارزميات اكتشاف الأخطاء، وتطوير الاختبارات التشخيصية، وتقليل عملية إنشاء التشخيص.

نظرًا لحقيقة أن التشخيص الفني تم تطويره في البداية فقط للأنظمة الإلكترونية الراديوية، فإن العديد من المؤلفين يربطون نظرية التشخيص الفني بنظرية إمكانية التحكم (اكتشاف الأخطاء ومراقبتها)، والتي، بالطبع، تحد من نطاق تطبيق التشخيص الفني.

هيكل التشخيص الفني. في التين. يوضح الشكل 5.1 هيكل التشخيص الفني. وتتميز باتجاهين متداخلين ومترابطين: نظرية الاعتراف ونظرية القدرة على التحكم. تحتوي نظرية التعرف على أقسام تتعلق ببناء خوارزميات التعرف وقواعد القرار ونماذج التشخيص. تتضمن نظرية إمكانية التحكم تطوير الأدوات والأساليب للحصول على المعلومات التشخيصية والتحكم الآلي واستكشاف الأخطاء وإصلاحها. يجب اعتبار التشخيص الفني جزءًا من النظرية العامة للموثوقية.

أرز. 5.1. هيكل التشخيص الفني

ملاحظات تمهيدية.يجب أن يكون من الضروري تحديد حالة التوصيل المخدد لأعمدة علبة التروس في ظل ظروف التشغيل. عندما يتم ارتداء الخطوط أكثر من اللازم، تظهر التشوهات وأضرار التعب. من المستحيل إجراء فحص مباشر للخطوط، لأنه يتطلب تفكيك علبة التروس، أي إيقاف التشغيل. يمكن أن يؤثر خلل في وصلة المفتاح على طيف الاهتزاز في علبة التروس والاهتزازات الصوتية ومحتوى الحديد في الزيت وغيرها من المعالم.

تتمثل مهمة التشخيص الفني في تحديد درجة تآكل الشريحة (عمق الطبقة السطحية المدمرة) بناءً على بيانات القياس لعدد من المعلمات غير المباشرة. كما هو موضح، فإن إحدى الميزات المهمة للتشخيص الفني هي التعرف في ظروف المعلومات المحدودة، عندما يكون من الضروري الاسترشاد بتقنيات وقواعد معينة لاتخاذ قرار مستنير.

حالة النظاميتم وصفه بواسطة مجموعة (مجموعة) من المعلمات المحددة (الميزات). بالطبع، قد تكون مجموعة المعلمات (الميزات) المحددة مختلفة، في المقام الأول فيما يتعلق بمهمة التعرف نفسها. على سبيل المثال، للتعرف على حالة مفصل شريحة المحرك، تكون مجموعة معينة من المعلمات كافية، ولكن يجب استكمالها إذا تم تشخيص أجزاء أخرى أيضًا.

التعرف على حالة النظام- تخصيص حالة النظام لإحدى الفئات المحتملة (التشخيصات). يعتمد عدد التشخيصات (الفئات والظروف النموذجية والمعايير) على خصائص المشكلة وأهداف الدراسة.

غالبًا ما يكون من الضروري اختيار أحد التشخيصين (التشخيص التفريقي أو الانقسام)؛ على سبيل المثال، "حالة جيدة" و"حالة معيبة". في حالات أخرى، من الضروري وصف الحالة الخاطئة بمزيد من التفصيل، على سبيل المثال، زيادة تآكل الخطوط، وزيادة اهتزاز الشفرات، وما إلى ذلك. في معظم مشاكل التشخيص الفني، يتم إنشاء التشخيص (الفئات) مسبقًا، وفي هذه الحالات غالبًا ما تسمى مشكلة التعرف بمشكلة التصنيف.

نظرا لأن التشخيص الفني يرتبط بمعالجة كمية كبيرة من المعلومات، فغالبا ما يتم اتخاذ القرار (الاعتراف) باستخدام أجهزة الكمبيوتر الإلكترونية (أجهزة الكمبيوتر).

يتم استدعاء مجموعة الإجراءات المتسلسلة في عملية التعرف خوارزمية التعرف.جزء أساسي من عملية الاعتراف هو اختيار المعلمات،وصف حالة النظام. ويجب أن تكون غنية بالمعلومات بما فيه الكفاية بحيث يمكن تنفيذ عملية الفصل (الاعتراف) في ضوء العدد المحدد من التشخيصات.

الصياغة الرياضية للمشكلة.في المهام التشخيصية، غالبًا ما يتم وصف حالة النظام باستخدام مجموعة من العلامات

ك =(كل , ك 2 ,..., ك ي,..., كيلو فولت), (5.1)

أين ك ي- علامة لديها م يالتصريفات.

دعونا، على سبيل المثال، علامة ك يهي علامة مكونة من ثلاثة أرقام ( م ي= 3)، توصيف درجة حرارة الغاز خلف التوربين: منخفضة، عادية، مرتفعة. كل رقم (فاصل) من العلامة ك ييُشار إليه بـ ك شبيبةعلى سبيل المثال ارتفاع درجة الحرارة خلف التوربين ك يح. في الواقع، تتوافق الحالة المرصودة مع تنفيذ معين للخاصية، والتي يشار إليها بخط مرتفع *. على سبيل المثال، في درجات حرارة مرتفعة، تنفيذ هذه السمة ك * ي = ك يح.

بشكل عام، كل مثيل للنظام يتوافق مع بعض التنفيذ لمجموعة من الميزات:

ك* = (ك 1 * , ك 2 * ,..., ك ي *,..., كيلو فولت *). (5.2)

في العديد من خوارزميات التعرف، يكون من الملائم وصف النظام باستخدام المعلمات س ي، تشكيل الخامس- ناقل الأبعاد أو نقطة في الخامس-مساحة الأبعاد:

س =(سل، س 2 , س ي,،الخامس عشر). (5.3)

في معظم الحالات المعلمات س يلديها توزيع مستمر. على سبيل المثال، دعونا س ي- معلمة تعبر عن درجة الحرارة خلف التوربين. لنفترض أن المراسلات بين المعلمة س ي(درجة مئوية) وعلامة مكونة من ثلاثة أرقام ك يهذا هو:

< 450 إلى يل

450 - 550 إلى ي 2

> 500 إلى ي 3

فيفي هذه الحالة، باستخدام العلامة ك ييتم الحصول على وصف منفصل، في حين أن المعلمة س ييعطي وصفا مستمرا. لاحظ أنه مع الوصف المستمر، عادةً ما تكون هناك حاجة إلى قدر أكبر بكثير من المعلومات الأولية، لكن الوصف يكون أكثر دقة. ومع ذلك، إذا كانت القوانين الإحصائية لتوزيع المعلمة معروفة، فسيتم تقليل الكمية المطلوبة من المعلومات الأولية.

يتضح مما سبق أنه لا توجد فروق جوهرية عند وصف نظام باستخدام الميزات أو المعلمات، وسيتم استخدام كلا النوعين من الوصف في المستقبل.

كما هو مبين، في مشاكل التشخيص الفني الحالات المحتملة للنظام - التشخيص د ط- تعتبر مشهورة.

هناك طريقتان رئيسيتان لحل مشكلة الاعتراف: الاحتمالية والحتمية. صياغة المشكلةمع طرق التعرف الاحتمالية هذا هو الحال. يوجد نظام في إحدى الحالات العشوائية د ط. هناك مجموعة من العلامات (المعلمات) معروفة، كل منها يميز حالة النظام باحتمال معين. مطلوب إنشاء قاعدة قرار يتم من خلالها تعيين مجموعة العلامات المقدمة (المشخصة) إلى أحد الشروط المحتملة (التشخيصات). يُنصح أيضًا بتقييم موثوقية القرار المتخذ ودرجة خطورة القرار الخاطئ.

باستخدام طرق التعرف الحتمية، من الملائم صياغة المشكلة بلغة هندسية. إذا كان النظام يتميز الخامس-ناقل الأبعاد X ، فإن أي حالة للنظام هي نقطة في الفضاء ذي الأبعاد v للمعلمات (الميزات). من المفترض أن التشخيص D يتوافق مع منطقة معينة من مساحة الميزة المدروسة. مطلوب إيجاد قاعدة القرار التي بموجبها المتجه المقدم X * (الكائن الذي يتم تشخيصه) سيتم تخصيصه لمنطقة محددة من التشخيص. وبالتالي، فإن المهمة تتلخص في تقسيم مساحة الميزة إلى مناطق التشخيص.

في النهج الحتمي، عادة ما تعتبر مجالات التشخيص "غير متداخلة"، أي. احتمال تشخيص واحد (في المنطقة التي تقع فيها النقطة) يساوي واحدًا واحتمال التشخيص الآخر يساوي صفرًا. وبالمثل، من المفترض أن يكون كل عرض إما موجودًا مع تشخيص معين أو غائبًا.

ليس هناك اختلافات جوهرية بين النهج الاحتمالي والحتمي. تعتبر الطرق الاحتمالية أكثر عمومية، ولكنها تتطلب غالبًا قدرًا أكبر بكثير من المعلومات الأولية. تصف الأساليب الحتمية بشكل أكثر إيجازًا الجوانب الأساسية لعملية الاعتراف، وهي أقل اعتمادًا على المعلومات الزائدة عن الحاجة والمنخفضة القيمة، وأكثر اتساقًا مع منطق التفكير البشري.

توضح الفصول التالية خوارزميات التعرف الأساسية لمشكلات التشخيص الفني.
من بين طرق التشخيص التقنية، تحتل الطريقة المعتمدة على صيغة بايز المعممة مكانة خاصة بسبب بساطتها وكفاءتها.

بالطبع، طريقة بايز لها عيوب: كمية كبيرة من المعلومات الأولية، "قمع" التشخيصات النادرة، وما إلى ذلك. ومع ذلك، في الحالات التي يسمح فيها حجم البيانات الإحصائية باستخدام طريقة بايز، فمن المستحسن استخدامها واحدة من أكثر الطرق موثوقية وفعالية.

أساسيات الطريقة. تعتمد الطريقة على صيغة بايز البسيطة. إذا كان هناك تشخيص د طوعلامة بسيطة ك ي ، التي تحدث مع هذا التشخيص، ثم احتمال وقوع الأحداث المشتركة (وجود الحالة في الكائن د طوالتوقيع ك ي)

ف (د ط كي) = ف (د ط) ف ( كي/د ط) = ف ( كي) ف(دي/ كي). (5.4)

تنبع صيغة بايز من هذه المساواة (انظر الفصل 11).

ف(د ط / كي) = ف(د ط) ف( كط /د ط)/ف( ك ي) (5.5)

من المهم جدًا تحديد المعنى الدقيق لجميع الكميات المدرجة في هذه الصيغة.

ص(د ط) - احتمال التشخيص د ط، محدد من البيانات الإحصائية ( احتمال التشخيص المسبق). لذلك، إذا تم فحصها مسبقا نالكائنات و ن طالكائنات كان لها شرط د ط، الذي - التي

ص(د ط) = ن ط/ن. (5.6)

ص(ك ي/د ط) - ك ي للكائنات ذات الحالة د ط. إذا كان من بين ن طالأشياء مع التشخيص د ط، ذ ن جظهرت علامة ك ي ، الذي - التي

ص(ك ي/د ط) = نيج / ني. (5.7)

ص(ك ي) - احتمال حدوث علامة ك يفي جميع الكائنات، بغض النظر عن حالة (تشخيص) الكائن. دع العدد الإجمالي نعلامة الكائنات ك ياكتشف ن يالكائنات إذن

ف( ك ي ) = ن ي/ن. (5.8)

لإنشاء التشخيص، حساب خاص ص(كج) غير مطلوب. كما سيتضح مما يلي , قيم ص(د ط)و ص(ك ي/ د ط), المعروفة لجميع الحالات الممكنة، تحديد القيمة ص(ك ي).

المساواة (3.2) ص(د ط/ك ي)- احتمال التشخيص د طبعد أن تبين أن الشيء المعني يتمتع بهذه الصفة ك ي (الاحتمال الخلفي للتشخيص).

صيغة بايز المعممة.تنطبق هذه الصيغة على الحالة التي يتم فيها إجراء الفحص وفق مجموعة من العلامات ل, بما في ذلك العلامات ك 1 , ك 2 , ..., كيلو فولت. كل من العلامات ك ي لقد م يالرتب ( ك يل، ك ي 2 , ..., ك شبيبة، ...،). ونتيجة للفحص يصبح تنفيذ الخاصية معروفا

ك ي *= ك شبيبة(5.9)

ومجمع العلامات بأكمله ك*. فِهرِس *, كما كان من قبل، يعني المعنى المحدد (تحقيق) للسمة. صيغة بايز لمجموعة من الميزات لها الشكل

ص(د ط/ل* )= ص(د ط)ص(ل */د ط)/ص(ل* )(أنا= 1, 2, ..., ن), (5.10)

أين ص(د ط/ل* ) - احتمال التشخيص د طبعد ظهور نتائج الفحص على مجموعة من العلامات ل, ص(د ط) - الاحتمال الأولي للتشخيص د ط(حسب الإحصائيات السابقة).

تنطبق الصيغة (5.10) على أي من نالحالات المحتملة (التشخيص) للنظام. من المفترض أن النظام موجود في حالة واحدة فقط من الحالات المحددة وبالتالي

في المشاكل العملية، غالبا ما يسمح بإمكانية وجود عدة دول أ 1 , ..., أ ص، وقد يحدث بعضها مع بعضها البعض. ثم، كما التشخيصات المختلفة د طوينبغي النظر في الظروف الفردية د 1 = أ 1 , ..., دكتور= أ صومجموعاتهم دكتور +1 = أ 1 ^ أ 2، ... الخ

دعنا ننتقل إلى التعريف ص(ل*/ د ط). إذا كانت مجموعة من الميزات تتكون من الخامسعلامات إذن

ص(ل*/ د ط) = ف( ك 1 */ د ط)ص(ك 2 */ك 1* د ط)...ص(كيلو فولت*/كل *...ك*الخامس- 1 د ط), (5.12)

أين ك ي* = ك شبيبة- فئة العلامة التي تم الكشف عنها نتيجة الفحص. لعلامات مستقلة تشخيصيا

ص(ل*/ د ط) = ص(ك 1 */ د ط) ص(ك 2 */ د ط)... ص(كيلو فولت */ د ط). (5.13)

في معظم المشاكل العملية، وخاصة مع وجود عدد كبير من الميزات، من الممكن قبول شرط استقلال الميزات حتى في ظل وجود ارتباطات كبيرة بينها.

احتمال ظهور مجموعة من العلامات ل*

ص(ل *)= ص(د ق)ص(ل */د ق). (5.14)

يمكن كتابة صيغة بايز المعممة على النحو التالي :

ص(د ط/ك* ) (5.15)

أين ص(ل*/ د ط) يتم تحديدها بالمساواة (5.12) أو (5.13). من العلاقات (5.15) يتبع

ص(د ط/ل *)=ل , (5.16)

وهذا بالطبع يجب أن يكون هو الحال، حيث أن أحد التشخيصين قد تحقق بالضرورة، ومن المستحيل تحقيق تشخيصين في نفس الوقت.

تجدر الإشارة إلى أن مقام صيغة بايز هو نفسه لجميع التشخيصات. وهذا يسمح لنا أولاً بتحديد احتمالات الحدوث المشترك أنا-التشخيص ونظرا لتنفيذ العلامات المعقدة

ص(د طل *) = ص(د ط)ص(ل */د ط) (5.17)

ومن ثم الاحتمال الخلفي للتشخيص

ص(د ط/ل *) = ص(د ط ل *)/ص(د ق ل *). (5.18)

لاحظ أنه من المستحسن في بعض الأحيان استخدام اللوغاريتم الأولي للصيغة (5.15)، لأن التعبير (5.13) يحتوي على منتجات بكميات صغيرة.

إذا تم تنفيذ مجموعة معينة من الميزات ل * يكون تحديدللتشخيص موانئ دبي،ثم لا يحدث هذا المجمع في التشخيصات الأخرى:

ثم بحكم المساواة (5.15)

(5.19)

وبالتالي، فإن المنطق الحتمي للتشخيص هو حالة خاصة من المنطق الاحتمالي. يمكن أيضًا استخدام صيغة بايز في الحالة التي يكون فيها بعض الميزات توزيعًا منفصلاً، والجزء الآخر له توزيع مستمر. للتوزيع المستمر، يتم استخدام كثافات التوزيع. ومع ذلك، في خطة الحساب، يكون الاختلاف المحدد في الخصائص غير مهم إذا تم تعريف المنحنى المستمر باستخدام مجموعة من القيم المنفصلة.

مصفوفة التشخيص.لتحديد احتمالية التشخيص باستخدام طريقة بايز، من الضروري إنشاء مصفوفة تشخيصية (الجدول 5.1)، والتي يتم تشكيلها على أساس المواد الإحصائية الأولية. يحتوي هذا الجدول على احتمالات فئات الأحرف للتشخيصات المختلفة.

الجدول 5.1

مصفوفة التشخيص في طريقة بايز