«

»

সেপ্টে. 22

পরিসংখ্যান পরিচিতি – লেকচার ১৫ – নরমাল বিন্যাস (Normal Distribution)

০:০ সূচনা
১:০৫ নরমাল বিন্যাস কী?
৩:১০ সম্ভাবনা বিন্যাস: রিভিউ
৫:০০ উদাহরণ: পুরুষদের উচ্চতা
৬:০০ চিত্রে নরমাল বিন্যাস
৭:২৫ স্ট্যান্ডার্ড নরমাল বিন্যাস
৮:৩০ সম্ভাবনা ক্যালকুলেট করা: উদাহরণ (পুরুষদের উচ্চতা)
১২:০০ সারাংশ ও আগামী লেকচারের প্রিভিউ

ডাউনলোড লিংক:

MP4 (২২.১ মেগা)
3GP (৯.৭ মেগা)

 

গত দুই পর্বে আমরা বিচ্ছিন্ন দৈব চলকের সম্ভাবনা বিন্যাস নিয়ে আলোচনা করেছি। সেগুলো ছিল দ্বিপদ বিন্যাস আর পয়সোঁ বিন্যাস

আজ আমরা অবিচ্ছিন্ন দৈব চলকের সম্ভাবনা বিন্যাস নিয়ে আলোচনা করবো। মনে করে দেখুন দ্বিপদ বিন্যাসের ক্ষেত্রে আমাদের দৈব চলকটি একটি পরীক্ষণ n সংখ্যকবার পুনরাবৃত্তি করলে যতবার ‘সাফল্য’ আসবে তা গণনা করতো। যেমন ১২ বার টস করলে যতবার হেড উঠবে দ্বিপদ দৈব চলকটি সেটি প্রকাশ করে। লক্ষ্য করুন দৈব চলকটি ০ থেকে ১২ এর মধ্যে কেবল একটি মান গ্রহণ করতে পারে।

একই ভাবে কোন অন্তবর্তীকালীন সময়ে একটি ঘটনা যতবার ঘটে তা যে চলক দিয়ে প্রকাশ করা হয় সেই চলকটি পয়সোঁ বিন্যাস অনুসরণ করে। এই দৈব চলকটি ০ থেকে অসীম পর্যন্ত যেকোন বিচ্ছিন্ন সংখ্যা (discrete value) গ্রহণ করে। আপনার ফোনে প্রতি ঘন্টায় ২টি ফোন আসলে আগামী দুই ঘন্টায়  ৫টি ফোন আসার সম্ভাবনা আমরা পয়সোঁ বিন্যাস দিয়ে বের করতে পারবো। এরকম দৈব চলক ভগ্নাংশ মান গ্রহণ করতে পারেনা। অর্থাৎ দুই ঘন্টায় ৫.৫টি ফোন আসবে এমনটি সম্ভব নয়।

নরমাল বিন্যাস

নরমাল বিন্যাস একটি অবিচ্ছিন্ন দৈব চলকের (Continuous random variable) সম্ভাবনা বিন্যাস। কোন চলক এই বিন্যাস  অনুসরণ করলে চলকটি দুটি বাস্তব সংখ্যার মধ্যে যেকোন একটি মান গ্রহণ করবে তার সম্ভাবনা বের করতে পারবো। আগের অভিজ্ঞতায় দেখা গিয়েছে মানুষের উচ্চতা, ভর (ওজন) এসব নরমাল বিন্যাস অনুসরণ করে।  বাংলাদেশের পুরুষদের উচ্চতার বিন্যাস নরমাল হলে–

  • বাংলাদেশের একজন পুরুষকে যদি দৈব চয়নের মাধ্যমে নির্বাচন করা হয় তাহলে তার উচ্চতা ৫ ফুট থেকে ৫.৫ ফুটের মধ্যে হবে তার সম্ভাবনা কত?
  • কিংবা সেই লোকটির ভর (ওজন) ৬০ থেকে ৭০ কিলোগ্রামের মধ্যে হবে তার সম্ভাবনা কত?

একই রকম আরো কিছু উদাহরণ চিন্তা করা যাক–

  • জনমত জরিপে দেখা গেল ৫৫% উত্তরদাতা নগরসেবা বাড়ানো হবে এই শর্তে কর বাড়ানোর পক্ষে মত দিয়েছে। জরিপ থেকে প্রাপ্ত এই শতকরা মানটি প্রকৃতপক্ষে  (অর্থাৎ সেই জনগোষ্ঠীর সকলের মতামত যদি নেয়া যেতো তাহলে) ৪৫-৬৫% এর মধ্যে –তার সম্ভাবনা কত?
  • নির্বাচনের আগে প্রধান দুই রাজনৈতিক দল নানা সংস্থাকে দিয়ে জরিপ পরিচালনা করে থাকে। একটি দল জরিপ করে জেনেছে তাদের পক্ষে ৪৫% জনসমর্থন আছে। জনগোষ্ঠীতে এই সংখ্যা ৪২-৪৮% এর মধ্যে হবে তার সম্ভাবনা কত?

বাস্তবের এরকম নানা ঘটনায় নরমাল বিন্যাসের ব্যবহার দেখা যায়।

নরমাল বিন্যাস থেকে সম্ভাবনা বের করা

আগে আমরা জেনেছিলাম সম্ভাবনা বিন্যাস হলো একটি সারণি, বা একটি চিত্র, বা একটি গাণিতিক সূত্র যেখানে দৈব চলক কি কি মান গ্রহণ করতে পারে তার একটি তালিকা থাকে। সেই সাথে দৈব চলকটি যে একটি নির্দিষ্ট মান গ্রহণ করবে তার সম্ভাবনাও দেয়া থাকে। যদি ভুলে গিয়ে থাকেন তাহলে লেকচার ১২ তে আবার চোখ বুলিয়ে নিন।

নরমাল বিন্যাস যেহেতু একটি অবিচ্ছিন্ন চলকের বিন্যাস, তাই এর জন্য কোন সারণি তৈরী করা বাস্তবিক অর্থে সম্ভব নয়। কেননা দৈব চলকটি নেগেটিভ অসীম থেকে ধনাত্মক অসীম পর্যন্ত যেকোন মান গ্রহণ করতে পারে। আর তাছাড়া দৈব চলকটি যেহেতু দুটি সংখ্যার ব্যবধান (Interval) –এর সম্ভাবনা বের করে তাই এই ব্যবধানের মধ্যে যেকোন একটি মান গ্রহণ করার সম্ভবনা খুবই ছোট। এত ছোট যে আমরা তাকে শূন্য বলতে পারি।

নরমাল দৈব চলকের সম্ভাবনা বিন্যাসকে এভাবে লেখা হয়।

উপরের সূত্রে মিউ, এবং সিগমা’র মান জানা থাকলে X চলকটি a এবং b এর মধ্যে হবে—তার সম্ভাবনা আমরা ইন্টিগ্রেট করে বের করতে পারবো।

এখানে মিউ এবং সিগমা নরমাল বিন্যাসের দুটি প্যারামিটার। এ দুটি প্যারামিটারের মান জানা থাকলে আমরা যেকোন নরমাল বিন্যাস থেকে সম্ভাবনা বের করতে পারবো।

উদাহরণ: পুরুষদের উচ্চতা

ধরা যাক বাংলাদেশের পুরুষদের উচ্চতা একটি দৈব চলক যা নরমাল বিন্যাস অনুসরণ করে। এই বিন্যাসের গড় ৫.৫ এবং পরিমিত ব্যবধান (standard deviation) ০.৫. আপনি দৈব চয়নের মাধ্যমে যদি কাউকে নির্বাচন করেন তাহলে তার উচ্চতা ৫.২ ফুট থেকে ৫.৮ ফুটের মধ্যে হওয়ার সম্ভাবনা কত?

উত্তর

এখানে মিউ = ৫.৫ এবং সিগমা = ০.৫ এবং a = ৫.২ , b=৫.৮

এখন উপর সূত্রে মানগুলো বসিয়ে দিলেই সম্ভাবনা পাওয়া যাবে।

কিন্তু কাজটা সহজ নয়। ইন্টিগ্রেট করে সম্ভাবনা বের করা গেলেও মিউ এবং সিগমার অন্য মানের জন্য আমাদেরকে আবারো নতুন করে ইন্টিগ্রেট করতে হবে।

ইন্টিগ্রেশন না করে কি সম্ভাবনা বের করার কোন উপায় আছে?

হ্যাঁ, আছে। সেজন্য আমাদের নরমাল বিন্যাসের সারণি ব্যবহার করতে হবে। কিন্তু তার আগে আসুন ছবির মাধ্যমে জেনে নেই নরমাল বিন্যাস দেখতে কেমন এবং কিভাবে ছবি থেকে সম্ভাবনা বের করা যায়।

নরমাল বিন্যাস দেখতে বালির ঢিবির মত। কিংবা বলা যায় মাউন্টেইন এর মত।

বস্তা ভর্তি বালি যদি আপনি আস্তে আস্তে ঢালতে থাকেন তাহলে  যেরকম ঢিবি তৈরী হবে, নরমাল বিন্যাস দেখতে ঠিক সেরকম। নিচে (ক) চিহ্নিত ছবিটি একটি নরমাল বিন্যাসের ছবি। দেখা যাচ্ছে ছবিটির মাঝ বরাবর যে রেখাটি সেটি মিউ বা গড়। অর্থাৎ যে দৈব চলক নরমাল বিন্যাস অনুসরণ করে তার গড় = মিউ। ঢিবিটি কতটু উঁচু বা কতটা প্রসারিত হবে সেটি নির্ধারিত হয় সিগমা-এর মান দ্বারা। নরমাল দৈব চলকের পরিমিত ব্যবধান কে সিগমা দ্বারা চিহ্নিত করা হয়। মিউ এর মান জানা থাকলে বিন্যাসটির কেন্দ্র কোথায় তা বোঝা যায় আর সিগমা দিয়ে বিন্যাসটির আকার নির্ধারিত হয় বলে নরমাল বিন্যাসের ক্ষেত্রে মিউ এবং সিগমা-কে যথাক্রমে লোকেশন (location) এবং শেইপ (shape) প্যারামিটার বলা হয়।

কিভাবে জানবো যে একটি দৈব চলকের বিন্যাস নরমাল?

নানা ভাবেই জানতে পারি। তার মধ্যে একটি হলো অভিজ্ঞতা থেকে। যদি পূর্বাভিজ্ঞতা না থাকে তাহলে আমরা উপাত্ত (উপরে (খ) চিত্র দ্রষ্টব্য) থেকে হিস্টোগ্রাম এঁকে সেই হিস্টোগ্রামের উপর মসৃণ কার্ভ আকঁলে সেটা যদি মোটামুটি ঢিবির মতো দেখায় তাহলে আমরা বলতে পারবো যে দৈব চলকটি নরমাল বিন্যাস অনুসরণ করে। উপরের চিত্রে (গ) অংশ দ্রষ্টব্য। হিস্টোগ্রাম সম্পর্কে জানার জন্য লেকচার ৪ অনুসরণ করতে পারেন।

স্ট্যান্ডার্ড নরমাল বিন্যাস

লেকচার ৭ এ আমরা জেড-স্কোর নিয়ে আলোচনা করেছিলাম। আমরিকানরা জেড কে জি বলে। এজন্য জেড-স্কোরকে আমেরিকায় বলে জি-স্কোর। জেড স্কোরের কনসেপ্ট এখন আবার কাজে লাগবে।

জেড স্কোর দিয়ে আমরা উপাত্তকে স্ট্যান্ডারডাইজ করেছিলাম। তেমনি নরমাল বিন্যাসের দৈব চলককেও আমরা স্ট্যান্ডারডাইজ করব। এমনটা করার ফলে আমরা নতুন একটি নরমাল বিন্যাস পাবো যেটিকে আমরা রেফারেন্স বিন্যাস হিসেবে ব্যবহার করবো।

নরমাল বিন্যাসের একটি চলককে স্ট্যান্ডারডাইজ করে যে নতুন চলক আমরা পাবো তার বিন্যাস কে বলা হবে স্ট্যান্ডার্ড নরমাল বিন্যাস। এরকম একটি বিন্যাস থাকলে তার সারণি থেকে আমরা অতি সহজেই ইন্টিগ্রেশন না করেই সম্ভাবনা বের করতে পারবো।

অর্থাৎ X যদি নরমাল বিন্যাস অনুসরণ করে যার গড় মিউ এবং পরিমিত ব্যবধান সিগমা, তাহলে Z এর বিন্যাস হবে স্ট্যান্ডার্ড নরমাল। এটি এমন একটি নরমাল বিন্যাস যার গড় = ০ এবং পরিমিত ব্যবধান ১.

 

নরমাল বিন্যাস থেকে স্ট্যান্ডার্ড নরমাল বিন্যাস

তাহলে X যদি নরমাল বিন্যাস অনুসরণ করে যার গড় ৫ এবং পরিমিত ব্যবধান ২, তাহলে Z হবে (X-5)/2 এবং এর বিন্যাস হবে স্ট্যান্ডার্ড নরমাল যার গড় ০ এবং পরিমিত ব্যবধান ১ হবে।

ব্যাপারটা আরো ভালোভাবে বোঝার জন্য আমরা চিত্রের দিকে তাকাই।

লক্ষণীয় যে, স্ট্যান্ডার্ড নরমাল বিন্যাসের যে চলক সেটি আসলে জেড-স্কোর ছাড়া অন্য কিছু নয়। 

কিভাবে স্ট্যান্ডার্ড নরমাল বিন্যাস থেকে সম্ভাবনা বের করা যাবে?

এতক্ষণ আমরা জেনে গিয়েছি যে নরমাল থেকে স্ট্যান্ডার্ড নরমালে পরিণত করার জন্য আমাদেরকে পূর্বের দৈব চলক  X কে নতুন দৈব চলক Z এ পরিবর্তন করত হবে। তার জন্য আগের চলক থেকে গড় বাদ দিয়ে তাকে পরিমিত ব্যবধান দিয়ে ভাগ করতে হবে।

এবারে আমারা দেখবো কিভাবে সম্ভাবনা বের করা যায়। এজন্য আমরা প্রথমেই জেড চলকটি নেগেটিভ দশমিক ৫ থেকে ১ এর মধ্যে হবে তার সম্ভাবনা অর্থাৎ P(-.5 < Z < 1) বের করবো। নিচের চিত্রে এটি দেখানো হলো।

সবশেষে P(Z < -.5) এবং P(Z < 1) বের করার জন্য আমরা পরিসংখ্যানের সফটওয়্যার যেমেন R ব্যবহার করতে পারি। কিংবা স্ট্যান্ডার্ড নরমাল সারণি ব্যবহার করেও সম্ভাবনা বের করতে পারি।

R ব্যবহার করে কিভাবে সম্ভাবনাগুলো বের করা যাবে তা জানতে এই লেকচার দেখুন।

আর সারণি ব্যবহার করতে চাইলে এই সারণি দেখতে পারেন।

সারণি ব্যবহার করে আমরা পাই –

P(Z < 1) = .84134

P(Z < -.5) = .30854

তাহলে,

P(-.5 < Z < 1)

= P(Z < 1) – P(Z < -.5)

= .84134 – .30854

= .5328

আজ এপর্যন্ত ই থাক। আগামী দিন খুবই ইন্টারেস্টিং কিছু বিষয় নিয় আলোচনা করবো। আমরা দেখবো ১৬ কোটি জনগোষ্ঠি থেকে মাত্র ৬০০০ হাজার জনকে বাছাই করে তাদের মতামত নিয়ে পুরো জনগোষ্ঠির (১৬ কোটির)  মতামতের প্রতিফলন ঘটনো সম্ভব কিনা।

ভালো থাকুন, আর কোন প্রশ্ন থাকলে এখানে জানান।

কুইজ

ধরা যাক বাংলাদেশের পুরুষদের উচ্চতা একটি দৈব চলক যা নরমাল বিন্যাস অনুসরণ করে। এই বিন্যাসের গড় ৫.৫ ফুট এবং পরিমিত ব্যবধান (standard deviation) ০.৫. আপনি দৈব চয়নের মাধ্যমে যদি কাউকে নির্বাচন করেন তাহলে তার উচ্চতা ৫.২ ফুট থেকে ৫.৮ ফুটের মধ্যে হওয়ার সম্ভাবনা কত?

উত্তর: ০.৪৫১৫ বা ৪৫.১৫%

আগের লেকচার-এর লিংক

ভূমিকা

লেকচার ১ – উপাত্ত সংগ্রহ

লেকচার ২ – গবেষণা পদ্ধতি ও চলক সম্পর্কে ধারণা

লেকচার ৩ – ড্যাটা সামারি বা উপাত্ত সারাংশ (কোয়ালিটেটিভ ভ্যারিয়েবল)

লেকচার ৪ – হিস্টোগ্রাম ও ড্যাটার শেইপ

লেকচার ৫ – কেন্দ্রীয় প্রবণতা ও তার পরিমাপসমূহ

লেকচার ৬ – ভেদ ও এর পরিমাপসমূহ 

লেকচার ৭ – তুলনামূলক অবস্থান ও z-score

লেকচার ৮ – সম্ভাবনার খুঁটি 

লেকচার ৯ – গণনার পদ্ধতিসমূহ

লেকচার ১০ – সম্ভাবনা

লেকচার ১১ – কতিপয় জটিল ঘটনার সম্ভাবনা

লেকচার ১২ – দৈব চলক ও তার সম্ভাবনা বিন্যাস

লেকচার ১৩ – দ্বিপদ বিন্যাস

লেকচার ১৪ – পয়সোঁ বিন্যাস

কোর্সের সূচনা পাতা

Comments

comments

About the author

এনায়েতুর রহীম

পরিসংখ্যান নিয়ে আছি প্রায় দুই দশক -- এখনো শিখছি--পড়ে এবং পড়ানোর মাধ্যমে। ঢাকা বিশ্ববিদ্যালয় থেকে ফলিত পরিসংখ্যানে ব্যাচেলরস, মাস্টার্স। গবেষণা মূলত গাণিতিক পরিসংখ্যান নিয়ে। বিশেষভাবে কাজ করি রিগ্রেশন মডেলে Shrinkage and Absolute Penalty Estimation নিয়ে। আরো কাজ করি পরিসংখ্যান বিষয়ক সফটওয়্যার, মন্টি কারলো, রিস্যাম্পলিং, জনস্বাস্থ্য ও এপিডেমিওলজি, এবং পরিবেশ বিষয়ক পরিসংখ্যানে। কর্মজীবন শুরু ঢাকা বিশ্ববিদ্যালয়ে শিক্ষকতার মাধ্যমে। বর্তমানে ইউনিভার্সিটি অব নর্দার্ন কলোরাডো তে ফলিত পরিসংখ্যানের সহকারী অধ্যাপক হিসেবে কর্মরত। ব্যক্তিগত সাইট

1 ping

  1. পরিসংখ্যান পরিচিতি – লেকচার ১৭ – নিরূপণ (Estimation)

    […] লেকচার ১৫ – নরমাল বিন্যাস […]

Leave a Reply