শীর্ষ 60 ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

জানুয়ারী 2, 2022

উপাত্ত বিশ্লেষণকে উপাত্তের পরিদর্শন, রূপান্তর, পরিস্কার এবং উপযোগী তথ্য আবিষ্কার এবং সিদ্ধান্ত গ্রহণে সহায়তা করার লক্ষ্যে ডেটা মডেল করার প্রক্রিয়া হিসাবে সংজ্ঞায়িত করা হয়।

একজন ডেটা বিশ্লেষক কে? ডেটা বিশ্লেষক সংস্থার ডেটা বা তথ্যের দারোয়ান হিসাবে কাজ করে যাতে স্টেকহোল্ডাররা ডেটা বুঝতে পারে এবং কৌশলগত ব্যবসায়িক সিদ্ধান্ত নিতে এটি ব্যবহার করতে পারে। এটি এক ধরণের প্রযুক্তিগত ভূমিকা যার জন্য বিশ্লেষণ, কম্পিউটার মডেলিং, গণিত বা বিজ্ঞানে স্নাতক ডিগ্রি বা স্নাতকোত্তর ডিগ্রি প্রয়োজন।

ডেটা বিশ্লেষণের সরঞ্জামগুলি মূলত ব্যবসায়ের ডেটা থেকে দরকারী তথ্য বের করতে এবং ডেটা বিশ্লেষণ প্রক্রিয়াটিকে সহজ করতে ডেটা বিশ্লেষকদের সহায়তা করতে ব্যবহৃত হয়।



আমরা আমাদের ব্লগে সর্বাধিক জিজ্ঞাসিত ডেটা বিশ্লেষক প্রশ্ন এবং উত্তরগুলি নোট করেছি৷ নিশ্চিত করুন যে আপনি আমাদের শীর্ষ 60 ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর মাধ্যমে যান.

সুচিপত্র

শীর্ষ ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

1. বিশ্লেষণ সম্পাদন করার সময় ডেটা বিশ্লেষকরা সাধারণত যে সমস্যার সম্মুখীন হন আপনি কি আমাদের কিছু বলতে পারেন?

ডেটা বিশ্লেষকরা যে চ্যালেঞ্জগুলির মুখোমুখি হন তার কয়েকটি নীচে তালিকাভুক্ত করা হয়েছে:

    তথ্য সংগ্রহ করা হচ্ছে পরিমাণ: সংস্থা বা কোম্পানি প্রতিদিন প্রতিটি ঘটনা এবং মিথস্ক্রিয়া সম্পর্কে তথ্য পায়, হাজার হাজার ইন্টারলকিং ডেটা সেট সহ বিশ্লেষকদের রেখে যায়।অর্থপূর্ণ এবং রিয়েল-টাইম ডেটা সংগ্রহ করা: প্রচুর ডেটা উপলব্ধ থাকায়, বিশ্লেষকদের পক্ষে সম্পূর্ণ ডেটা খনন করা এবং সবচেয়ে বেশি প্রয়োজন এমন অন্তর্দৃষ্টিগুলি অ্যাক্সেস করা কঠিন৷তথ্যের ভিজ্যুয়াল উপস্থাপনা: শক্তিশালী ডেটা সিস্টেমগুলিকে বোতামের ক্লিকে রিপোর্ট বিল্ডিং সক্ষম করতে হবে৷ কর্মচারী এবং সিদ্ধান্ত গ্রহণকারীরা একটি আবেদনময় এবং শিক্ষামূলক বিন্যাসে তাদের প্রয়োজনীয় রিয়েল-টাইম তথ্যে অ্যাক্সেস পাবে।একাধিক উৎস থেকে ডেটা: এরপর, আমাদের একটি সমস্যা হল বিভিন্ন, একাধিক, বিচ্ছিন্ন উত্স জুড়ে ডেটা বিশ্লেষণ করার চেষ্টা করা। এখানে, ডেটার বিভিন্ন অংশ প্রায়ই বিভিন্ন সিস্টেমে রাখা হয়।অ্যাক্সেসযোগ্য ডেটা: একটি কেন্দ্রীভূত সিস্টেমে ডেটা স্থানান্তর করার একটি প্রভাব রয়েছে যদি এটি প্রয়োজন ব্যবহারকারীদের কাছে সহজে উপলব্ধ না হয়।খারাপ মানের ডেটা:ভাল ইনপুট ছাড়া, আউটপুট অবিশ্বস্ত হবে. তাই তারা যে সংগ্রহ করে তা সঠিক হতে হবে।সাহায্যের অভাব: ডেটা অ্যানালিটিক্স সাংগঠনিক সমর্থন ছাড়া কার্যকর হতে পারে না, উভয় শীর্ষ এবং নিম্ন-স্তরের কর্মচারীদের কাছ থেকে।

2. আপনি ডেটার একত্রীকরণ এবং বিচ্ছিন্নতা ব্যাখ্যা করতে পারেন?

মোট তথ্য সংখ্যাসূচক বা অ-সংখ্যাসূচক তথ্য বোঝায় যা একাধিক উত্স থেকে বা একাধিক পরিমাপ, ভেরিয়েবল বা ব্যক্তি থেকে সংগ্রহ করা হয় এবং প্রধানত পাবলিক রিপোর্টিং বা পরিসংখ্যানগত বিশ্লেষণের উদ্দেশ্যে ডেটা সারাংশ বা সারাংশ প্রতিবেদনে সংকলিত হয়।

বিচ্ছিন্ন ডেটা বিশদ উপ-শ্রেণীর দ্বারা বিভক্ত করা ডেটা, উদাহরণস্বরূপ, প্রান্তিক গোষ্ঠী, অঞ্চল, লিঙ্গ বা শিক্ষার স্তর দ্বারা। একত্রিত করা ডেটা বঞ্চনা এবং অসমতা প্রকাশ করতে পারে যা সমষ্টিগত ডেটাতে সম্পূর্ণরূপে প্রতিফলিত নাও হতে পারে।

3. ধীর এক্সেল ওয়ার্কবুকগুলি পরিচালনা করার জন্য আপনি কি পদক্ষেপগুলি ব্যাখ্যা করতে পারেন?

ধীরগতির এক্সেল ওয়ার্কবুকগুলি পরিচালনা করার জন্য নেওয়া পদক্ষেপগুলি নীচে দেওয়া হল:

  1. এক্সেল টেবিল এবং নামকৃত রেঞ্জ ব্যবহার করুন।
  2. যখনই সম্ভব ম্যানুয়াল গণনা মোড ব্যবহার করুন।
  3. উদ্বায়ী ফাংশন এড়িয়ে চলুন.
  4. অ্যারে সূত্র এড়িয়ে চলুন।
  5. রেফারেন্সে সম্পূর্ণ সারি বা কলাম ব্যবহার করা এড়িয়ে চলুন।
  6. অব্যবহৃত সূত্রগুলিকে মানগুলিতে রূপান্তর করুন।
  7. দ্রুত ফর্মুলা টেকনিক ব্যবহার করুন।
  8. নিশ্চিত করুন যে আপনি একটি শীটে সমস্ত রেফারেন্সড ডেটা রাখবেন।
আরো দেখুন শীর্ষ 100 উত্তরযোগ্য ইন্টারভিউ প্রশ্ন এবং উত্তর

4. আপনি ব্যাখ্যা করতে পারেন কিভাবে PROC SQL কাজ করে?

PROC SQL কে একটি শক্তিশালী বেস SAS7 পদ্ধতি হিসাবে সংজ্ঞায়িত করা হয়েছে যা PROC এবং DATA উভয় পদক্ষেপের কার্যকারিতাকে একক ধাপে একত্রিত করে। PROC SQL ব্যবহার করা হয় বাছাই, সংক্ষিপ্তকরণ, উপসেট, যোগদান, এবং ডেটাসেটগুলিকে সংযুক্ত করতে, নতুন ভেরিয়েবল তৈরি করতে, এবং এটি ফলাফলগুলি প্রিন্ট করে বা একটি নতুন টেবিল তৈরি করে বা এক ধাপে সবগুলি দেখতে।

5. আপনি কি আমাকে বলবেন কিভাবে মূকনায় গল্প তৈরি করা যায়?

ঘটনাগুলি কীভাবে সংযুক্ত এবং ফলাফলের সাথে সিদ্ধান্তগুলি কীভাবে সম্পর্কিত তা দেখানোর মাধ্যমে আমরা আমাদের কেসকে আরও জোরদার করতে গল্পগুলি ব্যবহার করি। তারপরে আমরা ওয়েবে গল্পটি প্রকাশ করতে পারি, বা আমরা এটি দর্শকদের কাছে উপস্থাপন করতে পারি।

এখানে, প্রতিটি গল্পের পয়েন্ট একটি ভিন্ন দৃষ্টিভঙ্গি বা ড্যাশবোর্ডের সাথে সম্পর্কিত হতে পারে, অথবা সম্পূর্ণ গল্পটি একই ভিজ্যুয়ালাইজেশনের সাথে সম্পর্কিত হতে পারে যা বিভিন্ন পর্যায়ে দেখা যায়, বিভিন্ন টীকা এবং ফিল্টার সহ।

একটি গল্প তৈরি করতে, নীচে তালিকাভুক্ত পদক্ষেপগুলি অনুসরণ করুন:

  1. New Story ট্যাবে ক্লিক করুন। তারপর, চার্ট আপনার সূচনা পয়েন্ট হিসাবে আপনার জন্য একটি নতুন গল্প খোলে।
  2. স্ক্রিনের নীচে-বাম কোণে, আপনাকে আপনার গল্পের জন্য একটি আকার চয়ন করতে হবে। তারপরে, পূর্বনির্ধারিত আকারগুলির মধ্যে একটি বা পিক্সেলের একটি কাস্টম আকারের সেট থেকে বেছে নিন।
  3. আপনার গল্প শীট নাম ডিফল্ট থেকে তার শিরোনাম নাম পায়. নাম সম্পাদনা করতে, আপনাকে শীট ট্যাবে ডান-ক্লিক করতে হবে এবং তারপরে শীট পুনঃনামকরণ নির্বাচন করতে হবে।
  4. আপনার গল্প তৈরি করা শুরু করতে, আপনার গল্পের পয়েন্টে এটি যোগ করতে আপনাকে বাম দিকে একটি শীটে ডাবল-ক্লিক করতে হবে।
  5. এখন, গল্পের পয়েন্টের সংক্ষিপ্তসারের জন্য আপনাকে একটি ক্যাপশন যোগ করুন-এ ক্লিক করতে হবে।
  6. এই স্টোরি পয়েন্টের প্রাথমিক ধারণাটিকে আরও হাইলাইট করতে, আপনি ফিল্টার পরিবর্তন করতে পারেন বা দৃশ্যের ক্ষেত্রের সাজাতে পারেন। তারপরে আপনি নেভিগেটর বক্সের উপরে উপস্থিত স্টোরি টুলবারে আপডেটে ক্লিক করে আপনার পরিবর্তনগুলি সংরক্ষণ করতে পারেন।

আমাদের চেক আউট মূকনাট্য সাক্ষাৎকার প্রশ্ন ও উত্তর মূকনাট্য আরো অন্তর্দৃষ্টি জন্য.

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

6. বিভিন্ন ধরনের হাইপোথিসিস টেস্টিং এর নাম বল?

হাইপোথিসিস পরীক্ষার কয়েকটি প্রকার নিচে তালিকাভুক্ত করা হল:

    স্বাভাবিকতা পরীক্ষা:এই পরীক্ষাটি জনসংখ্যার নমুনায় স্বাভাবিক বন্টনের জন্য ব্যবহৃত হয়।স্বাধীনতার জন্য চি-স্কয়ার টেস্ট:এটি একটি প্রদত্ত জনসংখ্যার নমুনায় দুটি শ্রেণীগত ভেরিয়েবলের মধ্যে তাত্পর্যের সংযোগের জন্য ব্যবহৃত হয়।টি-পরীক্ষা:এটি একটি সাধারণভাবে বিতরণ করা জনসংখ্যায় ব্যবহৃত হয় যেখানে আদর্শ বিচ্যুতি অজানা, এবং নমুনার আকার তুলনামূলকভাবে ছোট।ওয়েলচের টি-টেস্ট:এটি দুটি জনসংখ্যার নমুনার মধ্যে উপায়ের সমতা পরীক্ষা করতে ব্যবহৃত হয়। এটিকে Welch’s unequal variances t-পরীক্ষাও বলা হয়।

7. প্রিন্ট এরিয়া বলতে আপনি কী বোঝেন এবং কিভাবে আপনি এটিকে Excel এ সেট করতে পারেন?

Excel-এ প্রিন্ট এরিয়া হল সেলগুলির পরিসর যেগুলি আপনি যখনই সেই নির্দিষ্ট ওয়ার্কশীটটি মুদ্রণ করতে চান তা মুদ্রণ করতে চান৷

এক্সেলে প্রিন্ট এরিয়া সেট করতে নিচের ধাপগুলো অনুসরণ করুন:

  1. আপনি যে ঘরগুলির জন্য মুদ্রণ এলাকা সেট করতে চান তা নির্বাচন করতে হবে।
  2. তারপর, আপনাকে পেজ লেআউট ট্যাবে ক্লিক করতে হবে।
  3. এরপরে, প্রিন্ট এরিয়াতে ক্লিক করুন।
  4. Set Print Area-এ ক্লিক করুন।

8. আপনি কি আমাদের বলতে পারেন যে একটি উন্নত ডেটা মডেল ভাল কি না তা বলার মানদণ্ড কী?

নীচে মডেল সম্পর্কে বলার মানদণ্ডগুলি উল্লেখ করা হয়েছে, এটি ভাল বা খারাপ কিনা (দ্রষ্টব্য: এই প্রশ্নের উত্তর ব্যক্তিভেদে ভিন্ন হতে পারে)।

  1. একটি ভাল মডেলের ডেটা সহজেই ব্যবহার করা উচিত।
  2. একটি ভাল ডেটা মডেলের জন্য ডেটা স্কেলযোগ্য হতে হবে।
  3. একটি ভাল ডেটা মডেলকে অনুমানযোগ্য কর্মক্ষমতা প্রদান করতে হবে।
  4. এটি সহজেই প্রয়োজনীয়তার পরিবর্তনের সাথে খাপ খাইয়ে নেওয়া উচিত।

9. আপনি কি আমাদের বলতে পারেন কিভাবে Excel এর সমস্ত ফাঁকা ঘর নির্বাচন করবেন?

Excel এ ফাঁকা ঘর নির্বাচন করতে আপনাকে প্রদত্ত পদক্ষেপগুলি অনুসরণ করতে হবে:

  1. প্রথমে, আপনাকে সম্পূর্ণ ডেটাসেট নির্বাচন করতে হবে এবং তারপর F5 টিপুন। এটি একটি গো টু ডায়ালগ বক্স খুলবে।
  2. এখন, বিশেষ বোতামে ক্লিক করুন, যা Go-To বিশেষ ডায়ালগ বক্স খুলবে।
  3. সেখানে, আপনাকে ফাঁকাগুলি নির্বাচন করতে হবে এবং ঠিক আছে ক্লিক করতে হবে।

10. বিভিন্ন ধরনের যোগ কি কি?

বিভিন্ন ধরনের যোগদান নীচে তালিকাভুক্ত করা হয়েছে:

    ভেতরের যোগ দিতে: এই যোগদানটি সেই রেকর্ডগুলি প্রদান করে যেগুলির মান উভয় টেবিলে মিলে যায়।বাম বাইরের যোগদান: এই যোগদানটি বাম টেবিল থেকে সমস্ত রেকর্ড এবং ডান টেবিল থেকে মিলে যাওয়া রেকর্ড ফেরত দেয়ডান বাইরের যোগদান: এই যোগদানটি ডান টেবিল থেকে সমস্ত রেকর্ড এবং বাম টেবিল থেকে মিলে যাওয়া রেকর্ড ফেরত দেয়সম্পূর্ণ বাইরের যোগদান: এই যোগদানটি সমস্ত রেকর্ড ফেরত দেয় যখন বাম বা ডান টেবিলে একটি ম্যাচ থাকে।
ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন - SQL যোগদান করে

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

11. আপনি SAS এ ANYDIGIT ফাংশন ব্যাখ্যা করতে পারেন?

ANYDIGIT ফাংশন এসএএস কোন অক্ষরের প্রথম ঘটনার জন্য একটি স্ট্রিং অনুসন্ধান করতে ব্যবহৃত হয়, যা একটি সংখ্যা। যদি এমন কোনো অক্ষর পাওয়া যায়, ANYDIGIT সেই নির্দিষ্ট অক্ষরের স্ট্রিং-এ অবস্থান ফিরিয়ে দেবে। যদি এই ধরনের কোন অক্ষর পাওয়া না যায়, তাহলে ANYDIGIT 0 এর মান প্রদান করবে।

12. পিভট টেবিল ব্যাখ্যা করুন, এবং একটি পিভট টেবিলের বিভিন্ন বিভাগগুলি কী কী?

একটি পিভট টেবিল মাইক্রোসফ্ট এক্সেলের একটি বৈশিষ্ট্য যা আমাদের দ্রুত বিশাল ডেটাসেটের সারসংক্ষেপ করতে দেয়। এটি ব্যবহার করা সহজ কারণ রিপোর্ট তৈরি করতে সারি বা কলাম শিরোনামগুলি টেনে আনা এবং ড্রপ করা প্রয়োজন৷

আমাদের একটি পিভট টেবিলে চারটি বিভাগ আছে, যথা,

  1. সারি এলাকা
  2. কলাম এলাকা
  3. ফিল্টার এলাকা
  4. মান এলাকা

13. নরমালাইজেশন শব্দটি এবং বিভিন্ন ধরনের নরমালাইজেশন ব্যাখ্যা কর?

স্বাভাবিককরণ একটি ডাটাবেস ডিজাইন কৌশল হিসাবে সংজ্ঞায়িত করা যেতে পারে যার লক্ষ্য ডেটা অপ্রয়োজনীয়তা হ্রাস করা এবং সন্নিবেশ, আপডেট এবং মুছে ফেলার অসামঞ্জস্যের মতো অবাঞ্ছিত বৈশিষ্ট্যগুলি দূর করা। সাধারণীকরণের নিয়মগুলি একটি বড় টেবিলকে ছোট টেবিলে ভাগ করে এবং সম্পর্কগুলি ব্যবহার করে তাদের লিঙ্ক করে।

সাধারণীকরণের প্রকারগুলি নীচে তালিকাভুক্ত করা হয়েছে:

    1NF (প্রথম সাধারণ ফর্ম): এখানে, প্রতিটি টেবিল কক্ষে একটি একক মান থাকা উচিত, এবং প্রতিটি রেকর্ড অনন্য হতে হবে।2NF (দ্বিতীয় সাধারণ ফর্ম): এটি 1NF-এ হওয়া উচিত এবং এটিতে একটি একক-কলাম প্রাথমিক কী থাকা উচিত৷3NF (তৃতীয় সাধারণ ফর্ম):এটির কোন ট্রানজিটিভ কার্যকরী নির্ভরতা নেই।BCNF (বয়স-কড নরমাল ফর্ম):একটি টেবিল BCNF-এ থাকে যদি এটি 3NF হয়, এবং প্রতিটি X ->Y, সম্পর্ক X সর্বদা টেবিলের সুপার কী হওয়া উচিত।4NF (চতুর্থ সাধারণ ফর্ম): যদি কোনো ডাটাবেস টেবিলের উদাহরণে প্রাসঙ্গিক সত্তা নির্দিষ্ট করে দুই বা ততোধিক স্বাধীন এবং বহুমূল্য ডেটা না থাকে, তাহলে আমরা বলি এটি 4র্থ সাধারণ ফর্মে আছে।5NF (পঞ্চম সাধারণ ফর্ম):একটি টেবিল 5 তম সাধারণ ফর্মে থাকে শুধুমাত্র যদি এটি 4NF তে থাকে এবং ডেটার ক্ষতি না করে এটিকে ছোট টেবিলের কোনো সংখ্যায় ভাগ করা যায় না।6NF (ষষ্ঠ সাধারণ ফর্ম): এটা ডাটাবেস বিশেষজ্ঞদের দ্বারা এখনও আলোচনার অধীনে আছে.
আরো দেখুন শীর্ষ 100 জাভাস্ক্রিপ্ট ইন্টারভিউ প্রশ্ন এবং উত্তর

14. বিকল্প হাইপোথিসিস কি? ব্যাখ্যা করা?

একটি বিকল্প হাইপোথিসিসকে দুই বা ততোধিক ভেরিয়েবলের মধ্যে পার্থক্য হিসাবে বলা হয় যা গবেষকরা ভবিষ্যদ্বাণী করেছেন; যে, তথ্যের লক্ষ্য করা প্যাটার্ন সুযোগ ঘটনার কারণে নয়।

15. নাল হাইপোথিসিস কি?

একটি নাল হাইপোথিসিসকে এক ধরণের অনুমান হিসাবে সংজ্ঞায়িত করা হয় যা পরিসংখ্যানে ব্যবহৃত হয় যা প্রস্তাব করে যে জনসংখ্যার নির্দিষ্ট বৈশিষ্ট্য বা ডেটা-উৎপাদন প্রক্রিয়ার মধ্যে কোনও পার্থক্য নেই।

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

16. একটি হ্যাশ টেবিল সংঘর্ষ কি?

একটি পরিস্থিতি যেখানে ফলস্বরূপ ডেটাতে দুই বা ততোধিক ডেটা উপাদানের জন্য হ্যাশগুলি হ্যাশ টেবিলের একটি অনুরূপ অবস্থানে U মানচিত্র সেট করে তাকে হ্যাশ সংঘর্ষ বলে। এর মানে হল যে এটি একই স্লটে দুটি ভিন্ন ডেটা সংরক্ষণ করার অনুমতি দেবে না।

17. আপনি কি ডেটা বিশ্লেষণ এবং ডেটা মাইনিংয়ের মধ্যে মূল পার্থক্য ব্যাখ্যা করতে পারেন?

তথ্য বিশ্লেষণ ডেটা মাইনিং
এটি একটি ডেটাসেট থেকে অন্তর্দৃষ্টি বা পরীক্ষা হাইপোথিসিস বা মডেল দেয়।এটি বিশাল ডেটাসেটের মধ্যে একটি লুকানো প্যাটার্ন সনাক্ত করে এবং আবিষ্কার করে।
এটি স্ট্রাকচার্ড, সেমি-স্ট্রাকচার্ড বা আনস্ট্রাকচার্ড উভয় ডেটাতেই করা হয়এর অধ্যয়নগুলি বেশিরভাগ কাঠামোগত ডেটার উপর ভিত্তি করে।
প্রধান হল অনুমান উন্নত করা বা ব্যবসায়িক সিদ্ধান্ত নেওয়া।ডেটা মাইনিং এর লক্ষ্য ডেটা আরও ব্যবহারযোগ্য করে তোলা।
ডেটা বিশ্লেষণ ব্যবসায়িক বুদ্ধিমত্তা এবং বিশ্লেষণ মডেল ব্যবহার করে।ডেটা মাইনিং মূলত গাণিতিক এবং বৈজ্ঞানিক পদ্ধতির উপর ভিত্তি করে প্যাটার্ন বা প্রবণতা সনাক্ত করা হয়।

18. আপনি পারেন সংক্ষেপে ডেটা ক্লিনিং ব্যাখ্যা করুন?

ডেটা ক্লিনিং হল ভুল, সদৃশ, অসম্পূর্ণ, অপ্রাসঙ্গিক, বা ভুলভাবে ফর্ম্যাট করা ডেটা অপসারণ বা সংশোধন করে বিশ্লেষণের জন্য ডেটা প্রস্তুত করার প্রক্রিয়া হিসাবে সংজ্ঞায়িত করা হয়।

ডেটা পরিষ্কার করার কয়েকটি উপায় নীচে তালিকাভুক্ত করা হয়েছে:

  1. সদৃশ বা অপ্রাসঙ্গিক পর্যবেক্ষণগুলি সরান৷
  2. কাঠামোগত ত্রুটি ঠিক করুন
  3. অবাঞ্ছিত outliers ফিল্টার
  4. অনুপস্থিত ডেটা পরিচালনা করুন
  5. যাচাই এবং QA

19. ডেটা প্রোফাইলিং কি?

ডেটা প্রোফাইলিং হল একটি ডাটাবেস বা ফাইলের মতো বিদ্যমান তথ্য উত্স থেকে উপলব্ধ ডেটা পরীক্ষা করার এবং সেই নির্দিষ্ট ডেটা সম্পর্কে পরিসংখ্যান বা তথ্যমূলক সারসংক্ষেপ সংগ্রহ করার পদ্ধতি।

বিশ ডেটা ভ্যালিডেশন কি?

ডেটা যাচাইকরণ হল আমাদের ডেটার নির্ভুলতা এবং গুণমান পরীক্ষা করার একটি প্রক্রিয়া, যা মূলত আমদানি এবং প্রক্রিয়াকরণের আগে সম্পাদিত হয়। এটি ডেটা ক্লিনজিংয়ের একটি ফর্ম হিসাবেও বিবেচিত হয়। এটি আমাদের নিশ্চিত করে যে আপনি যখন বিশ্লেষণ করবেন, আপনার ফলাফল সঠিক হবে।

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

21. আপনি কিছু নাম দিতে পারেন শীর্ষস্থানীয় সরঞ্জাম যা ডেটা বিশ্লেষণ করতে ব্যবহৃত হয়?

ডেটা বিশ্লেষণ করার জন্য ব্যবহৃত কিছু শীর্ষ সরঞ্জামগুলি নীচে তালিকাভুক্ত করা হয়েছে:

  1. পাইথন
  2. আর
  3. এসএএস
  4. এক্সেল
  5. পাওয়ার BI
  6. চার্ট
  7. অ্যাপাচি স্পার্ক

22। আপনি একটি ডেটা বিশ্লেষণ প্রকল্পের সাথে কাজ করার সময় জড়িত পদক্ষেপের নাম বলতে পারেন?

কয়েকটি গুরুত্বপূর্ণ পদক্ষেপ নীচে তালিকাভুক্ত করা হল:

  1. সমস্যা বিবৃতি
  2. ডেটা ক্লিনিং/প্রিপ্রসেসিং
  3. ডেটা অন্বেষণ
  4. মডেলিং
  5. তথ্য বৈধতা
  6. বাস্তবায়ন
  7. প্রতিপাদন

23. আপনি কি বিগ ডেটাতে ব্যবহৃত কিছু জনপ্রিয় টুলের নাম বলতে পারেন?

বিগ ডেটার জন্য অনেক টুল উপলব্ধ রয়েছে। আমরা কয়েকটি তালিকাভুক্ত করেছি:

  1. এইচপিসিসি
  2. কুবোলে
  3. স্ট্যাটউইং
  4. পেন্টাহো
  5. হাডুপ

24. টাইম সিরিজ বিশ্লেষণ কি এবং আমরা এটি কোথায় ব্যবহার করব?

টাইম সিরিজ বিশ্লেষণকে একটি পরিসংখ্যানগত কৌশল হিসাবে সংজ্ঞায়িত করা হয় যা প্রধানত সময়-সিরিজ ডেটা বা প্রবণতা বিশ্লেষণের সাথে সম্পর্কিত। সহজ ভাষায়, টাইম সিরিজ ডেটা হল সেই ডেটা যা নির্দিষ্ট সময়কাল বা ব্যবধানের একটি সিরিজে থাকে।

সময় সিরিজ বিশ্লেষণ ব্যবহৃত হয়:

  1. অর্থনৈতিক
  2. পূর্বাভাস
  3. বিক্রয় পূর্বাভাস.
  4. বাজেট বিশ্লেষণ।

25. আপনি কি ক্লাস্টারিং অ্যালগরিদমের কিছু বৈশিষ্ট্যের নাম বলতে পারেন?

ক্লাস্টার অ্যালগরিদমের বৈশিষ্ট্যগুলি নিম্নরূপ:

  1. পুনরাবৃত্তিমূলক
  2. বিচ্ছিন্ন
  3. শক্ত এবং নরম
  4. সমতল বা অনুক্রমিক

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

26. আপনি আমাদের বলতে পারেন বহিরাগত কি এবং কিভাবে তারা সনাক্ত করা হয়?

ডেটা বিশ্লেষণে একটি আউটলায়ারকে একটি পর্যবেক্ষণ হিসাবে সংজ্ঞায়িত করা হয় যা একটি প্রদত্ত জনসংখ্যা থেকে একটি এলোমেলো নমুনায় অন্যান্য বিভিন্ন মান থেকে একটি অনিয়মিত দূরত্ব থাকে।

ডেটার ভর থেকে সরানো অস্বাভাবিক পর্যবেক্ষণের জন্য ডেটা পরীক্ষা, এই পয়েন্টগুলি প্রায়ই আউটলিয়ার হিসাবে পরিচিত।

বহিরাগতদের সনাক্ত করতে ব্যবহৃত কয়েকটি পদ্ধতি নিম্নরূপ:

  1. স্ট্যান্ডার্ড বিচ্যুতি পদ্ধতি
  2. বক্স প্লট পদ্ধতি

27. আপনি ডেটা বিশ্লেষণের অসুবিধাগুলি ব্যাখ্যা করতে পারেন?

ডেটা বিশ্লেষণের অসুবিধাগুলি নীচে দেওয়া হল:

  1. তথ্য বিশ্লেষণ ব্যবহার করে প্রাপ্ত তথ্য অপব্যবহার হতে পারে।
  2. ডেটা অ্যানালিটিক্সের সবচেয়ে কঠিন কাজগুলির মধ্যে একটি হল সঠিক অ্যানালিটিক্স টুল নির্বাচন করা।
  3. সরঞ্জামগুলির দাম সাধারণত তারা সমর্থন করে এমন বৈশিষ্ট্য এবং অ্যাপ্লিকেশনগুলির উপর নির্ভর করে। কিছু সরঞ্জাম জটিল এবং সঠিক প্রশিক্ষণের প্রয়োজন।

28. সহযোগী ফিল্টারিং ব্যাখ্যা কর?

সহযোগী ফিল্টারিং একটি নির্দিষ্ট ব্যবহারকারীর অতীত কার্যকলাপ বা প্রদত্ত ব্যবহারকারীর অনুরূপ স্বাদের অন্যান্য ব্যবহারকারীদের ইতিহাস থেকে তথ্য বিশ্লেষণ করে আরও ব্যক্তিগতকৃত সুপারিশ তৈরি করার ক্ষমতা রাখে।

29. আপনি পারেন ডেটা বিশ্লেষকদের দ্বারা ব্যবহৃত কয়েকটি পরিসংখ্যানগত পদ্ধতির নাম বলুন?

ডেটা বিশ্লেষকদের দ্বারা ব্যবহৃত কয়েকটি পরিসংখ্যানগত পদ্ধতি নীচে দেওয়া হল:

  1. ক্লাস্টার বিশ্লেষণ
  2. প্রযুক্তিগত বরাদ্দ
  3. র্যাঙ্ক পরিসংখ্যান
  4. বায়েসিয়ান পদ্ধতি
  5. মার্কভ প্রক্রিয়া

30. K- মানে অ্যালগরিদম ব্যাখ্যা কর?

কে-মিনস ক্লাস্টারিংকে একটি আনসুপারভাইজড লার্নিং অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা হয় যা লেবেলবিহীন ডেটাসেটকে বিভিন্ন ক্লাস্টারে গোষ্ঠীভুক্ত করে। এটি একটি পুনরাবৃত্তিমূলক অ্যালগরিদম হিসাবে সংজ্ঞায়িত করা যেতে পারে যা লেবেলবিহীন ডেটাসেটকে k বিভিন্ন ক্লাস্টারে এমনভাবে বিভক্ত করে যে প্রতিটি ডেটাসেট একই বৈশিষ্ট্যযুক্ত শুধুমাত্র একটি গ্রুপের অন্তর্গত।

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

31. KNN Imputation পদ্ধতি ব্যাখ্যা কর?

KNN পদ্ধতির সাহায্যে, একটি সুনির্দিষ্ট অনুপস্থিত মান তার k নিকটতম প্রতিবেশীদের মধ্যে সংখ্যাগরিষ্ঠ সহ অভিযুক্ত করা যেতে পারে। k নিকটতম প্রতিবেশীদের গড় মান একটি সংখ্যাসূচক অনুপস্থিত মানের পূর্বাভাস হিসাবে বিবেচিত হয়, যা বেশিরভাগ গড় নিয়ম হিসাবে পরিচিত।

32। একটি N-গ্রাম কি?

একটি n-গ্রাম প্রদত্ত পাঠ বা বক্তৃতায় n আইটেমগুলির একটি সংযুক্ত ক্রম হিসাবে সংজ্ঞায়িত করা হয়। একটি এন-গ্রাম হল একটি সম্ভাব্য ভাষা মডেল যা একটি নির্দিষ্ট ক্রমানুসারে পরবর্তী আইটেমটির পূর্বাভাস দিতে ব্যবহৃত হয়, যেমন (n-1)।

33. আপনি কি ডেটা বিশ্লেষণে ব্যবহৃত কিছু ডেটা যাচাইকরণ পদ্ধতির নাম দিতে পারেন?

ডেটা বিশ্লেষণে ব্যবহৃত কিছু ডেটা যাচাইকরণ পদ্ধতি নীচে দেওয়া হল:

  1. ফর্ম-স্তরের বৈধতা
  2. ক্ষেত্র-স্তরের বৈধতা
  3. অনুসন্ধানের মানদণ্ডের বৈধতা
  4. তথ্য সংরক্ষণ বৈধতা

3. 4। সাধারণ বন্টন ব্যাখ্যা কর?

সাধারণ বণ্টন, যাকে গাউসিয়ান ডিস্ট্রিবিউশনও বলা হয়, হল একটি সম্ভাব্যতা বন্টন যা গড় সম্পর্কে প্রতিসম, যা দেখায় যে গড় থেকে দূরে থাকা ডেটার তুলনায় গড় কাছাকাছি ডেটা বেশি ঘন ঘন ঘটে। সাধারণ বন্টন, যখন একটি গ্রাফে উপস্থাপিত হয়, তখন একটি বেল কার্ভ হিসাবে উপস্থিত হয়।

আরো দেখুন শীর্ষ 100 উত্তরযোগ্য ইন্টারভিউ প্রশ্ন এবং উত্তর

35. আপনি ব্যাখ্যা করতে পারেন সংস্করণ নিয়ন্ত্রণ সুবিধা?

সংস্করণ নিয়ন্ত্রণ আমাদের পার্থক্য সনাক্ত করতে, ফাইলের তুলনা করতে এবং যেকোনো কোড করার আগে পরিবর্তনগুলিকে একত্রিত করতে দেয়।

সংস্করণ নিয়ন্ত্রণের কয়েকটি সুবিধা নীচে তালিকাভুক্ত করা হয়েছে:

  1. এটি আমাদের অ্যাপ্লিকেশন বিল্ডগুলির ট্র্যাক রাখতে সহায়তা করে যার মাধ্যমে আমরা সনাক্ত করতে সক্ষম হব যে কোন সংস্করণটি বিকাশ, QA এবং উত্পাদনে ব্যবহৃত হচ্ছে৷
  2. এটি আমাদের প্রকল্প ফাইলগুলির একটি সম্পূর্ণ ইতিহাস বজায় রাখতে সাহায্য করে যাতে কেন্দ্রীয় সার্ভার ব্রেকডাউন হলে এটি সহায়ক হবে।
  3. এটি আমাদের বিভিন্ন ফাইলের বিষয়বস্তুতে করা পরিবর্তনগুলি দেখতে দেয়।
  4. কোড ফাইলের একাধিক সংস্করণ এবং ভেরিয়েন্ট নিরাপদে সংরক্ষণ এবং বজায় রাখার ক্ষেত্রে এটি চমৎকার।

36. আপনি কি ভ্যারিয়েন্স এবং কোভেরিয়েন্সের মধ্যে পার্থক্য করতে পারেন?

ভিন্নতা সহবাস
এটিকে তার গড় মানের চারপাশে সেট করা ডেটার বিস্তার হিসাবে সংজ্ঞায়িত করা হয়।এটি দুটি র্যান্ডম ভেরিয়েবলের মধ্যে দিকনির্দেশক সম্পর্কের পরিমাপ।
এটি একটি সম্পদের অস্থিরতা পরিমাপ করতে ব্যবহৃত হয়।এটি নির্দিষ্ট সময়ের মধ্যে দুটি ভিন্ন বিনিয়োগের রিটার্ন নির্দিষ্ট করে যখন এটি বিভিন্ন ভেরিয়েবলের সাথে তুলনা করা হয়।

37. আপনি আমাদের বলতে পারেন কিভাবে বহু-উৎস সমস্যা মোকাবেলা করতে?

  1. আপনি কি তথ্য একত্রিত করতে জানতে হবে
  2. ডেটা ভিজ্যুয়ালাইজেশন ব্যবহার করুন
  3. ডাটা ব্লেন্ডিং টুলে যান।
  4. বিমূর্ততার মাধ্যমে ভার্চুয়াল ডাটাবেস পরিষেবা তৈরি করুন

38. আপনি কি ডেটা প্রোফাইলিং এবং ডেটা মাইনিংয়ের মধ্যে পার্থক্য বলতে পারেন?

ডেটা প্রোফাইলিং ডেটা মাইনিং
এটি ডেটা গুদাম উন্নয়ন পর্যায়ে বিভিন্ন পর্যায়ে করা হয়।এটি পূর্ব-নির্মিত ডাটাবেসের নিদর্শনগুলি সনাক্ত করার একটি প্রক্রিয়া।
ডেটা প্রোফাইলিংয়ের মূল উদ্দেশ্য হল ডেটার প্রাথমিক পর্যায়ে দুর্নীতিগ্রস্ত ডেটা সনাক্ত করা যাতে আমরা সঠিক সময়ে এটি সংশোধন করতে পারি।এটি বিদ্যমান ডাটাবেসকে মূল্যায়ন করার এবং কাঁচা ডেটাকে দরকারী তথ্যে পরিণত করার পদ্ধতি।

39। আপনি কি আমাদের একজন ডেটা বিশ্লেষকের কয়েকটি গুরুত্বপূর্ণ দায়িত্ব বলতে পারেন?

  1. তারা তথ্য সংগ্রহ এবং ব্যাখ্যা করা উচিত.
  2. একজনকে ফলাফল বিশ্লেষণ করতে হবে।
  3. তাদের ফলাফলগুলি ব্যবসার সংশ্লিষ্ট সদস্যদের কাছে রিপোর্ট করতে হবে।
  4. তাদের ডেটা সেটের নিদর্শন এবং প্রবণতা সনাক্ত করতে হবে।
  5. তাদের নতুন তথ্য সংগ্রহ এবং বিশ্লেষণ প্রক্রিয়া সংজ্ঞায়িত করতে হবে।

40. আপনি ব্যাখ্যা করতে পারেন অ্যাফিনিটি ডায়াগ্রাম?

অ্যাফিনিটি ডায়াগ্রাম তাদের প্রাকৃতিক সম্পর্কের মধ্যে বিপুল সংখ্যক ধারণাকে সংগঠিত করে। এটি একটি ব্রেনস্টর্মিং সেশন থেকে একটি সংগঠিত আউটপুট। আমরা এটিকে প্রধানত কোন পণ্য, জটিল সমস্যা বা সমস্যার সাথে সম্পর্কিত তথ্য তৈরি, একত্রীকরণ এবং সংগঠিত করতে ব্যবহার করি।

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

41. আপনি কি আমাদের ডেটা ভিজ্যুয়ালাইজেশন সম্পর্কে বলতে পারেন?

ডেটা ভিজ্যুয়ালাইজেশনকে একটি চার্ট, গ্রাফ বা অন্যান্য ভিজ্যুয়াল ফর্ম্যাটের আকারে ডেটা রাখার প্রক্রিয়া হিসাবে সংজ্ঞায়িত করা হয় যা তথ্য বিশ্লেষণ এবং ব্যাখ্যায় সহায়তা করে। ডেটা ভিজ্যুয়ালগুলি বিশ্লেষণ করা ডেটা এমনভাবে উপস্থাপন করতে সহায়তা করে যাতে তারা বিভিন্ন স্টেকহোল্ডারদের কাছে অ্যাক্সেসযোগ্য এবং জড়িত থাকে।

42. একটি তথ্য সংগ্রহ পরিকল্পনা কি?

একটি ডেটা সংগ্রহের পরিকল্পনা আমাদের নিশ্চিত করে যে বিশ্লেষণ বা উন্নতি প্রকল্পের সময় সংগৃহীত ডেটা উপযোগী এবং যথাযথভাবে সংগ্রহ করা হয়েছে।

43. আপনি ব্যাখ্যা করতে পারেন হাদুপ ইকোসিস্টেম?

Hadoop ইকোসিস্টেম হল একটি প্ল্যাটফর্ম যা বড় ডেটা সমস্যা সমাধানের জন্য বিভিন্ন পরিষেবা প্রদান করে। এতে অ্যাপাচি প্রকল্প এবং বিভিন্ন বাণিজ্যিক সরঞ্জাম এবং সমাধান অন্তর্ভুক্ত রয়েছে।

আমাদের Hadoop এর চারটি প্রধান উপাদান রয়েছে, যথা,

  1. এইচডিএফএস
  2. মানচিত্র কমাতে
  3. সুতা
  4. হাডুপ কমন

44. Imputation শব্দটি ব্যাখ্যা কর?

অনুপস্থিত ডেটা প্রতিস্থাপিত মান দিয়ে প্রতিস্থাপনের কৌশল। ডেটা বিশ্লেষণ করার সময়, অনুপস্থিত ডেটা একটি সমস্যা সৃষ্টি করতে পারে।

সাধারণ অভিযোজন পদ্ধতি হল:

  1. একক অভিঘাত
  2. মিন ইম্পুটেশন
  3. কোল্ড ডেক ইম্পুটেশন
  4. রিগ্রেশন ইম্প্যুটেশন
  5. স্টোকাস্টিক রিগ্রেশন ইম্প্যুটেশন
  6. প্রতিস্থাপন
  7. কোল্ড ডেক ইম্পুটেশন

45. আপনি আমাদের বলতে পারেন SAS এ কোড লেখার মৌলিক সিনট্যাক্স শৈলী?

  1. একটি SAS প্রোগ্রাম বিবৃতিতে উপাদান পৃথক করতে সঠিক স্থান ব্যবহার করুন।
  2. একটি সেমি-কোলন দিয়ে সমস্ত বিবৃতি শেষ করতে ভুলবেন না।
  3. ডেটাসেটের নাম দেওয়ার জন্য একটি ডেটা বিবৃতি লিখুন।
  4. প্রদত্ত ডেটা সেটের ভেরিয়েবলগুলির নাম দেওয়ার জন্য একটি INPUT বিবৃতি লিখুন।
  5. একটি RUN বিবৃতি দিয়ে SAS প্রোগ্রাম শেষ করুন।

46. SAS মধ্যে interleaving কি?

SAS-এ ইন্টারলিভিংকে সংজ্ঞায়িত করা হয় পৃথক সাজানো SAS ডেটা সেটগুলিকে একটি বড় সাজানো ডেটা সেটে একত্রিত করা। SET স্টেটমেন্ট এবং BY স্টেটমেন্ট ব্যবহার করে ডেটা সেটগুলিকে ইন্টারলিভ করা যেতে পারে।

47. ক্লাস্টারিং শব্দটি ব্যাখ্যা কর?

ক্লাস্টারিং

ক্লাস্টারিং হল জনসংখ্যা বা ডেটা পয়েন্টগুলিকে কয়েকটি সেটে বিভক্ত করার পদ্ধতি যাতে একই গ্রুপের ডেটা পয়েন্টগুলি একই গ্রুপের অন্যান্য ডেটা পয়েন্টগুলির মতো হয়।

48. টি-টেস্ট বা জেড-টেস্ট ব্যবহারের শর্ত কী?

টি-টেস্ট ব্যবহার করা হয় যখন আমাদের নমুনার আকার 30-এর কম থাকে, এবং একটি Z-পরীক্ষা ব্যবহার করা হয় যখন আমাদের একটি নমুনা পরীক্ষা 30-এর বেশি হয়।

49। সত্য ছক কি?

ট্রুথ টেবিল হল তথ্যের একটি সংগ্রহ যা একটি প্রস্তাবের সত্য বা মিথ্যা নির্ধারণ করে।

আমাদের তিন প্রকার, যথা,

  1. ফটোগ্রাফ সত্য টেবিল
  2. সত্যহীন ফ্যাক্ট টেবিল
  3. সঞ্চিত সত্য সারণী

পঞ্চাশ স্ট্যান্ডার্ড বিচ্যুতি কি?

স্ট্যান্ডার্ড বিচ্যুতি একটি ডেটা সেটে যেকোনো মাত্রার বৈচিত্র পরিমাপ করতে ব্যবহৃত হয়। এটি গড় চারপাশে সঠিকভাবে ডেটার গড় বিস্তার পরিমাপ করে।

ডেটা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর

51. হ্যাশ টেবিলে সংঘর্ষ কি?

একটি সংঘর্ষ ঘটতে বলা হয় যখন একটি হ্যাশ ফাংশন একই টেবিলের ঠিকানার দুটি ভিন্ন কী-তে ম্যাপ করে। এটি একটি সাধারণ রি-হ্যাশিং স্কিম যেখানে টেবিলের পরবর্তী স্লটটি সংঘর্ষে চেক করা হয়।

52। কেন 'নাইভ বায়েস' নিষ্পাপ?

এটি নির্বোধ কারণ এটি ধরে নেয় যে সমস্ত ডেটাসেট সমানভাবে গুরুত্বপূর্ণ এবং স্বাধীন, যা বাস্তব-বিশ্বের দৃশ্যে নয়।

53. Data Wrangling শব্দটি ব্যাখ্যা কর?

সহজ অ্যাক্সেস এবং বিশ্লেষণের জন্য অগোছালো এবং জটিল ডেটা সেটগুলিকে পরিষ্কার এবং একত্রিত করার প্রক্রিয়া হিসাবে ডেটা র্যাংলিংকে সংজ্ঞায়িত করা যেতে পারে।

54. ডেটা মিশ্রন শব্দটি ব্যাখ্যা কর?

ডেটা মিশ্রন হল একটি কার্যকরী ডেটাসেটে বিভিন্ন উত্স থেকে ডেটা একত্রিত করার কৌশল।

55. Data joining শব্দটি ব্যাখ্যা কর?

ডেটা যোগদান করা হয় যখন ডেটা একই উত্স থেকে আসে।

56. বর্ণনামূলক বিশ্লেষণ ব্যাখ্যা কর?

বর্ণনামূলক বিশ্লেষণকে একটি ব্যবসায় ঘটে যাওয়া পরিবর্তনগুলিকে আরও ভালভাবে বোঝার জন্য ঐতিহাসিক ডেটার ব্যাখ্যা হিসাবে সংজ্ঞায়িত করা হয়। এটি তুলনা আঁকতে ঐতিহাসিক তথ্যের একটি পরিসরের ব্যবহার বর্ণনা করে।

এটি আপনাকে ডেটা বিতরণ সম্পর্কে ধারণা দেয়। এটি আপনাকে বহিরাগত এবং টাইপো শনাক্ত করতে সাহায্য করে এবং আপনাকে ভেরিয়েবলের মধ্যে সম্পর্ক সনাক্ত করতে সক্ষম করে, তাই আপনাকে আরও পরিসংখ্যানগত বিশ্লেষণ পরিচালনা করতে প্রস্তুত করে।

57. ভবিষ্যদ্বাণীমূলক বিশ্লেষণ ব্যাখ্যা কর?

ভবিষ্যদ্বাণীমূলক বিশ্লেষণকে ডেটা, পরিসংখ্যানগত অ্যালগরিদম এবং মেশিন লার্নিং কৌশলগুলির ব্যবহার হিসাবে সংজ্ঞায়িত করা হয় যা ঐতিহাসিক ডেটার উপর ভিত্তি করে ভবিষ্যতের ফলাফলের সম্ভাবনা চিহ্নিত করতে।

58. প্রেসক্রিপটিভ অ্যানালিটিক্স ব্যাখ্যা কর?

প্রেসক্রিপটিভ অ্যানালিটিক্স ব্যবহার করে মেশিন লার্নিং কম্পিউটার প্রোগ্রামের ভবিষ্যদ্বাণীর উপর ভিত্তি করে ব্যবসায়িক পদক্ষেপের সিদ্ধান্ত নিতে সাহায্য করার জন্য। এটা ভবিষ্যদ্বাণীমূলক বিশ্লেষণের সাথে কাজ করে, যা নিকট-মেয়াদী ফলাফল নির্ধারণ করতে ডেটা ব্যবহার করে।

59. বিভিন্ন ধরনের স্যাম্পলিং কৌশলের নাম বল?

বিভিন্ন ধরনের নমুনা কৌশল নীচে তালিকাভুক্ত করা হয়.

  1. সহজ র্যান্ডম নমুনা
  2. পদ্ধতিগত নমুনা
  3. গুচ্ছের আদর্শ
  4. স্তরিত নমুনা
  5. বিচারমূলক বা উদ্দেশ্যমূলক নমুনা

60. শব্দটি ব্যাখ্যা কর ওভারফিটিং?

ওভারফিটিং বলতে সেই মডেলকে বোঝায় যা প্রশিক্ষণের ডেটাকে খুব ভালোভাবে মডেল করে। এর অর্থ হল প্রশিক্ষণের ডেটাতে গোলমাল বা এলোমেলো ওঠানামাগুলি তুলে নেওয়া হয় এবং সেগুলি মডেল দ্বারা ধারণা হিসাবে শেখা হয়৷ এখানে সমস্যা হল যে এই ধারণাগুলি নতুন ডেটাতে প্রযোজ্য নয় এবং এটি মডেলের সাধারণীকরণের ক্ষমতার উপর নেতিবাচক প্রভাব ফেলে।

আপনার ডেটা বিশ্লেষক সাক্ষাৎকারের জন্য সৌভাগ্য কামনা করছি। আমরা আশা করি আমাদের ডেটা অ্যানালাইসিস সাক্ষাত্কারের প্রশ্ন এবং উত্তরগুলি আপনার জন্য কিছু সহায়ক ছিল। এছাড়াও আপনি চেক আউট করতে পারেন ব্যাবসা বিশ্লেষক ইন্টারভিউ প্রশ্ন এবং উত্তর , যা আপনার কিছু সহায়ক হতে পারে।