علم داده‌ها (هنوز) مشکلات گزینش را حل نمی‌کند

نویسندگان: پیتر کاپلی

مدیران گزینش درمانده شده‌اند و به ابزارهای جدیدی نیاز دارند، زیرا ابزارهای کنونی مانند مصاحبه‌های بدون ساختار، تست‌های شخصیت، توصیه‌های اشخاص خیلی موثر واقع نمی‌شوند. جدیدترین پیشرفت این حوزه، بهره‌گیری از علم داده‌ها است -استفاده از الگوریتم‌هایی که به یافتن و ارزیابی متقاضیان شغل اختصاص دارند. این روش، سویه‌های امیدوارکننده و نگران‌کننده‌ی مختص خودش را دارد. طبق محاسبه‌ی من، بیش از صد شرکت وجود دارند که این ابزارهای مبتنی بر داده را می‌سازند و به کمپانی‌های مختلف می‌فروشند. متاسفانه علم داده‌ها -که به رشد کافی در زمینه‌ی استخدام و گزینش نیرو نرسیده -هنوز به آن اکسیری تبدیل نشده که کارفرماها به آن دل ببندند.

فروشندگان این ابزارهای جدید وعده می‌دهند که نقش سوگیری‌ها و گرایش‌های اجتماعی در فرایند گزینش نیرو را کاهش خواهند داد. و الگوریتم‌هایشان می‌توانند به شناسایی متقاضیان خوبی بپردازند که پیش‌تر به خاطر نداشتن یک مدرک یا یک طبقه‌ی اجتماعی معین، کنار گذاشته می‌شدند. اما از سوی دیگر، این ابزارها می‌توانند موجب شناسایی و ترویج بهره‌گیری از متغیرهای پیش‌بینی‌کننده‌ای شوند که مشکل‌ساز خواهند شد.

ازآنجایی‌که اکثر متخصصان داده، اطلاعات بسیار اندکی درباره‌ی چارچوب استخدام دارند، ابزارهایشان غالباً ارزش چندانی نخواهد داشت. به‌عنوان نمونه، درصد قابل توجهی از آن‌ها برای ساخت مدل‌های خود، صرفاً به بهترین عملکردهای محیط کارشان می‌نگرند و متقاضیانی را شناسایی می‏‌کنند که دقیقاً همان ویژگی‌ها را دارند. ‌آن‌ها هر متغیری که سنجش آن ساده باشد را در نظر می‌گیرند: حالات چهره، انتخاب کلمات، کامنت‌های گذاشته شده در شبکه‌های اجتماعی و مواردی از این قبیل. اما عدم بررسی تفاوت‌های واقعی میان عملکرد افراد قدرتمند و ضعیف، موجب می‌شود که این بررسی‌ها فایده‌ی چندانی نداشته باشند. همچنین جمع‌آوری داده از رسانه‌های اجتماعی یا وب‌سایت‌های مورد بازدید افراد، نگرانی‌های مهمی را درباره‌ی حریم خصوصی آن‌ها به وجود می‌آورد. بله، هیچ منع قانونی برای دسترسی به این اطلاعات وجود ندارد؛ اما افرادی که این پست‌ها را منتشر کرده‌اند، نمی‌خواستند که چنین بهره‌‏برداری‌هایی از آن‌ها صورت گیرد و اجازه‌ی این کار را نداده‌اند. همچنین آیا منصفانه است که یکی از مطالب ارسال شده در دوران دانشجویی شما، هدایتگر الگوریتم استخدامتان در چند سال بعد باشد؟

یکی دیگر از مشکلات رویکردهای یادگیری ماشینی است که تعداد اندکی از کارفرماها، حجم قابل توجهی از داده‌ها -ازجمله تعداد استخدام‌ها، ارزیابی‌های عملکرد و مواردی از این دست -را جمع‌آوری می‌کنند و در اختیار الگوریتم‏‌ها می‌گذارند تا پیش‌بینی‌های دقیق خود را ارائه دهند. اگرچه تئوری می‏‌گوید که این شرکت‌ها می‌توانند با جمع‌آوری داده از کارفرماهای بیشتر، بر این مشکل غلبه کنند، اما نمی‌دانند که به‌واسطه‌ی چارچوب‌های متفاوت کمپانی‌ها، نمی‌توان پیش‌بینی‌های دقیقی را برای یک چارچوب خاص ارائه داد.

(الگوریتم‌ها اتکای زیادی به تجربیات پیشین دارند که بخشی از دلیل آن را می‌توان به نقش مشاهدات فراوان در شکل‌گیری آن‌ها نسبت داد -حتی کارفرماهای بزرگ هم داده‌های حاصل از سال‌ها ارزیابی شغل خود را برای ساخت این الگوریتم‌ها به کار می‌‌گیرند). براساس تجربه‌ی آمازون، ممکن است گذشته تفاوت‌های فراوانی را با آینده‌ی مدنظر شما داشته باشد. آمازون متوجه شد الگوریتم استخدامش که آن را از سال 2014 به کار گرفته بود، میانگین نمره‌ی کمتریبه خانم‌ها اختصاص می‌دهد -حتی به ویژگی‌های زنانه نظیر شرکت در برنامه‌های مطالعاتی خانم‌ها نیز توجه کمتری داشت. علت این گرایش الگوریتم را می‌توان به عملکردهای موفق پیشین در کمپانی نسبت داد که به طرز غیرمتناسبی به مردها اختصاص داشتند. بنابراین الگوریتم به دنبال ویژگی‌هایی بود که مشابه عملکردهای موفق پیشین باشند. کمپانی که نتوانستند این مشکل را حل کنند، به‌کارگیری این الگوریتم را در سال 2017 متوقف کرد. بااین‌حال خیلی دیگر از کمپانی‌ها هنوز از همان الگوریتم‌ها بهره می‌گیرند.

چالش اساسی متخصصان داده، این است که نباید استخدام را مثل سایر پیش‌بینی‌های ساده بدانند. مثلاً قرار نیست که زمان شکست یک بلبرینگ را پیش‌بینی کنند -پرسشی که هر معیار پیش‌بینی‌کننده‌ی ساده‌ای قادر به پاسخگویی به آن است. گزینش نیرو آن‌قدر مهم است که نه‌تنها چارچوب‌های قانونی، بلکه مفاهیم اساسی انصاف و عدالت را نیز دربر می‌گیرد. این حقیقت که فلان معیار همواره به عملکرد شغلی خوب منتج شده، دلیل نمی‌شود که آن را شرط کافی برای استخدام یک نیرو بدانیم.

متغیری را در نظر بگیرید که از نظر متخصصان داده، ارزش پیش‌بینی‌کننده‌ی مناسبی دارد: فاصله‌ی رفت‌وآمد تا محل کار. براساس داده‌های موجود، طی مسافت بیشتر برای حضور در محل کار، موجب افزایش نرخ استعفای افراد می‌شود. درهرحال فاصله‌‌ی رفت‌وآمد به محل کار، تابع محل زندگی شما است -و آن هم به قیمت خانه، درآمد و همچنین نژاد شما بستگی دارد. گزینش افراد براساس محل زندگی آن‌ها، تاثیرات منفی احتمالی را برای گروه‌های محافظت‌شده نظیر اقلیت‌های نژادی خواهد داشت.

کمپانی‌ها نباید از معیارهای گزینش خاصی بهره بگیرند که تاثیرات منفی به همراه خواهد داشت، چراکه در این صورت از قانون تخطی خواهند کرد، مگر اینکه معیار بهتری برای پیش‌بینی عملکرد متقاضیان خود نداشته باشند -آن‌هم درحالی‌که سنجش عملکرد این معیارها با بهره‌گیری از الگوریتم‌های یادگیری ماشینی دشوار است. حتی در این صورت نیز باید علت عملکرد خوب معیار خود را نشان دهند تا به مشکلات قانونی برنخورند. در این شرایط، می‌توان از معیار زمان رفت‌وآمد بهره گرفت و آن را منطقی دانست -حداقل در حال حاضر -اما نمی‌توان از معیارهایی همچون حالات چهره، مطالب ارسال شده در شبکه‌های اجتماعی یا معیارهای مشابه بهره گرفت، زیرا کمپانی‌ها قادر به اثبات اهمیتشان نیستند.

آخرین ‌ضعف بهره‌گیری از الگوریتم‌ها این است که می‌خواهیم خیلی ساده و با کمترین هزینه به آن‌ها دست پیدا کنیم:

این مقاله در شماره ی زیر منتشر شده است:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *