سیستم توصیه گر یا پیشنهاد گر (واژه سیستم گاهی با واژه های مترادفی مثل؛ “پلتفرم” یا “موتور” جایگزین می شود) زیر مجموعه ای از سامانه ی پالایش اطلاعات است که بدنبال پیش بینی “امتیاز” یا “اولویتی” است، که کاربر به یک آیتم (داده، اطلاعات، کالا و …) خواهد داد.

در سال های اخیر سیستم های توصیه گر بسیار متداول شده و در حوزه های مختلفی مورد استفاده قرار گرفته اند. برخی از کاربرد های معروف آن در موارد زیر است:

فیلم های سینمایی، موسیقی، اخبار، کتابها، مقالات تحقیقاتی، جست و جوی پرسش ها، تگ های اجتماعی و غالب محصولات.

علاوه بر این سیستم های توصیه گر برای؛ متخصصان، گروه های همکاران، طنز پردازیها، رستورانها، خدمات مالی، بیمه عمر، مسائل عاطفی (قرار و مدارهای آنلاین) و صفحات تویتر نیز ارائه شده است.

معمولاً سیستم های توصیه گر، لیستی از پیشنهادات را به یکی از دو صورت زیر ارائه می دهند:

از طریق پالایش گروهی و محتوا محور (Collaborative and Content-based filtering) یا رهیافت شخصیت محور (Personality-based approach)

رهیافت های پالایش گروهی، مدلی ایجاد می کنند که این مدل بر اساس رفتار گذشته کاربر (آیتم هایی که قبلاً خریداری یا انتخاب کرده و یا امتیازاتی که به آیتم ها داده است) و نیز تصمیمات مشابهی که توسط کاربران دیگر گرفته شده است، میباشد. سپس با استفاده از مدل ایجاد شده، آیتم هایی که ممکن است مورد علاقه ی کاربر باشد، معرفی می گردد. رهیافت های پالایش محتوا محور، از یک سری مشخصات مجزای یک آیتم برای پیشنهاد آیتم های دیگر با ویژگی های مشابه، استفاده می کند. این رهیافت ها اغلب با یکدیگر ترکیب می شوند (سیستم های توصیه گر هیبرید).

رهیافت شخصیت محور، تمایلات کاربر به کالا و خدمات را از شخصیت وی نتیجه می گیرد.

تفاوت های بین پالایش گروهی و پالایش محتوا محور را می توان با مقایسه ی دو سیستم توصیه گر موسیقی نشان داد؛ Last.fm و Pandora Radio.

Last.fm با بررسی نوازندگان و تراکهایی که کاربر قبلاً گوش کرده است و مقایسه ی آنها با آنچه که دیگر کاربران به آن گوش کرده اند، مجموعه ای از آهنگ های پیشنهادی را ارائه می دهد.

Last.fm تراکهایی را خواهد نواخت، که در کتابخانه ی کاربر (مجموعه ی اهنگ های کاربر) موجود نیستند ولی دیگر کاربران با علایق مشابه به آنها گوش داده اند. از آنجا که این رهیافت، رفتار کاربران را تحت تأثیر قرار می دهد، نمونه ای از تکنیک پالایش گروهی است.

Pandora از خصوصیات یک آهنگ یا هنرمند ( زیر مجموعه ای مشتمل بر 400 ویژگی که توسط “پروژه ژنوم موسیقی” تهیه شده است) برای ایجاد ایستگاهی از موسیقی ها با ویژگی های مشابه استفاده می کند.

واکنش کاربر جهت پالایش نتایج ایستگاه استفاده می گردد، زمانیکه کاربر یک آهنگ را نمی پسندد ویژگی های آن از تاکید Pandora  خارج و زمانیکه کاربر آهنگی را می پسندد، ویژگی های آن آهنگ مورد تأکید قرار می گیرند.  Pandora نمونه ای از رهیافت محتوا محور است.

هر نوع سیستمی نقاط ضعف و قوت خودش را دارد.  در مثال بالا Last.fm جهت ارائه پیشنهادات دقیق، نیازمند حجم بالایی از اطلاعات در مورد کاربر است. نکته ضعف ذکر شده نمونه ای از “مشکل استارت سرد” ( همانند مشکلی که هنگام استارت زدن به موتور سرد پیش می آید) است و در سیستم های پالایش گروهی امری عادیست.  در حالیکه Pandora به اطلاعات بسیار کمی برای آغاز کار خود نیاز دارد، ولی میدان عمل آن بسیار محدود است (بعنوان مثال؛ تنها قادر به ارائه پیشنهاداتیست که شبیه آهنگ اصلی باشند).

سیستم های توصیه گر جایگزین سودمندی برای الگوریتم های جست و جو هستند چرا که به کاربران کمک می کنند تا آیتم هایی را بیابند که ممکن بود خودشان نتوانند آنها را پیدا کنند. سیستم های توصیه گر با استفاده از موتورهای جست و جو، به طور جالبی داده های جدید را فهرست می کنند.

مونتانر نخستین نمایه کلی از سیستم های توصیه گر را از منظر یک عامل هوشمند ارائه داد. آدوماویسیوس (Adomavicius) نمایی جدید از سیستم های توصیه گر را ارائه کرد. هرلاکر (Herlocker) تکنیک های ارزیابی سیستم های توصیه گر را مورد بررسی قرار داد و بیل و همکارانش مشکلات ارزیابی های آفلاین را مورد بحث و بررسی قرار دادند. بیل و همکاران، پیشینه ای از تحقیقات در مورد سیستم های کنترل و چالش های موجود را ارائه دادند.

سیستم های توصیه گر موضوع تحقیقاتی فعال در زمینه های “کاوش اطلاعات” و “یادگیری ماشینی” هستند. RecSys، SIGIR و KDD از جمله کنفرانس هایی هستند که تحقیقات در زمینه سیستم های توصیه گر را مورد توجه قرار دادند.

سیستم های توصیه گر هیبرید

بررسی اخیر حاکی از آنست که رهیافت هیبرید (ترکیبی از پالایش گروهی و پالایش محتوا محور)  در برخی موارد می تواند بسیار مؤثر واقع گردد. رهیافت های هیبرید از چندین راه قابل اجرا هستند، با ایجاد جداگانه پیش بینی های محتوا محور و گروه محور و نهایتاً ترکیب آنها با هم، افزودن قابلیت های رهیافت محتوا محور به گروه محور (یا بالعکس)، یا یکی کردن رهیافت ها در یک مدل . چندین مطالعه ی تجربی، اجرای سیستم هیبرید را با نوع خالص سیستم های گروه محور و محتوا محور مورد مقایسه قرار داده است، و نشان داده شده که روش های هیبرید پیشنهادات دقیق تری را ارائه می دهند. همچنین، این روش ها می توانند برای غلبه بر مسائل روتین سیستم های توصیه گر مثل استارت سرد و پراکندگی مورد استفاده قرار گیرند.

نت فلیکس مثال خوبی از استفاده ی سیستم های توصیه گر هیبرید است. آنها با مقایسه ی عادات دیداری و جست و جویی کاربران مشابه (یعنی پالایش گروهی) و نیز  پیشنهاد فیلم هایی که دارای ویژگی های مشترک با مواردی  هستند که کاربر به انها امتیاز بالایی داده است، پیشنهادات را ارائه می دهند.

انواعی از تکنیک ها به عنوان پایه و اساس سیستم های توصیه گر، مطرح گردیده است: گروهی، محتوا محور، دانش محور و تکنیک های جمعیت شناختی. هر یک از این تکنیک ها کمبودهای شناخته شده ای دارند، مثل مشکل معروف استارت سرد برای سیستم های پالایش گروهی و محتوا محور (با کابران  جدید که به اقلام کمی امتیاز داده اند، چه کند!؟) و تنگنای مهندسی دانش در رهیافت دانش محور. سیستم توصیه گر هیبرید، سیستمی است که چند رهیافت را با هم ترکیب می کند تا به همیاری بین آنها دست یابد.

  • گروهی: سیستم، تنها با استفاده از اطلاعاتی که از طریق پیشینه ی امتیاز دهی کاربران بدست آمده است، پیشنهادات را ارائه می دهد. سیستم های گروهی، کاربران همتا با تاریخچه ی مشابه امتیازدهی با کاربر آنلاین را در مجاور هم قرار داده و با استفاده از این همسایگی اقدام به ارائه پیشنهادات می کند.
  • محتوا محور: سیستم، پیشنهادات را از دو منبع ارائه می دهد: مشخصات مرتبط با محصول و امتیازاتی که کاربر به آنها داده است. توصیه گرهای محتوا محور، با یک پیشنهاد همچون طبقه بندی یک مسئله ی خاص کاربر رفتار می کنند، و در می یابند که طبقه بندی کننده ی پسندها و ناپسندهای کاربر، بر پایه ی ویژگی های محصول است.
  • جمعیت شناختی (Demographic): یک سیستم توصیه گر جمعیت شناختی، پیشنهادات را بر اساس مشخصات جمعیت شناختی کاربر (مشخصاتی همچون؛ سن، جنسیت و ملیت کاربر) ارائه می دهد. محصولات پیشنهادی می توانند برای دیگر مجموعه های جمعیتی، با ترکیب امتیازاتی که کاربران درآن مجموعه ها به محصولات داده اند استفاده گردند.
  • دانش محور: سیستم دانش محور، مواردی را پیشنهاد می کند که از نیازها و تمایلات کاربر استنتاج کرده باشد. این دانش، گهگاه حاوی فهمی عملکردی و واضح از برآوردن نیازهای کاربر توسط ویژگی های معینی از محصول، خواهد بود.

در اینجا، واژه ی “سیستم توصیه گر هیبرید” برای توصیف هر سامانه ی پیشنهاد دهنده ای که جهت ارائه پیشنهاد چند تکنیک توصیه را با هم ترکیب کرده است، بکار می رود. دلیلی برای چرایی اینکه چند تکنیک متفاوت از یک نوع، نتوانند با یکدیگر هیبرید شوند، وجود ندارد. برای مثال دو سیستم توصیه گر محتوا محور متفاوت، می توانند باهم کار کنند که تعدادی از طرح ها این نوع از هیبرید را مورد بررسی قرار داده اند:

NewsDude، که از هر دو طبقه بندی کننده ی ساده Bayes و kNN در توصیه ی اخبارهای خود استفاده می کند، تنها یک مثال از این دست سیستم های هیبرید است.

سیستم های توصیه گر سیار

تحقیق در حوزه ی سیستم های توصیه گر سیار، یکی از حیطه های تحقیقاتی در حال رشد در زمینه ی سیستم های توصیه گر است. با افزایش دسترسی اسمارت فون ها به اینترنت و همه گیر شدن آن، ارائه پیشنهادات شخصی سازی شده و حساس به محیط ممکن شده است. از آنجاییکه اطلاعات سیار بسیار پیچیده تر از داده هایی است که سیستم های توصیه گر با آن درگیر بوده اند، تحقیقات در این حیطه به مراتب دشوارتر است (مسائلی که این حیطه با آن روبروست: ناهمسانی، پر سر و صدایی، نیاز به همبستگی خودکار مکانی و زمانی ، و نیز مشکلات تأیید و عمومیت دارد). علاوه بر این سیستم های توصیه گر سیار از مشکلات جابجایی نیز متضرر هستند، چرا که ممکن است پیشنهادات ارائه شده در تمامی مناطق بکار نیاید (برای مثال، پیشنهاد یک دستور غذایی که همه ی اجزایش را نمی توان در آن منطقه فراهم کرد، پیشنهادی نابخردانه است).

سیستمی که پیشنهاد کننده مسیرهای ایده آل برای رانندگان شهریست، یک نمونه از سیستم های توصیه گر سیار است. این سیستم داده های خود را از طریق ردیابی GPS راههایی که تاکسی پیموده است، بدست می آورد که این داده ها عبارتند از؛ مکان یابی (طول و عرض جغرافیایی)، نشان دادن زمان و وضعیت اجرایی (با مسافر یا بدون مسافر). سیستم از این داده ها برای بهینه سازی زمان صرف شده برای هر مسافر (یعنی با پیشنهاد ایده آل ترین راه، مدت زمانی که مسافر در تاکسی است به کمترین میزان خود برسد) و عاید کردن سود بیشتر برای راننده تاکسی، بهره می گیرد. این نوع سیستم، وابسته به مکان است، و از آنجاییکه در دستگاههای دستی یا جاساز شده استفاده می شود نیاز محاسباتی و انرژی آن بایستی در سطح پایینی نگه داشته شود.

نمونه ای دیگر از سیستم های توصیه گر سیار، سیستمی است که برای کاربران متخصص توسعه داده شده است (بونفوف و همکاران، 2012). این سیستم با ردیابی GPS کاربر و برنامه ی کاری او، بهترین اطلاعات و پیشنهادات را بسته به موقعیت و علایق وی، ارائه می دهد. این سیستم، از فنون یادگیری ماشینی و پردازش  استدلالها برای ایجاد یک سازگاری پویا بین سیستم توصیه گر سیار با سیر تحولی علایق کاربر ، بهره می برد. بانی این الگوریتم نام آن را  hybrid-ε-greedyگذاشته است.

سیستم های توصیه گر سیار همچنین”Web of Data” را به عنوان منبعی برای اطلاعات ساختاری، ایجاد کرده اند. یک مثال خوب از این سیستم ها ” “SMARTMUSEUM است. این سیستم حتی زمانیکه اطلاعات کمی از کاربر ارائه شده باشد با استفاده از مدل سازی معنایی، بازیابی اطلاعات و فنون یادگیری ماشینی اقدام به توصیه ی محتوای مطابق با علایق کاربر می کند.

سیستم های توصیه گر چند معیاره

سیستم های توصیه گر چند معیاره (MCRS) به عنوان سامانه هایی توصیف می شوند که سلایق را در چند معیار با هم متحد می سازند. به جای توسعه ی فنون پیشنهادی مبتنی بر ارزش های تک معیاره، تمامی سلایق کاربر در نظر گرفته می شود. این سیستم ها تلاش می کنند تا رتبه بندی آیتم های ناشناخته توسط کاربر را، پیش بینی کنند. این امر با بهره گیری از اطلاعات سلیقه ای و براساس معیارهای چند گانه که تمامی ارزش های سلیقه ای را تحت تأثیر قرار می دهد، ممکن شده است. چندین محقق MCRS را به عنوان یک مسئله ی تصمیم گیر چند معیاره (MCDM) در نظر گرفته و فنون و روش های MCDM را برای اجرای سیستم های MCRS بکار گرفته اند.