Алгоритм покращує справедливість результатів пошуку

Якщо ви шукаєте щось в Інтернеті, чи прокручуєте сторінку за сторінкою пропозицій — чи вибираєте з перших кількох варіантів?

Оскільки більшість людей вибирають із вершин цих списків, вони рідко бачать переважну більшість варіантів, створюючи потенціал для упередженості у всьому, починаючи від найму до впливу ЗМІ до електронної комерції.

У новій роботі дослідники Cornell представляють розроблений ними інструмент для поліпшення справедливості онлайн-рейтингу, не приносячи шкоди їхній корисності чи релевантності.

"Якщо ви могли б вивчити всі свої варіанти однаково, а потім вирішити, що вибрати, це може вважатись ідеальним. Але оскільки ми не можемо цього зробити, рейтинги стають вирішальним інтерфейсом для орієнтування на цей вибір", — сказав докторант з інформатики Ешудеп Сінгх, співавтор книги "Контроль справедливості та упередженості в динамічному навчанні до рейтингу", який отримав нагороду за найкращу папір на конференції Асоціації обчислювальної техніки SIGIR "Дослідження та розвиток в пошуку інформації", що відбулася практично 25-30 липня.

"Наприклад, багато YouTubers опублікують відео за тим самим рецептом, але деякі з них переглядаються набагато більше, ніж інші, хоча вони можуть бути дуже схожими", — сказав Сінгх. "І це відбувається через те, як нам представлені результати пошуку. Ми, як правило, знижуємо рейтинг лінійно, і наша увага швидко падає".

Метод дослідників, який називається FairCo, дає приблизно рівний вплив на однаково релевантний вибір і уникає пільгового ставлення до предметів, які вже є в списку. Це може виправити несправедливість, властиву існуючим алгоритмам, що може посилити нерівність та політичну поляризацію, а також зменшити особистий вибір.

"Що роблять системи ранжування, вони розподіляють експозицію. Тож як ми можемо забезпечити, щоб усі отримували свою справедливу частку експозиції?" сказав Торстен Йоахімс, професор інформатики та інформатики та старший автор статті. "Те, що є справедливістю, ймовірно, дуже відрізняється, скажімо, системою електронної комерції та системою, яка займає відновлення для відкриття робочих місць. Ми створили обчислювальні інструменти, які дозволяють вам визначити критерії справедливості, а також алгоритм, який буде доцільно застосовувати їх ».

Системи ранжування в Інтернеті спочатку базувались на бібліотекознавстві 1960-70-х років, що прагнуло полегшити користувачам пошук потрібних книг. Але такий підхід може бути несправедливим на двосторонніх ринках, на яких одне підприємство хоче щось знайти, а інше хоче знайти.

"Значна частина машинобудівної роботи з оптимізації рейтингу все ще дуже орієнтована на максимальну корисність для користувачів", — сказав Йоахімс. "Те, що ми робили за останні кілька років, придумує уявлення про те, як максимізувати корисність, залишаючись справедливими до предметів, які шукають".

Алгоритми, що надають пріоритет більш популярним позиціям, можуть бути несправедливими, оскільки чим більший вибір з'являється у списку, тим більше шансів, що користувачі повинні натиснути на нього та реагувати на нього. Це створює явище "багатіють багатшими", коли один вибір стає все більш популярним, а інші варіанти залишаються небаченими.

Алгоритми також шукають найбільш релевантні елементи для шукачів, але оскільки переважна більшість людей обирає один із перших кількох пунктів у списку, невеликі відмінності у релевантності можуть призвести до величезних розбіжностей у експозиції. Наприклад, якщо 51% читачів новинної публікації віддають перевагу оглядам думок, які перекошують консервативність, а 49% вважають за краще ліберальні нариси, то всі основні історії, висвітлені на головній сторінці, можуть вважати консервативними, згідно з документом.

"Коли невеликі відмінності у важливості призводять до того, що одна сторона посилюється, це часто викликає поляризацію, де деякі люди, як правило, домінують у розмові, а інші думки опускаються без справедливої ​​частки уваги", — сказав Йоахімс. "Ви можете використовувати його в системі електронної комерції, щоб переконатися, що якщо ви виробляєте продукт, який подобається 30% людей, ви отримуєте певну кількість експозиції на основі цього. Або якщо у вас є резюме базі даних, ви можете сформулювати гарантії, щоб переконатися, що це не дискримінує за расою або статтю "

Facebook Comments