Нова стратегія для швидкого визначення твіттер-тролів

Два алгоритми, які пояснюють відмінне використання повторених слів і пар слів, вимагають всього 50 твітів, щоб точно відрізнити оманливі повідомлення "тролів" від тих, які публікують громадські діячі. Сергій Монахов з університету імені Фрідріха Шиллера в м. Єна, Німеччина, представляє ці висновки у журналі відкритого доступу ПЛОС ОДИН 12 серпня 2020 року.

Повідомлення Troll в Інтернеті мають на меті досягти конкретної мети, одночасно маскуючи цю мету. Наприклад, у 2018 році 13 громадян Росії звинувачувались у використанні неправдивих персон для втручання у президентські вибори у 2016 році через повідомлення в соціальних мережах. У той час як попередні дослідження досліджували відмінні характеристики тролевих твітів — таких як терміни, хештеги та географічне розташування — в кількох дослідженнях було вивчено мовні особливості самих твітів.

Монахов застосував соціолінгвістичний підхід, акцентуючи увагу на ідеї, що тролі мають обмежену кількість повідомлень, але вони повинні робити це багаторазово та з достатньою різноманітністю формулювань та тем, щоб обдурити читачів. Використовуючи бібліотеку російських твітів із тролів та справжніх твітів від американських конгрессменів, Монахов показав, що ці обмеження, характерні для троля, призводять до виразних зразків повторних слів і пар слів, які відрізняються від зразків, що спостерігаються в справжніх, не троль-твітах.

Тоді Монахов перевірив алгоритм, який використовує ці характерні шаблони для розрізнення справжніх твітів і твіттів. Він виявив, що алгоритм вимагає всього 50 твітів для точної ідентифікації тролів проти людей конгресу. Він також виявив, що алгоритм правильно відрізняє твіти тролів від твітів Дональда Трампа, які, хоча провокаційні та "потенційно оманливі", згідно з Twitter, але не створені, щоб приховати його мету.

Ця нова стратегія швидкого визначення твітів тролів могла б допомогти інформувати зусилля для боротьби з гібридною війною, зберігаючи свободу слова. Потрібні подальші дослідження, щоб визначити, чи може він точно відрізнити твіти від тролів від інших типів повідомлень, які не публікуються громадськими діячами.

Монахов додає: "Хоча написання тролів зазвичай вважається пронизаним повторюваними повідомленнями, його найхарактернішою рисою є аномальнийрозподіл повторюваних слів і пар слів. Використовуючи співвідношення їх пропорцій як кількісну міру, для виявлення потрібно всього лише 50 твітів. Інтернет-рахунки тролів ".

Facebook Comments