يخفي الإنترنت ملايين المستخدمين وراء أسماء مستعارة، في وقت يبدو فيه أن عصر الخصوصية على الشبكة يقترب من الانتهاء.
أظهرت تجربة حديثة أن النماذج اللغوية الكبيرة (LLM) قادرة على تحديد هويات أصحاب الحسابات المجهولة على نطاق واسع، في وقت كان يُعتقد فيه أن عملية إزالة إخفاء الهوية مكلفة وتتطلب جهدا كبيرا.
وأفترض مؤلفو الدراسة، المنشورة على arXiv، أن النماذج اللغوية الكبيرة قوية بما يكفي لتنفيذ هذه المهمة، وقام فريق من المهندسين بتطوير نظام يحاكي عملية اتخاذ القرار لمستخدم بشري مجهول.
يعتمد النظام على تحليل منشورات المستخدم على منصات مثل Reddit وHacker News، ويدرس النصوص غير المنظمة، بما فيها التعليقات، والنكات، والإشارات التعليمية، وأسلوب الكتابة. ثم يقوم بتحويل هذه البيانات إلى تمثيل رياضي للملف الشخصي ويبحث عن تطابقات مع ملايين الملفات الشخصية الأخرى، بما في ذلك LinkedIn. وعند العثور على تطابق، يقيّم الذكاء الاصطناعي درجة الثقة في النتيجة، وفي حال كانت الثقة منخفضة، لا يقدم النظام أي نتيجة.
اختبر الباحثون النظام على نحو 1000 ملف شخصي على LinkedIn وقارنوها مع حسابات على Hacker News، ونجح النظام في ربط الحسابات بدقة بلغت 67% بمستوى ثقة 90%. وأشار الباحثون إلى أن الطرق التقليدية السابقة بدون الذكاء الاصطناعي أعطت نتائج ضعيفة، في حين تمكن النظام من الربط بين المستخدمين عبر مجتمعات Reddit المختلفة. كما أن العملية تُعد رخيصة الثمن، إذ تتراوح تكلفتها بين دولار واحد وأربعة دولارات لكل حساب نجحت عملية كشف هويته.
ويحذر الباحثون من أن الخفاء العملي الذي كان يحمي المستخدمين تحت أسماء مستعارة لم يعد فعالا، مؤكدين:”يجب على المستخدمين الذين يكتبون تحت أسماء مستعارة دائمة أن يأخذوا في الاعتبار أن المحتالين قادرون على ربط حساباتهم بهوياتهم الحقيقية أو ببعضها البعض، ويزداد هذا الاحتمال مع كل جزء من البيانات التي ينشرونها.”
وأوضح الباحثون أن نتائج الدراسة يمكن أن تكون مفيدة لأجهزة الأمن القانوني والسيبراني، ما يسلط الضوء على المخاطر المتزايدة المتعلقة بالخصوصية على الإنترنت.
المصدر – وكالات