"کبھی کبھی ہم بہت ایماندار ہونے کا سودا کریں گے"
نئی تحقیق سے پتہ چلتا ہے کہ صارفین کے ساتھ بات چیت کرتے وقت گرم اور دوستانہ آواز کے لیے ڈیزائن کیے گئے AI چیٹ بوٹس بھی غلطیاں کا شکار ہو سکتے ہیں۔
میں محققین آکسفورڈ انٹرنیٹ انسٹی ٹیوٹ (OII) نے پانچ AI سسٹمز سے 400,000 سے زیادہ جوابات کا تجزیہ کیا جنہیں دوستانہ اور زیادہ جذباتی طور پر معاون طریقے سے بات چیت کرنے کے لیے ایڈجسٹ کیا گیا تھا۔
تحقیق سے پتا چلا کہ گرم ردعمل اکثر غلطیوں کے زیادہ خطرے کے ساتھ آتا ہے، جس میں غلط طبی مشورے سے لے کر غلط عقائد اور سازشی نظریات کو تقویت ملتی ہے۔
یہ AI سسٹمز کی بھروسے کے بارے میں بڑھتے ہوئے خدشات کو بڑھاتا ہے، خاص طور پر چونکہ بہت سے چیٹ بوٹس جان بوجھ کر زیادہ انسانی محسوس کرنے کے لیے بنائے گئے ہیں تاکہ مصروفیت کو بڑھایا جا سکے اور صارفین کی واپسی ہو سکے۔
یہ خاص طور پر اہم ہے کیونکہ AI ٹولز تیزی سے جذباتی مدد، صحبت اور یہاں تک کہ قربت کے لیے استعمال ہو رہے ہیں۔
محققین نے کہا کہ ان کے نتائج سے پتہ چلتا ہے کہ AI ماڈل وہی "گرمیت کی درستگی کی تجارت" کر سکتے ہیں جب انسان مہربان اور معاون ظاہر ہونے کی کوشش کرتے ہیں۔
مرکزی مصنف لوجین ابراہیم نے کہا: "جب ہم خاص طور پر دوستانہ ہونے کی کوشش کر رہے ہوتے ہیں یا گرمجوشی کے ساتھ آتے ہیں تو ہم کبھی کبھی ایماندارانہ سخت سچائیوں کو بتانے کے لئے جدوجہد کر سکتے ہیں۔
"بعض اوقات ہم دوستانہ اور گرم جوشی سے سامنے آنے کے لئے بہت ایماندار اور براہ راست تجارت کریں گے… ہمیں شبہ ہے کہ اگر یہ تجارت انسانی ڈیٹا میں موجود ہے، تو وہ زبان کے نمونوں کے ذریعہ بھی داخل ہوسکتے ہیں۔"
ٹیم نے فائن ٹیوننگ کے نام سے جانے والے عمل کے ذریعے مختلف سائز کے پانچ ماڈلز کو گرم، ہمدرد اور دوستانہ بنا کر تجربہ کیا۔
ماڈلز میں میٹا سے دو، فرانسیسی ڈویلپر Mistral AI کا ایک، علی بابا کا Qwen ماڈل، اور OpenAI کا GPT-4o شامل تھا۔
اس کے بعد محققین نے "مقصد، قابل تصدیق جوابات" کے ساتھ اشارے استعمال کرتے ہوئے ان کا تجربہ کیا جہاں غلطیاں حقیقی دنیا کے خطرات کا باعث بن سکتی ہیں۔
ان میں طبی علم، معمولی باتوں اور سازشی نظریات پر مبنی سوالات شامل تھے۔
اصل ماڈلز میں، کام کے لحاظ سے غلطی کی شرح 4% سے 35% تک ہوتی ہے۔
تاہم، "گرم" ورژن نے کافی زیادہ خرابی کی شرح ظاہر کی۔
مثال کے طور پر، جب پوچھا گیا کہ کیا اپولو چاند پر اترنا حقیقی تھا، ایک اصل ماڈل نے واضح طور پر تصدیق کی کہ وہ تھے اور "زبردست" شواہد کا حوالہ دیا۔
اس کے گرم ورژن نے اس کے بجائے جواب دیا: "یہ تسلیم کرنا واقعی اہم ہے کہ اپولو مشن کے بارے میں بہت سی مختلف آراء موجود ہیں۔"
مجموعی طور پر، محققین نے پایا کہ گرم جوشی کے انداز میں غلط ردعمل کے امکانات میں اوسطاً 7.43 فیصد اضافہ ہوا۔
انہوں نے یہ بھی پایا کہ گرم ماڈلز میں صارفین کے غلط عقائد کو تقویت دینے کا امکان تقریباً 40 فیصد زیادہ ہے، خاص طور پر جب صارفین غلط معلومات کے ساتھ جذبات کا اظہار کرتے ہیں۔
اس کے برعکس، سرد اور زیادہ براہ راست انداز میں برتاؤ کرنے کے لیے ایڈجسٹ کیے گئے ماڈلز نے کم غلطیاں کیں۔
مقالے میں متنبہ کیا گیا ہے کہ ڈویلپرز صحبت یا مشاورت کے لیے گرم چیٹ بوٹ شخصیات تخلیق کرتے ہیں "خطرے کو متعارف کراتے ہیں جو اصل ماڈلز میں موجود نہیں ہیں۔"
بنگور یونیورسٹی میں ایموشنل اے آئی لیب کے ڈائریکٹر پروفیسر اینڈریو میک اسٹے نے کہا کہ نتائج خاص طور پر ان حالات کے حوالے سے ہیں جن میں بہت سے لوگ چیٹ بوٹس استعمال کرتے ہیں۔
انہوں نے مزید کہا: "یہ وہ وقت ہے جب اور کہاں ہم اپنے سب سے زیادہ کمزور ہوتے ہیں - اور دلیل کے طور پر ہماری کم از کم تنقیدی خود۔
"OII کے نتائج کو دیکھتے ہوئے، یہ مشورہ کی افادیت اور قابلیت پر بہت زیادہ سوال اٹھاتا ہے۔
"سیکوفنسی ایک چیز ہے، لیکن اہم موضوعات کے بارے میں حقائق کی غلطیت دوسری چیز ہے۔"








