شکاف دقت جست‌وجوی وب با AI و پیامدهای تجاری؛ زنگ خطر تازه برای تصمیم‌گیری سازمانی

آخرین تاریخ ویرایش : ۲۸ آبان ۱۴۰۴
4 دقیقه
0 نظر

بیش از نیمی از کاربران امروز برای جست‌وجوی وب از ابزارهای هوش مصنوعی استفاده می‌کنند؛ اما بررسی جدید وب‌سایت Which? نشان می‌دهد که این اتکا در عمل می‌تواند سازمان‌ها را با خطاهای مالی، حقوقی و عملیاتی مواجه کند. در واقع، هرچند GenAI سرعت دسترسی به اطلاعات را بالا برده، اما فاصله‌ی قابل‌توجهی میان اعتماد کاربران و دقت واقعی خروجی‌ها وجود دارد.

این گزارش با اتکا به تجربه عملی و تحلیل تخصصی، توضیح می‌دهد که چرا تیم‌های مالی، حقوقی و مدیریتی باید نسبت به دقت داده‌هایی که با ابزارهای AI جست‌وجو می‌شود، رویکردی محتاط و مبتنی بر راستی‌آزمایی داشته باشند.

بحران دقت؛ وقتی اعتماد کاربران بیشتر از توان واقعی مدل‌هاست

تحقیقی که روی ۴۰ پرسش در حوزه‌های مالی، قانونی و حقوق مصرف‌کننده انجام شده، ۶ ابزار مطرح را بررسی کرده است: ChatGPT، Google Gemini (نسخه عادی و AI Overviews)، Microsoft Copilot، Meta AI و Perplexity.

نتایج نشان می‌دهد:

  • Perplexity با ۷۱٪ دقیق‌ترین ابزار بوده است.
  • Gemini AI Overviews با ۷۰٪ عملکرد قابل‌قبول داشته است.
  • ChatGPT با امتیاز ۶۴٪ عملکردی پایین‌تر از تصور عمومی ارائه کرده است.
  • Meta AI با ۵۵٪ در رتبه آخر قرار گرفته است.

این اختلاف نشان می‌دهد محبوبیت یک ابزار لزوماً با دقت واقعی آن همخوان نیست؛ موضوعی که برای مدیران سازمانی، مخصوصاً در حوزه‌های حساس مانند مالیات، قراردادها و انطباق قانونی، یک ریسک عملیاتی محسوب می‌شود.

وقتی AI اشتباه‌های پرهزینه می‌کند

🔹 ناتوانی در تشخیص خطاهای مهم مالی

در پرسشی درباره «چگونگی سرمایه‌گذاری در ISA با سقف ۲۵ هزار پوند» — عددی که عمداً اشتباه مطرح شده بود — ChatGPT و Copilot نتوانستند خطا را تشخیص دهند و توصیه‌هایی ارائه کردند که می‌تواند کاربر را در معرض تخطی از قوانین HMRC قرار دهد.

🔹 برداشت اشتباه از قوانین منطقه‌ای

نتایج نشان می‌دهد که ابزارهای AI غالباً تفاوت میان قوانین انگلستان، ولز و اسکاتلند را نادیده می‌گیرند.
این موضوع برای تیم‌های حقوقی که به جست‌وجوی سریع اتکا دارند، می‌تواند منجر به:

  • ریسک نقض قرارداد
  • اشتباه در تنظیم اسناد
  • ارجاع نادرست به مقررات

🔹 مشاوره‌های بیش‌ازحد مطمئن

برای مثال، Gemini در پاسخ به سؤال مربوط به اختلاف با یک بنا (Builder)، پیشنهاد داد پرداخت متوقف شود — توصیه‌ای که می‌تواند موقعیت قانونی کاربر را تضعیف کند.

مسئله شفافیت منبع؛ یکی از ضعف‌های بنیادی AI در جست‌وجو

یکی از محورهای مهم این تحقیق، نبود شفافیت در ارجاع به منابع است. ابزارها اغلب:

  • به لینک‌های قدیمی یا دارای دقت مشکوک اشاره می‌کنند
  • به جای ابزارهای رسمی (مثلاً HMRC)، کاربران را به سرویس‌های تجاری با کارمزد بالا هدایت می‌کنند
  • گاهی منابع «نامشخص» یا «ناموجود» ارائه می‌دهند

این مسئله برای سازمان‌ها یک تهدید مستقیم برای حاکمیت داده (Data Governance) و تصمیم‌گیری مبتنی بر اطلاعات قابل اتکا است.

واکنش شرکت‌ها: مسئولیت را به دوش کاربر می‌گذارند

  • مایکروسافت: «Copilot یک خلاصه‌ساز است، نه یک منبع معتبر.»
    و تصریح می‌کند که کاربران باید دقت اطلاعات را خودشان تأیید کنند.
  • OpenAI: «بهبود دقت یک تلاش صنعت‌محور است و GPT-5 دقیق‌ترین مدل ماست.»

این اظهارات نشان می‌دهد که شرکت‌های توسعه‌دهنده نیز فعلاً مسئولیت صحت اطلاعات را به‌صورت کامل برعهده نمی‌گیرند.

راهکاری برای سازمان‌ها: استفاده ممنوع نیست، ولی بدون نظارت خطرناک است

پژوهش تأکید می‌کند که ممنوعیت استفاده از ابزارهای AI در محیط کار نتیجه معکوس دارد و کارکنان را به استفاده پنهانی سوق می‌دهد.
راهکار صحیح، مدیریت و حاکمیت هوشمندانه است.

✔️ ۱. الزام به طرح پرسش دقیق

کارمندان باید در پرسش‌های خود منطقه، حوزه قانونی و شرایط دقیق را ذکر کنند.

✔️ ۲. تأیید منابع

هر خروجی باید همراه با منبع باشد؛ و منابع باید به‌صورت دستی بررسی شوند.

✔️ ۳. گرفتن «نظر دوم»

در موارد مالی و حقوقی، ابزار AI فقط یکی از ورودی‌ها است، نه تصمیم‌گیرنده.
مشورت با متخصص انسانی باید قدم نهایی باشد.

جمع‌بندی

جست‌وجوی وب با ابزارهای AI در حال تبدیل شدن به استاندارد جدید کاربران و کسب‌وکارهاست. اما تا زمانی که مدل‌ها در تشخیص خطا، درک مقررات و ارائه منابع شفاف ضعف دارند، هر پاسخ می‌تواند یک ریسک بالقوه باشد.

در نقطه تلاقی میان کارایی و خطای احتمالی، شرکت‌ها باید از طریق سیاست‌گذاری واضح، آموزش کارکنان و ایجاد جریان‌های کاری مبتنی بر راستی‌آزمایی انسانی، ریسک را کنترل کنند.

رضا حاتمی
رضا حاتمی متخصص هوش مصنوعی
رضا حاتمی هستم؛ علاقه‌مند و شیفتهٔ هوش مصنوعی، کسی که از مطالعه و پژوهش در این زمینه خسته نمی‌شود.
اشتراک گذاری
ثبت نظر
بنر نصب تمام صفحات