كيف يحصل “شات جي بي تي” على إجابات أسئلتك؟

كشفت تقارير صحفية حديثة أن شركة (أوبن إيه آي OpenAI) تعتمد على بيانات غوغل للبحث للإجابة عن بعض أسئلة مستخدميها، خاصة تلك المتعلقة بالأخبار والرياضة والأسواق المالية.
ووفقا لتقرير موقع “ذا إنفورميشن” التقني، فقد أشارت مصادر إلى أن (OpenAI) تحصل على هذه البيانات عبر شركة (SerpApi) المتخصصة في تقنيات استخراج البيانات (Web-Scraping)، التي توفر لمحركات الذكاء الاصطناعي إمكانية الوصول إلى نتائج البحث لبناء مجموعات بيانات واسعة تستخدم في تدريب النماذج.
وأشار التقرير إلى أن أدوات (OpenAI) غالبًا ما تواجه صعوبة في تقديم إجابات دقيقة عند التعامل مع الموضوعات الآنية، وهو ما يفسر لجوئها إلى بيانات غوغل.
وفي تجربة أجراها المهندس السابق في غوغل، أبيشيك أيير، تبين أن (شات جي بي تي ChatGPT) يستخدم فهرس غوغل، إذ ابتكر كلمة وهمية ووضعها في صفحة مخفية وأدرجها ضمن فهرس البحث، لتظهر لاحقًا في إجابات (ChatGPT)بالنص نفسه.
وكانت OpenAI قد أكدت سابقا أن قدرات البحث لديها تعتمد على “زاحف ويب” داخلي، إضافةً إلى بيانات من ناشرين لديها معهم اتفاقيات ترخيص، مشددة على أن غوغل ليست من هذه الشركات.
وتأتي هذه التطورات في وقت تُعد فيه غوغل منافسا مباشرا لـ (ChatGPT) إذ أدى اعتماد المستخدمين المتزايد على إجابات الذكاء الاصطناعي إلى تراجع استخدام محركات البحث التقليدية، وانخفاض حركة الزوار للمواقع التي تظهر في نتائج البحث.