پروژه GFT چرا گوگل در پیش بینی اپیدمی و بیماری همه گیر شکست خورد؟


اهداف و انتظارات آموزشی از متمم در این دوره

کد دوره: 266621

ما همیشه به دیدن موفقیت شرکت های بزرگ و موفق عادت کرده ایم. آمازون، اپل، گوگل و مایکروسافت برخی از بزرگترین شرکت های فناوری جهان هستند که اغلب به عنوان نمونه های موفقیت ذکر می شوند.

اما شرکت ها معمولا محدود به یک پروژه یا یک محصول نیستند. اکثر آنها چندین پروژه را اجرا کرده اند و برخی از آنها شکست خورده است.

اپل در تولید دستیارهای دیجیتال کوچک (PDA) موفق نبود و محصولش که نیوتن نام داشت، چنان شکست خورد که امروزه کمتر کسی نام آن را شنیده است.

آمازون همچنین نتوانست گوشی های فایرفاکس را راه اندازی کند. مایکروسافت همچنین در چندین پروژه از جمله Windows Me و Windows برای تلفن های همراه شکست خورد.

مطالعه محصولات شکست خورده کمتر از مطالعه محصولات موفق مفید نخواهد بود. در اینجا می خواهیم داستان یکی از محصولات شکست خورده گوگل را بیان کنیم. شما می توانید این درس را مستقل از سایر دروس تکمیلی بخوانید. اما اگر یکی از درس‌های زیر را خوانده باشید احتمالاً این داستان برایتان جالب‌تر خواهد بود:

پیش بینی اپیدمی

این را به مارک تواین (و بسیاری از نویسندگان دیگر) نسبت می دهند: «پیش بینی دشوار است؛ «به خصوص اگر درباره آینده باشد».

اگرچه این جمله کمی طنز به نظر می رسد، اما واقعاً نوعی پیش بینی وجود دارد که به آینده مربوط نمی شود. چه چیزی است پخش کنونی به آن می گویند و شاید به فارسی بتوان آن را نام برد هبینی ترجمه شده.

فرض کنید فردا قرار است انتخابات برگزار شود و شما به دنبال راهی هستید که بدانید فردا مردم به چه کسانی رای می دهند. اکثر رای دهندگان در ساعات یا روزهای آخر برگه رای خود را تغییر نمی دهند. بنابراین اگر همین الان بتوانید رأی مردم را بگویید، تقریباً به طور قطع نتیجه انتخابات را تشخیص خواهید داد.

اما به دلیل پراکندگی و تنوع افراد، راه دقیقی برای دانستن نظرات آنها وجود ندارد. بنابراین باید سعی کنید «پیش‌بینی کنید که در حال حاضر چه اتفاقی افتاده است» (+).

اتفاقی که در دوران کرونا افتاد و شهرهای کشور به رنگ های مختلف (قرمز، زرد و 5) تقسیم شدند، نمونه دیگری از پخش نوکستینگ است. ما در مورد آنچه در حال حاضر یا در آینده نزدیک اتفاق افتاده صحبت می کنیم، اما باید به محاسبات و برآوردها تکیه کنیم. زیرا آمار بیماری همه افراد در دسترس نیست و نمی توان به آن دست یافت.

گوگل به دنبال تشخیص امواج آنفولانزا است

در سال 2008 بود که گوگل اعلام کرد که می تواند به جستجوهای اینترنتی افراد برای تعیین اینکه کجا شیوع آنفولانزا بیشتر شده است و کجا شیوع پیدا کرده است، نگاهی بیاندازد. گوگل این محصول جدید را Google Flu Trends نامید که معمولاً GFT نامیده می شود.

قرار بود سرویس گوگل جدای از اینکه یک محصول مستقل است، نشانه ای از اهمیت و کاربرد کلان داده در حوزه های مختلف به ویژه در حوزه سلامت باشد.

در نتیجه، گوگل برخلاف رویه معمول خود، مقاله ای را در مجله Nature منتشر کرد. این مقاله توسط جرمی گینزبرگ و متیو محبی و چند تن دیگر ویرایش شده است (فایل PDF مقاله).

آن مقاله توضیح داد که سالانه حدود 500000 نفر در سراسر جهان بر اثر آنفولانزا جان خود را از دست می دهند. علاوه بر این، جهش های مختلف ویروس آنفولانزا باعث ظهور انواع یا گونه های جدید ویروس آنفولانزا می شود.

این سویه‌های جدید به طور بالقوه می‌توانند منبع همه‌گیری‌های بزرگ باشند.

بنابراین، اگر رفتارهای انسانی در زمینه پیگیری سلامت فردی در نقاط مختلف جهان به طور مداوم رصد شود، می توان شیوع گسترده آنفولانزا را زودتر تشخیص داد و اقدامات لازم را برای کنترل بیماری انجام داد.

کارشناسان گوگل در آن مقاله توضیح دادند که یکی از راه‌های مطالعه رفتار انسان این است که به جستجوی آنفولانزا نگاه کنیم.

به طور خلاصه، اگر مردم منطقه ای از کشور بیش از هر زمان دیگری عباراتی مانند آبریزش بینی، قیمت دماسنج پزشکی، قرص سرماخوردگی و مواردی از این قبیل را جستجو کنند، می توان حدس زد که میزان آنفولانزا در منطقه رشد کرده است.

انتخاب سوالات مربوط به آنفولانزا

طبیعتاً وقتی گوگل وارد یک بازی تحلیلی می شود و ادعا می کند که می خواهد یک پروژه تحقیقاتی را با حجم زیادی از داده هایی که در اختیار دارد انجام دهد، انتظار ندارید چند نفر دور هم بنشینند و عبارات مربوط به آنفولانزا را «حدس بزنند».

گوگل هم همین کار را نکرد. همانطور که گینزبرگ و همکاران. در مقاله خود عنوان می کنند “گوگل به میلیاردها جستجوی انسانی دسترسی دارد” و منطقی است که از روش های علمی و آماری برای پاسخ به سوالات و عبارات مرتبط با آنفولانزا استفاده کنید.

می دانیم که CDC ایالات متحده به طور مرتب آماری را در مورد شیوع بیماری های مختلف از جمله آنفولانزا منتشر می کند. گوگل این داده ها را در کنار داده های جستجوی کاربران قرار داده است و از روشی تحلیلی و آماری استفاده کرده است تا تشخیص دهد کدام عبارات بیشترین جستجو را در زمان شیوع آنفولانزا دارند. هنگامی که این عبارات در هر نقطه از زمان شناسایی شدند، می توان شیوع آنفولانزا را با توجه به نوسانات جستجوی آنها تخمین زد.

پس از بررسی دقیق داده‌های سال‌های 2003 تا 2008، گوگل توانست 50 میلیون جستجوی جستجو را به 45 کاهش دهد و با اطمینان گفت:

همانطور که در نمودار بالا مشاهده می کنید – در مقاله گینزبرگ و محبی – محققان گوگل به این نتیجه رسیدند که نظارت و کنترل 45 کلمه کلیدی حتی بهتر از 80 یا 90 کلمه کلیدی است. به عبارت دیگر، ضریب همبستگی بین “جستجوی عبارت” و “شیوع بیماری” زمانی به اوج خود می رسد که تنها 45 جستجوی عبارت به طور دائمی نظارت شود.

گوگل در سال 2008 به طور رسمی آنفولانزا را در مناطق مختلف ایالات متحده در Google Flu Trends گزارش کرد و این سرویس در آن سال ها به نمادی از قدرت داده های بزرگ تبدیل شد.

GFT چیزی بیش از یک محصول بود. بسیاری از تحلیلگران GFT را آغاز عصر جدیدی می دانستند. دورانی که قرار بود کلان داده در خدمت سلامت و رفاه عمومی باشد.

فقط به داده های بزرگ Sch Datanberger نگاه کنید تا ببینید پروژه گوگل چقدر خوش بینانه بوده است (+).

نتیجه GFT چه بود؟

شما هنوز در این بحث شرکت نکرده اید.

ترتیبی که مکمل پیشنهاد می کند مطالب مجموعه داستان کسب و کار را بخوانید:

چند پیشنهاد از مکمل:

مجموعه محتوای داستان کسب و کار