آیا هوش مصنوعی Med-Gemini گوگل می تواند مرزهای جدیدی در پزشکی ایجاد کند؟!
هوش مصنوعی Med-Gemini گوگل، که به عنوان یک "متخصص پزشکی هوش مصنوعی" شناخته میشود، می تواند دنیای پزشکی را متحول کند. این مدل هوش مصنوعی که توسط گروه تحقیقاتی Google Research و آزمایشگاه هوش مصنوعی DeepMind گوگل توسعه یافته است، در انجام برخی وظایف پزشکی از جمله تشخیص بیماری و درک پروندههای پزشکی پیچیده، عملکردی حتی بهتر از پزشکان از خود به نمایش گذاشت. محققان گوگل ادعا میکنند Med-Gemini فقط مخصوص حرفه پزشکی طراحی و آموزش داده شده است. با وجود این که هنوز مراحل تحقیقات و توسعه آن به پایان نرسیده اما در تشخیص های بالینی خیلی بهتر از چت بات GPT-4 شرکت OpenAI عمل می کند.
بنابراین می توان این طور استنباط کرد که Med-Gemini گوگل دانش عمیقتری در حوزه پزشکی نسبت به سایر هوشهای مصنوعیِ ساختهشده مانند GPT-4 دارد. Med-Gemini میتواند اصطلاحات پزشکی پیچیده را درک کند، روابط بین علائم و بیماریها را تشخیص دهد و حتی در برخی موارد، از پزشکان انسانی در تشخیص دقیقتر بیماریها سبقت بگیرد. البته با توجه به این هنوز مراحل توسعه آن پایان نیافته باید منتظر آزمایش های بیشتر برای ارزیابی توانایی ها ی آن بود. چرا هوش مصنوعی پزشکی گوگل عملکرد بهتری نسبت به GPT-4 دارد؟ این موضوع به چند علت خیلی عجیب است:
دلیل اول: تخصص در برابر عمومیت
هر مدلی که روی یک سری داده های خاص یا محدودی مانند پزشکی، آموزش دیده باشد به احتمال زیاد درک و ظرافت بیشتری نسبت به یک مدل زبان بزرگ عمومی مانند 4GPT- خواهد داشت که با دادههای مختلف آموزش دیده است. Med-Gemini روی یک مجموعه داده ای بزرگ پزشکی به نام «مرکز اطلاعات پزشکی مراقبتهای ویژه» (یا MMIC-III) آموزش دیده است. این پایگاه داده اطلاعات سلامتی بیماران بستری در بخش مراقبتهای ویژه را شامل میشود.
چت بات GPT-4 روی بستر اینترنت یا بخش قابل توجهی از آن آموزش دیده است. بنابراین، از این مدل می توان به عنوان یک ابزار عمومی استفاده کرد. به عنوان نمونه: اگر به اطلاعاتی در مورد نقاشی های ون گوگ نیاز داشته باشید، GPT-4 میتواند به شما کمک کند. اما Med-Gemini قادر به انجام این کار نیست. تمرکز دقیق Med-Gemini باعث میشود به کاربردی بودن اطلاعات آن اطمینان بیشتری داشته باشید.
دلیل دوم: بهروزرسانی
آخرین اطلاعات 4GPT- فقط حداکثر تا سپتامبر 2021 را شامل می شود. این در حالی است که اطلاعات Med-Gemini تا ماه مه 2024 را در بر می گیرد. بنابراین، مدل گوگل نه تنها از نظر تکنیکهای پزشکی، بلکه از نظر نوع دادههایی که میتواند پردازش کند و چگونگی پردازش آنها، نسبت به مدل OpenAI بهروزتر خواهد بود.
از زمان معرفی اولیه Gemini ، تمام مدلهای آن قادر به پردازش متن، تصاویر، صدا و ویدیو بودهاند. این قابلیت، آنها را از همان ابتدا چند قدم جلوتر از GPT-4 قرار داده است.
از طرف دیگر آموزش GPT-4 مدتها پیش از سال ۲۰۲۳ متوقف شده است. سالی که در آن هوش مصنوعی تولیدکننده (Generative AI) به شدت مورد توجه قرار گرفت و در زمینههای مختلفی از خدمات مشتری گرفته تا تشخیص تومور در اسکنهای سرطانی به کار گرفته شد. بنابراین، ادعاهای محققان گوگل تا حدی با عالم واقعیت انطباق دارد.
Med-Gemini یک مدل زبانی پیشرفته است که توانایی پردازش متن را با در نظر گرفتن بافت گسترده (Long-context processing) دارد. به عبارت دیگر، Med-Gemini میتواند معانی کلمات و جملات را در یک متن با در نظر گرفتن جملات و پاراگرافهای اطراف آنها درک کند. این قابلیت به Med-Gemini اجازه میدهد تا وظایف مختلفی را با دقت و ظرافت بیشتری انجام دهد. محققان بر این باورند که این قابلیت «مرزهای جدیدی در عملکرد و امکانات کاربردی جدید که پیش از این غیرقابل تصور بود برای سیستمهای هوش مصنوعی پزشکی ایجاد میکند.»
البته Med-Gemini زمانی که در دسترس پزشکان قرار نگیرد، نمیتوان در مورد عملکرد واقعی آن اظهار نظر کرد. اما اگر قابلیتهای پردازش بافت گسترده آن به همان اندازه که ادعا میشود چشمگیر باشد، Med-Gemini میتواند انقلابی در تشخیص و درمان بیماریها ایجاد کند.